童家旺:如何用分表存储来提高性能
创始人
2024-07-26 03:00:31
0

来自支付宝资深数据库架构师童家旺给大家分享的关于数据存储性能优化的一点想法,他从自己的个人经验中总结了关于数据库存储的性能优化。

 

▲支付宝资深数据库架构师童家旺

首先,童家旺介绍了他认为的什么是优化:

***、做任何事情最快的方法就是什么也不做。

第二、不访问不必要的数据:使用B*Tree/hash等方法定位必要的数据。使用column Store或分表的方式将数据分开存储。使用Bloom filter算法排除空值查询。

第三、合理的利用硬件来提升访问效率:使用缓存消除对数据的重复访问。使用批量处理来减少磁盘的Seek操作。使用批量处理来减少网络的Round Trip。使用SSD来提升磁盘访问效率。

响应时间和吞吐量之间的关系

1、性能。衡量完成特定任务的速度或效率。

2、响应时间。衡量系统与用户交互式多久能够发出响应。

3、吞吐量。衡量系统在单位时间里可以完成的任务量。

 

▲反应时间

 

▲传统磁盘的访问特性

B*Tree优化数据访问介绍

 

▲B*Tree优化数据访问

B*Tree优化数据访问模拟场景

 

▲B*Tree优化数据访问模拟场景

#p#

童家旺通过阿里巴巴的真实应用场景介绍了如何用分表存储来提高性能。

一、场景介绍:

  1. 表VeryBigTable含有30个列
  2. 表的记录数为50,000,000条
  3. 平均每个用户为300条左右
  4. 其中有2个列属于详细描述字段,平均长度为2k
  5. 其它的列的总长度平均为250个字节
  6. 此表上的查询有两种模式
  7. 列出表中的主要信息(每次20条,不包含详细信息,90%的查询)
  8. 查看记录的详细信息(10%的查询)
  9. 保存与Oracle数据库,默认block_size(8k)

二、要求:

  1. 对此业务进行优化
  2. 分析数据,说服开发部门实施此优化

三、性能分析

1、每块记录数

8192 * 0.80(1) / 250 = 25.5 (主表)

8192 * 0.80 / 2000 = 3.27(详情表)

8192 * 0.80 / ( 2000 + 250 ) = 2.91

2、访问的逻辑IO(内存块访问)

List的查询代价

改进后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7

改进前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5

3、访问涉及到的物理读(磁盘块访问)

List的查询代价(逻辑IO * ( 1 – 命中率 ))

改进后=28.7 * ( 1 – 0.85(5)) = 4.305

改进前=165.5 * ( 1 – 0.85 ) = 24.825

4、访问时间(ms)

改进前=逻辑IO时间+物理IO时间= 28.7 * 0.01(6) + 4.305 * 7(7) = 30.422ms

改进后=逻辑IO时间+物理IO时间= 165.5 * 0.01 + 24.825 * 7 = 175.43ms

场景

  1. Read Intensive (R/W 20倍以上)
  2. 业务可接受部分延迟(Delay)
  3. 每天访问量上亿次
  4. 系统IO压力巨大(本地内存无法容纳活跃数据)

要求

  1. 优化业务

方案

  1. 使用缓存来减少应用对后端的访问

注意事项

  1. 考虑缓存的刷新策略
  2. 考虑缓存的数据延迟对业务的影响
  3. 考虑缓存失效时,系统的支撑能力

参考缓存工具

MemCached, Tair, Redis

【编辑推荐】

  1. 主数据管理(MDM)的七个***实践
  2. SQL server的高可用性 SQL Mirror HA
  3. 浅谈一次恼火的死锁追踪经历
  4. DataReader链接关闭解惑篇

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...