文章图片
文章图片
有一个问题是这样的统计数据总数用count(*)、count(主键ID)、count(字段)、count(1)那个效率高 。
【飞利浦·斯塔克|MySQL统计总数就用count,别花里胡哨的《死磕MySQL系列 十》】先说结论 , 不用那么花里胡哨遇到统计总数全部使用count(*).
但是有很多小伙伴就会问为什么呢?本期文章就解决大家的为什么 。
系列文章五分钟 , 让你明白MySQL是怎么选择索引《死磕MySQL系列 六》
字符串可以这样加索引 , 你知吗?《死磕MySQL系列 七》
无法复现的“慢”SQL《死磕MySQL系列 八》
什么?还在用delete删除数据《死磕MySQL系列 九》
一、不同存储引擎的做法你需要知道的是在不同的存储引擎下 , MySQL对于使用count(*)返回结果的流程是不一样的 。
在Myisam中 , 每张表的总行数都会存储在磁盘上 , 因此执行count(*)时 , 是直接从磁盘拿到这个值返回 , 效率是非常高的 。 但你也要知道如果加了条件的统计总数返回也不会那么快的 。
在Innodb引擎中 , 执行count(*) , 需要把数据一行一行的读出来 , 然后再统计总数返回 。
问题:为什么Innodb不跟Myisam一样把表总数存起来呢?
这个问题就需要追溯的我们之前的MVCC文章 , 就是因为要实现多版本并发控制 , 才会导致Innodb不能直接存储表总数 。
因为每个事务获取到的一致性视图都是不一样的 , 所以返回的数据总数也是不一致的 。
如果你无法理解 , 再回到MVCC文章好好看看 , 意思就跟不同事务看到的数据不一致一回事 。
实战案例
假设这三个用户是并行的 , 你会看到三个用户看到最终的数据总数都不一致 。
每个用户会根据read view存储的数据来判断那些数据是自己可以看见的 , 那些是看不见的 。
read view
当执行SQL语句查询时会产生一致性视图 , 也就是read-view , 它是由查询的那一时间所有未提交事务ID组成的数组 , 和已经创建的最大事务ID组成的 。
在这个数组中最小的事务ID被称之为min_id , 最大事务ID被称之为max_id , 查询的数据结果要根据read-view做对比从而得到快照结果 。
于是就产生了以下的对比规则 , 这个规则就是使用当前的记录的trx_id跟read-view进行对比 , 对比规则如下 。
如果落在trx_id<min_id , 表示此版本是已经提交的事务生成的 , 由于事务已经提交所以数据是可见的
如果落在trx_id>max_id , 表示此版本是由将来启动的事务生成的 , 是肯定不可见的
若在min_id<=trx_id<=max_id时
- 如果row的trx_id在数组中 , 表示此版本是由还没提交的事务生成的 , 不可见 , 但是当前自己的事务是可见的
- 如果row的trx_id不在数组中 , 表明是提交的事务生成了该版本 , 可见
现在你应该知道了 , 主键索引的叶子节点存储的是整行数据 , 而普通索引叶子节点存储的是主键值 。
得出结论就是普通索引的比主键索引会小很多 。
所以 , MySQL对于count(*)这样的操作 , 不管遍历那个索引树得到的结果在逻辑上都一样 。
因此 , 优化器会找到最小的那棵树来遍历 , 在保证正确的逻辑前提下 , 尽量减少扫描数据量 , 是数据库系统设计的通用法则之一 。
问题:为什么存储的有数据怎么不用?
这个图的数据怎么得到的 , 我想你应该知道了 , 没错 , 就是执行
show table status \\G;
得来的 。那为什么innodb存储引擎不直接使用Rows这个值呢?
还记不记得在第六期文章中 , 五分钟 , 让你明白MySQL是怎么选择索引《死磕MySQL系列 六》
先不要返回去看这篇文章 , 看下上文图中最后查到的数据总条数是多少 。
你会发现这两个统计的数据是不一致的 , 因此这个值肯定是不可以用的 。
具体原因
因为Rows这个值跟索引基数
Cardinality
一样 , 都是通过采样统计的 。采样规则
首先 , 会选出N个数据页 , 然后统计每个数据页上不同的值 , 最后得到一个平均值 。 再用这个平均值乘索引的数据页总数得到的就是索引基数 。
- 飞利浦|飞利浦今年第2款智能手机上市,名为PH2线上首发价仅759元,面向百元级市场
- MySQL|终于跑路了!三星关停越南工厂,欲将产能转移至他国
- 飞利浦·斯塔克|中国广电将从五个方面推动网络建设:第四家运营商服务越来越近!
- MySQL|vivo X80、NEX5、S12曝光 搭载天玑和骁龙旗舰芯
- 数据库|原来这才是Python连接mysql数据库的正确姿势!(一)
- 飞利浦|飞利浦B8905体验测评:8个发声单元+7.1.2声道杜比全景声的沉浸
- 删除|什么?还在用delete删除数据《死磕MySQL系列 九》
- MySQL|红米K50新机全面曝光,骁龙898+百瓦快充+柔性直屏,米粉期待已久
- 飞利浦|?飞利浦空调三大挑战:品牌授权、格力态度和存量市场
- OLED|飞利浦65PUF7294大型OLED电视评测:绝美影音感动、智慧旗舰首选