Mysql b+树索引的数据结构

开发者 2024-9-19 03:37:17 104 0 来自 中国
简介

为什么Mysql考虑使用B+树,而不是B树,其实我们可以先了解下B树和B+树的特点来看下。
B树特点

※ 树的每个结点都会存储数据
※ 单次查询不一定要遍历到树的根部,平均查询时间会比较快
1.png B+树特点

※ 非叶子节点不存储数据,只存储(冗余)索引,索引包含主键和指针
※ 叶子节点才真正存储数据
※ 每个叶子节点互相链表相连,保证了范围查询的时效性(页之间用双向链表连接,数据间用单项链表链接)
2.png
※ B+树只有叶子节点才存储数据,叶子节点包含双向指针指向,所以对于范围查询B+树明显优于B树。
※ IO对性能的影响,B树的每个节点都存储数据,而B+树只有叶子节点才存储数据,每个叶子所以查找相同数据量的情况下,B树的高度更高,IO更频繁,效率自然就降低了。
InnoDB存储单位

InnoDB最小存储单位是页,叶子节点和非叶子节点最小单位都是页,页大小Mysql 默认设定16384字节,约为16KB。
// 可查看innodb_page_size 大小show GLOBAL VARIABLES like "innodb_page_size";InnoDB引擎-文件系统-磁盘扇区关系

5.png
1)磁盘扇区:磁盘的最小存储单元,默认512字节。
2)文件系统最小单位块(机械硬盘一个扇区512字节,SSD固态硬盘使用4K对齐按照4K扇区规则写入数据)。4k = 8个扇区。尽管一个文件只有1个字节,仍然占用4k空间
3)innodb的所有数据文件(后缀为ibd的文件),他的大小始终都是16384(16k)的整数倍.
InnoDB高度计算

我们假设主键ID为bigint类型,长度为8字节,而指针大小在InnoDB源码中设置为6字节,这样一共14字节
我们一个页中能存放多少这样的索引元素,其实就代表有多少指针,即16384/14=1170;
假设一行记录的数据大小为1k,实际上现在很多互联网业务数据记录大小通常就是1K左右
高度为2的B+树能存放1170×16=18720
高度为3的B+树能存放1170×1170×16 = 21902400
IB+树高度一般为1-3层,它就能满足千万级的数据存储。
在查找数据时一次页的查找代表一次IO,所以通过主键索引查询通常只需要1-3次IO操作即可查找到数据。
一般根节点是常驻内存的,所以一般我们查找千万级别的数据,只需要 2 次磁盘 IO。
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-12-4 16:28, Processed in 0.172459 second(s), 35 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表