MySql索引数据结构

Published on Feb 23, 2021 with 0 views and 0 comments

# mysql # 数据库

一、索引定义

索引是帮助MySQL高效获取数据的排好序的数据结构。

二、索引数据结构

二叉树：单向递增时效果低
红黑树：每个节点只能存一个数据，树太深，意味着从磁盘读取数据的次数多
Hash表
B-Tree
B+Tree

B-Tree

叶节点具有相同的深度，叶节点的指针为空
所有索引元素不重复
节点中的数据索引从左到右递增排列

图片1.png

B+Tree(B-Tree变种)

非叶子节点不存储data，只存储索引(冗余)，可以放更多的索引
叶子节点包含所有索引字段
叶子节点用指针连接，提高区间访问的性能

图片2.png

mysql每页大小为16KB，查询语句：show GLOBAL STATUS like 'Innodb_page_size';
如果主键是BigInt，占8个字节，中间指针约6字节，那么一页可以存放16*1024/14 = 1170
假设数据为1KB，那么三层的树可以存放：1170*1170*16=21902400条数据。

Hash

对索引的key进行一次hash计算就可以定位出数据存储的位置
很多时候Hash索引要比B+ 树索引更高效
仅能满足 “=”，“IN”，不支持范围查询
hash冲突问题

MySql索引结构采用B+Tree和Hash。

三、不同存储引擎里索引的实现

MyISAM

MyISAM索引文件和数据文件是分离的(非聚集)
图片4.png

InnoDB

表数据文件本身就是按B+Tree组织的一个索引结构文件（聚集）
聚集索引-叶节点包含了完整的数据记录
为什么建议InnoDB表必须建主键，并且推荐使用整型的自增主键？
必须有主键才能构造出B+Tree，不设置主键会找出数据都不同的列，找不到mysql会生成一个隐藏列用来构键索引树。
非自增的话，插入的时候性能消耗更大（会导致原来的页分开，树要重新平衡），自增的话，在页数据存满的时候，在后面新增一页即可。
为什么非主键索引结构叶子节点存储的是主键值？(一致性和节省存储空间)

非主键索引：叶子节点上存储的是主键，找到主键再通过主键查找数据（回表）。

四、联合索引

图片7.png

以图示为例，先比较name，再比较age，最后比较position。所以可能出现左侧age比右侧age大的情况（因为先比较的name），这就是最左匹配。

where name = 'bill' and age = 30; # 走索引
where age = 30 and name = 'bill'; # 不走索引
where position = 'dev'; # 不走索引

标题：MySql索引数据结构
作者：fyzzz
地址：https://fyzzz.cn/articles/2021/02/23/1614090826245.html

一、索引定义
二、索引数据结构
B-Tree
B+Tree(B-Tree变种)
Hash
三、不同存储引擎里索引的实现
MyISAM
InnoDB
四、联合索引

Share WeiBo Twitter QZone WeChat ← → ↑ ↓