mysql 索引的数据结构为什么要采用B+树


Posted in MySQL onApril 26, 2022

前提: 以下的一些数据结构大家需提前知道,否则看起来会比较有困难,大家也可以按照本文所提到的知识点去主动查阅学习。

1. Hash表?No

因考虑到在数据检索的过程中经常会有范围的查询(如下),而hash表不能提供这种功能。

SELECT * FROM hero WHERE age>5 AND age<20;

使用哈希算法实现的索引虽然可以做到快速检索数据,但是没办法做数据高效范围查找,因此哈希索引是不适合作为 Mysql 的底层索引的数据结构。

2. 二叉查找树(BST)?No

二叉查找树(Binary Search Tree)虽然可以达到范围搜索,但是在树的插入过程中,如果插入的数据本来就是有顺序的,那么就会形成一条链(如下),它的最坏情况是O(n)。 

mysql 索引的数据结构为什么要采用B+树

3. 红黑树?No

红黑树虽然看似达到了平衡状态,但是也会有极端情况存在,和上述BST树一样,虽然不会成为链状,但是红黑树会存在右倾的现象。 

mysql 索引的数据结构为什么要采用B+树

在数据库中的基本主键自增操作,主键一般都是数百万数千万的,如果红黑树存在这种问题,对于查找性能而言也是巨大的消耗,我们数据库不可能忍受这种无意义的等待的。

4. 平衡二叉树(AVL)?差那么二点意思

平衡二叉树,英文翻译为Balanced Binary Tree,为啥叫AVL呢? AVL 是大学教授G.M. Adelson-VelskyE.M. Landis 名称的缩写,他们提出的平衡二叉树的概念,为了纪念他们,将平衡二叉树称为 AVL树。

AVL树本质上是一颗二叉查找树,但是它又具有以下特点:

  • 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,
  • 左右两个子树也都是一棵平衡二叉树。

它不存在红黑树这种右倾的现象,也具备数据高效范围查找的能力,但是数据库查询数据的瓶颈在于磁盘的IO,树节点在磁盘空间中存储可能是不连续的,假设我们一次IO读取一个树的节点,此次读入内存的这页中没有其他树的节点,那么每读取一个树的节点,就要进行一次IO,这是多么消耗时间啊,所以我们设计数据库索引时需要首先考虑怎么尽可能减少磁盘 IO 的次数。 磁盘读取依靠的是机械运动,分为寻道时间、旋转延迟、传输时间三个部分,这三个部分耗时相加就是一次磁盘IO的时间;这个花费的时间成本是内存访问的十几万倍左右。 正是由于磁盘IO是非常昂贵的操作,所以计算机操作系统对此做了优化:预读;每一次IO时,不仅仅把当前磁盘地址的数据加载到内存,同时也把相邻数据也加载到内存缓冲区中。因为局部预读原理说明:当访问一个地址数据的时候,与其相邻的数据很快也会被访问到。每次磁盘IO读取的数据我们称之为一页(page)。一页的大小与操作系统有关,一般为4k或者8k。这也就意味着读取一页内数据的时候,实际上发生了一次磁盘IO。

相关术语解释:

扇区(sector):

  • 磁盘上的每个磁道被等分成多个弧段,这个弧段便称作扇区(sector)。
  • 扇区是磁盘物理层面的名称,它是实际发生读写的最底层。

磁盘块(IO Block):

  • 操作系统不与扇区直接进行交互,因为一般情况下一个扇区是512byte,如果1T去用512byte进行划分,那划分的地址空间太多了,为了让操作系统能够寻址到更大的地址空间,操作系统将相邻的扇区组合在一起,形成一个块,对块进行管理。每个磁盘块可以包括 2、4、8、16、32 或 64 个扇区,这便是磁盘块(IO Block)。
  • 磁盘块是操作系统中出现的名称,文件系统读写数据的最小单位,它同时也被叫做磁盘簇。

页(page):

  • 页是内存中出现的名称,它是内存的最小存储单位,页的大小通常为磁盘块大小的 2^n 倍。

5. B-tree(B-树也称B树)?差那么一点意思

B树是一种平衡的多叉树,B树相比于平衡二叉树(AVL),它能够在单个节点中存储大量键,也降低了树的高度,从而减少了IO的次数。 

mysql 索引的数据结构为什么要采用B+树

B树的节点中存储的是数据,单个节点存储的内容还是太少了,如何让一个节点存储的内容更多呢?B+树它来了。

6. B+树

在节点中存储某段数据的首地址,并且B+树的叶子节点用了一个链表串联起来,便于范围查找。 

mysql 索引的数据结构为什么要采用B+树

B+树高度降低,减少了磁盘 IO。其次,B+树的叶子节点是真正数据存储的地方,叶子节点用了链表连接起来,这个链表本身就是有序的,在数据范围查找时,更具备效率。因此 Mysql 的索引用的就是 B+树,B+树在查找效率、范围查找中都有着非常不错的性能。

到此这篇关于一文了解mysql索引的数据结构为什么用B+树的文章就介绍到这了!


Tags in this post...

MySQL 相关文章推荐
mysql数据库入门第一步之创建表
May 14 MySQL
MySQL之PXC集群搭建的方法步骤
May 25 MySQL
MySQL中in和exists区别详解
Jun 03 MySQL
浅谈mysql返回Boolean类型的几种情况
Jun 04 MySQL
浅谈mysql增加索引不生效的几种情况
Jun 23 MySQL
Mysql实现简易版搜索引擎的示例代码
Aug 30 MySQL
SQL语法CONSTRAINT约束操作详情
Jan 18 MySQL
你真的会用Mysql的explain吗
Mar 31 MySQL
pt-archiver 主键自增
Apr 26 MySQL
优化Mysql查询的示例
Apr 26 MySQL
MySQL聚簇索引和非聚簇索引的区别详情
Jun 14 MySQL
SQL中去除重复数据的几种方法汇总(窗口函数对数据去重)
May 08 MySQL
MySQ InnoDB和MyISAM存储引擎介绍
pt-archiver 主键自增
Apr 26 #MySQL
提高系统的吞吐量解决数据库重复写入问题
Apr 23 #MySQL
MySQL 数据库范式化设计理论
Apr 22 #MySQL
MySQL提取JSON字段数据实现查询
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 #MySQL
在MySQL中你成功的避开了所有索引
Apr 20 #MySQL
You might like
MySQL时间字段究竟使用INT还是DateTime的说明
2012/02/27 PHP
深入理解require与require_once与include以及include_once的区别
2013/06/05 PHP
Yii2-GridView 中让关联字段带搜索和排序功能示例
2017/01/21 PHP
PHP基础之输出缓冲区基本概念、原理分析
2019/06/19 PHP
PhpSpreadsheet设置单元格常用操作汇总
2020/11/13 PHP
jQuery Ajax 仿AjaxPro.Utility.RegisterTypeForAjax辅助方法
2011/09/27 Javascript
Array.prototype.concat不是通用方法反驳[译]
2012/09/20 Javascript
JS中setTimeout()的用法详解
2013/04/14 Javascript
jquery实现微博文字输入框 输入时显示输入字数 效果实现
2013/07/12 Javascript
jquery动态加载js三种方法实例
2013/08/03 Javascript
ajax请求get与post的区别总结
2013/11/04 Javascript
jquery移除、绑定、触发元素事件使用示例详解
2014/04/10 Javascript
JavaScript实现带箭头标识的多级下拉菜单效果
2015/08/27 Javascript
基于jquery实现省市联动效果
2015/11/23 Javascript
AngularJS 如何在控制台进行错误调试
2016/06/07 Javascript
通过BootStrap实现轮播图的实际应用
2016/09/26 Javascript
利用HTML5+Socket.io实现摇一摇控制PC端歌曲切换
2017/01/13 Javascript
jquery仿苹果的时间/日期选择效果
2017/03/08 Javascript
深入理解vue-router之keep-alive
2017/08/31 Javascript
js+canvas实现滑动拼图验证码功能
2018/03/26 Javascript
详解超简单的react服务器渲染(ssr)入坑指南
2019/02/28 Javascript
Vue打包后访问静态资源路径问题
2019/11/08 Javascript
Vue实现购物车基本功能
2020/11/08 Javascript
Python实现二叉树结构与进行二叉树遍历的方法详解
2016/05/24 Python
Python中的数学运算操作符使用进阶
2016/06/20 Python
Python制作豆瓣图片的爬虫
2017/12/28 Python
Python程序运行原理图文解析
2018/02/10 Python
Python爬虫框架scrapy实现的文件下载功能示例
2018/08/04 Python
python进阶之自定义可迭代的类
2019/08/20 Python
django-rest-swagger对API接口注释的方法
2019/08/29 Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
2020/03/13 Python
Python实现迪杰斯特拉算法并生成最短路径的示例代码
2020/12/01 Python
Pytorch模型迁移和迁移学习,导入部分模型参数的操作
2021/03/03 Python
CSS3 filter(滤镜)实现网页灰色或者黑色模式的示例代码
2021/02/24 HTML / CSS
护理专科毕业推荐信
2013/11/10 职场文书
java Nio使用NioSocket客户端与服务端交互实现方式
2021/06/15 Java/Android