MySQL千万级数据表的优化实战记录


Posted in MySQL onAugust 04, 2021

前言

这里先说明一下,网上很多人说阿里规定500w数据就要分库分表。实际上,这个500w并不是定义死的,而是与MySQL的配置以及机器的硬件有关。MySQL为了提升性能,会将表的索引装载到内存中。但是当表的数据到达一定的量的时候,会导致内存无法存储这些索引,无法存储索引,就只能进行磁盘IO,从而导致性能下降。

实战调优

我这里有张表,数据有1000w,目前只有一个主键索引

CREATE TABLE `user` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `uname` varchar(20) DEFAULT NULL COMMENT '账号',
  `pwd` varchar(20) DEFAULT NULL COMMENT '密码',
  `addr` varchar(80) DEFAULT NULL COMMENT '地址',
  `tel` varchar(20) DEFAULT NULL COMMENT '电话',
  `regtime` char(30) DEFAULT NULL COMMENT '注册时间',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10000003 DEFAULT CHARSET=utf8;

MySQL千万级数据表的优化实战记录

查询所有大概16s。可谓是相当慢了。通常我们一个后台系统,比如这个是一个电商平台,这个是用户表。后台管理系统,一般会查询这些用户信息,做一些操作,比如后台直接新增用户啊,或者删除用户啊这些操作。

所以这里就诞生了两个需求,一个是查询count,一个是分页查询

我们分别来测试一下count用的时间和分页查询所用的时间

select * from user limit 1, 10   //几乎不用时
select * from user limit 1000000, 10  //0.35s
select * from user limit 5000000, 10  //1.7s
select * from user limit 9000000, 10  //2.8s
select count(1) from user  //1.7s

从上面查询所用时间可以看出来,如果是分页查询的话,查询的数据越往后用时是越长的,查询count也需要1.7s。这显然是不符合我们的要求的。所以,这里我们就需要优化。首先我们这里进行索引优化试试
首先看一下这是只有主键索引的执行计划:

MySQL千万级数据表的优化实战记录

alter table `user` add INDEX `sindex` (`uname`,`pwd`,`addr`,`tel`,`regtime`,`age`)

MySQL千万级数据表的优化实战记录

看上面的执行计划,虽然type是从all->index,走了sindex索引,但是实际上查询速度并没有发生改变。

其实,创建联合索引,是为了有条件查询的时候速度更快,而不是全表查询

select * from user where uname='6.445329111484186' //3.5s(无联合索引)
select * from user where uname='6.445329111484186' //0.003s(有联合索引)

所以这就是有联合索引和无索引的差距

这里基本上可以证明,加了索引和不加索引,进行全表查询的时候,效率就是会很慢

既然索引这个结果已经不好使了,那就只能找其他方案了。根据我之前mysql面试里面讲的,count我们可以单独存储到一个表里面

CREATE TABLE `attribute` (
  `id` int(11) NOT NULL,
  `formname` varchar(50) COLLATE utf8_bin NOT NULL COMMENT '表名',
  `formcount` int(11) NOT NULL COMMENT '表总数据',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

MySQL千万级数据表的优化实战记录

这里说一下,这种表一般不会查所有,只会查询一条,所以建表的时候,可以建成hash

select formcount from attribute where formname='user' //几乎不用时

count就进行优化完了。如果上面有选择条件的话,就可以建立索引,通过走索引筛选的形式来查询,这样就可以不用读这个count了。

那么,count是没问题了,分页查询优化要如何优化呢?这里可以使用子查询来优化

select * from user where
id>=(select id from user limit 9000000,1) limit 10 //1.7s

其实子查询这种写法,判断id,其实就是通过覆盖索引来查询。效率会大大增加。不过我这里测试是1.7s,以前在公司优化这方面的时候,比这个查询时间要低,大家也可以自己生成数据自己测试

但是如果说数据量太大了,我还是建议走es或者进行一些默认选择,count可以单独列出来

至此,一个千万级的数据分页查询的优化就完成了。

总结

到此这篇关于MySQL千万级数据表优化的文章就介绍到这了,更多相关MySQL千万级数据表优化内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
详解GaussDB for MySQL性能优化
May 18 MySQL
IDEA 链接Mysql数据库并执行查询操作的完整代码
May 20 MySQL
一文读懂navicat for mysql基础知识
May 31 MySQL
MySQL的安装与配置详细教程
Jun 26 MySQL
sql注入教程之类型以及提交注入
Aug 02 MySQL
MySQL外键约束(FOREIGN KEY)案例讲解
Aug 23 MySQL
Mysql关于数据库是否应该使用外键约束详解说明
Oct 24 MySQL
MYSQL 运算符总结
Nov 11 MySQL
以MySQL5.7为例了解一下执行计划
Apr 13 MySQL
MySQL查询日期时间
May 15 MySQL
MySQL详解进行JDBC编程与增删改查方法
Jun 16 MySQL
MySQL分布式恢复进阶
Jul 23 MySQL
SQL实现LeetCode(176.第二高薪水)
Aug 04 #MySQL
Mysql8.0递归查询的简单用法示例
Aug 04 #MySQL
SQL之各种join小结详细讲解
SQL实现LeetCode(175.联合两表)
Aug 04 #MySQL
一篇文章带你深入了解Mysql触发器
Aug 02 #MySQL
sql注入教程之类型以及提交注入
MySQL子查询中order by不生效问题的解决方法
Aug 02 #MySQL
You might like
PHP_Flame(Version:Progress)的原代码
2006/10/09 PHP
php _autoload自动加载类与机制分析
2012/02/10 PHP
thinkphp视图模型查询提示ERR: 1146:Table 'db.pr_order_view' doesn't exist的解决方法
2014/10/30 PHP
laravel容器延迟加载以及auth扩展详解
2015/03/02 PHP
Yii2下session跨域名共存的解决方案
2017/02/04 PHP
stripos函数知识点实例分享
2019/02/11 PHP
laravel 判断查询数据库返回值的例子
2019/10/11 PHP
番茄的表单验证类代码修改版
2008/07/18 Javascript
javascript标签在页面中的位置探讨
2013/04/11 Javascript
基于JavaScript实现继承机制之构造函数方法对象冒充的使用详解
2013/05/07 Javascript
解析javascript 实用函数的使用详解
2013/05/10 Javascript
js的alert弹出框出现乱码解决方案
2013/09/02 Javascript
JS小功能(列表页面隔行变色)简单实现
2013/11/28 Javascript
js和css写一个可以自动隐藏的悬浮框
2014/03/05 Javascript
JavaScript中的Truthy和Falsy介绍
2015/01/01 Javascript
jQuery提示插件alertify使用指南
2015/04/21 Javascript
js实现a标签超链接提交form表单的方法
2015/06/24 Javascript
举例讲解如何判断JavaScript中对象的类型
2016/04/22 Javascript
javascript宿主对象之window.navigator详解
2016/09/07 Javascript
微信小程序 实例应用(记账)详解
2016/09/28 Javascript
React Native中导航组件react-navigation跨tab路由处理详解
2017/10/31 Javascript
vue项目中使用tinymce编辑器的步骤详解
2018/09/11 Javascript
浅析Angular 实现一个repeat指令的方法
2019/07/21 Javascript
uni-app 支持多端第三方地图定位的方法
2020/01/03 Javascript
Python中使用logging模块打印log日志详解
2015/04/05 Python
Pycharm 2019 破解激活方法图文详解
2019/10/11 Python
自定义实现 PyQt5 下拉复选框 ComboCheckBox的完整代码
2020/03/30 Python
keras 指定程序在某块卡上训练实例
2020/06/22 Python
keras训练浅层卷积网络并保存和加载模型实例
2020/07/02 Python
pycharm配置QtDesigner的超详细方法
2021/01/25 Python
HTML5和以前HTML4的区别整理
2013/10/20 HTML / CSS
计算机网络专业个人的自我评价
2013/10/17 职场文书
再婚婚前财产协议书范本
2014/10/19 职场文书
环卫工作个人总结
2015/03/04 职场文书
MySQL派生表联表查询实战过程
2022/03/20 MySQL
Apache Kafka 分区重分配的实现原理解析
2022/07/15 Servers