提高系统的吞吐量解决数据库重复写入问题


Posted in MySQL onApril 23, 2022

问题分析

为了提高系统的吞吐量,很多环节下对于数据库的写入是多线程,甚至是多进程的。为了保证写入成功,在很多情况下需要多次重试。这就会带来一个问题,数据重复,同一条数据会被记录多次。有些情况下数据重复无伤大雅,但是很多情况系统是无法容忍数据重复的。因此这个问题需要解决。我个人觉得解决这一问题有两个方向:第一,从数据库上保证数据不重复,第二,从程序上保证数据不重复。

数据库上解决

主要包括:主键,唯一性索引,甚至是临时表。程序上解决无非就是要保证同步,这两种方式能解决很多情况下的数据重复。但是有些情况可能比较棘手,使用者两种方法有时并不能很好的解决,或实现起来比较复杂,如下面的数据

假如下表主要字段如下:

id  studentId  teacherId  states 

状态(states)是有多种的(0,1,2,3),状态可以转换,但是状态为,0的一个只能由一个,其它字段是可以重复的。这个其实就是保证某一种状态下的数据不重复。

首先唯一性索引不能够起作用,因为无法建立唯一性索引。主键也没有效果,没法通过这些字段生成可区分的id。所以这两种方法都失效了。还有一种方法就是临时表,在临时表中插入一条能够区分的数据(比如studentId,teacherId组合),无论是唯一索引还是主键都可以。写入时首先写临时表,临时表写入成功则插入一条数据,然后清空临时表。这在严格保证数据不重复的情况下是能够起作用的,但是比较繁琐,需要处理一个临时表。

另外的一个办法就是根据我们的业务场景,在一个时间段内(比如1分钟)不会出现两条相同数据写入。这样我们可以使用studentIdTeacherid加上精确到分钟的时间来构成一个唯一id,重试时间间隔一般都极短(秒级别),这样通过id来保证数据的唯一性。

从程序上保证数据不重复

如果从程序上来保证数据不重复,则更加复杂。第一种办法是对写入过程加锁,确保只有一次写入成功代码如下(伪代码):

 

Lock lock =new WriteLock();
public void write(Data data){
try{
     if(lock.tryLock() ){
               dataRepository.save(data);
               if(dataRepository.numberOf(data)>1){//在写入的时候检测如果数据库中有该数据抛出异常。再次保证数据不重复。
                   throw new DataException
            }
      
     }  
  }finally{
     lock.unlock();
  }
}

 

这种方式首先会存在效率问题,所有的数据都要顺序写入会导入效率下降。我们只需要保证同一条数据不能并发写入而不是不同数据。另外这种方式还会存在一定概率的重复,因为网络问题和数据库或ORM框架的缓存问题,会导致写入检测时并不能发现数据库的更新。比如使用hibernate,两次线程调用write方法会使用两个session,从而使得第一次写入缓存的数据无法在下一次操作中看到。在write方法中多次调用numberOf方法也是不起用的,由于session的缓存,后面的查询会使用第一次的缓存结果,在第一次查询后的数据库变化,后面的查询仍然无法觉察。

针对写入效率低的问题,这里可以采用数据锁,即通过一种方法比如使用data的hashcode来映射来获取锁,这样不同的数据会获取到不同的锁,解决了所有数据的顺序写入问题。但是跟第一种情况一样仍会存在数据重复问题。

对于多进程的情况,如微服务部署多个的情况,上面的同步会失效。对于这种情况唯一的解决办法就是使用上面所说的数据库同步或者构造一个环节锁,类似于令牌的方法。只有获取到令牌才有写入资格,写入成功后销毁针对该数据的“令牌“。这种实现其实也比较简单,如使用一个redis的hashmap,每次写入首先获取该数据对应的value,通过value来判断该数据是否写入,来保证数据不重复。

总结

上面无论哪种方法,针对本文所提到的数据,解决重复问题都是不容易的。要么实现起来比较复杂,要么还是不能100%保证数据不重复。针对我们的业务场景:state为0的状态下数据能有一条,且0的状态不会持续太久,后面的操作会将其修改。而且多线程重试并不是每次都发生的,多进程情况下,每次数据写入也多是只通过其中一个节点,针对这种情况其实可以采取更简单的处理方式,不做过多的顺序限制只在写入时检查数据库,如果真的因为数据更新或者并发导致了多次写入也没有关系(这种情况很少),后续的操作时再删除多写入的数据。这是一种乐观的处理方式,但是对于很多情况是可以解决数据重复问题的。

以上是我个人对于只有某种状态的数据不能重复写入问题的处理方法的思考。主要是从数据库和程序上来控制及如果场景允许使用乐观(后续补救)的方法。仅供参考!


Tags in this post...

MySQL 相关文章推荐
Mysql 如何批量插入数据
Apr 06 MySQL
Mysql官方性能测试工具mysqlslap的使用简介
May 21 MySQL
正确使用MySQL INSERT INTO语句
May 26 MySQL
MySQL Router实现MySQL的读写分离的方法
May 27 MySQL
Mysql文件存储图文详解
Jun 01 MySQL
详解MySQL中的pid与socket
Jun 15 MySQL
浅谈MySQL user权限表
Jun 18 MySQL
MySQL系列之开篇 MySQL关系型数据库基础概念
Jul 02 MySQL
关于mysql中时间日期类型和字符串类型的选择
Nov 27 MySQL
详解Mysq MVCC多版本的并发控制
Apr 29 MySQL
MySQL 语句执行顺序举例解析
Jun 05 MySQL
MySQL数据库如何查看表占用空间大小
Jun 10 MySQL
MySQL 数据库范式化设计理论
Apr 22 #MySQL
MySQL提取JSON字段数据实现查询
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 #MySQL
在MySQL中你成功的避开了所有索引
Apr 20 #MySQL
mysql中如何用命令创建联合唯一索引
Apr 20 #MySQL
mysql 8.0.27 绿色解压版安装教程及配置方法
MySQL去除密码登录告警的方法
Apr 20 #MySQL
You might like
php设计模式 Delegation(委托模式)
2011/06/26 PHP
php格式化日期实例分析
2014/11/12 PHP
PHP 验证登陆类分享
2015/03/13 PHP
基于JQuery+PHP编写砸金蛋中奖程序
2015/09/08 PHP
PHP处理数组和XML之间的互相转换
2016/06/02 PHP
PHP实现的激活用户注册验证邮箱功能示例
2017/06/06 PHP
php中输出json对象的值(实现方法)
2018/03/07 PHP
提高 DHTML 页面性能
2006/12/25 Javascript
javascript中的array数组使用技巧
2010/01/31 Javascript
正则表达式搭配js轻松处理json文本方便而老古
2013/02/17 Javascript
js 限制input只能输入数字、字母和汉字等等
2013/12/18 Javascript
javascript实用方法总结
2015/02/06 Javascript
理解Javascript图片预加载
2016/02/23 Javascript
jQuery Mobile 和 Kendo UI 的比较
2016/05/05 Javascript
移动端(微信等使用vConsole调试console的方法
2019/03/05 Javascript
解决layui 表单元素radio不显示渲染的问题
2019/09/04 Javascript
Python中zip()函数用法实例教程
2014/07/31 Python
Python将文本去空格并保存到txt文件中的实例
2018/07/24 Python
Flask之请求钩子的实现
2018/12/23 Python
Python内置数据类型list各方法的性能测试过程解析
2020/01/07 Python
Python turtle画图库&&画姓名实例
2020/01/19 Python
python十进制转二进制的详解
2020/02/07 Python
Python安装与卸载流程详细步骤(图解)
2020/02/20 Python
基于python 取余问题(%)详解
2020/06/03 Python
Android Q之气泡弹窗的实现示例
2020/06/23 Python
OpenCV 使用imread()函数读取图片的六种正确姿势
2020/07/09 Python
StubHub哥伦比亚:购买和出售您的门票
2016/10/20 全球购物
自我评价个人范文
2013/12/16 职场文书
医院我们的节日活动实施方案
2014/08/22 职场文书
公司周年庆活动方案
2014/08/25 职场文书
幼儿园大班教师个人总结
2015/02/05 职场文书
mysql的MVCC多版本并发控制的实现
2021/04/14 MySQL
Python 制作自动化翻译工具
2021/04/25 Python
python编程学习使用管道Pipe编写优化代码
2021/11/20 Python
MySQL数据库完全卸载的方法
2022/03/03 MySQL
Golang流模式之grpc的四种数据流
2022/04/13 Golang