PHP 中执行排序与 MySQL 中排序


Posted in PHP onApril 21, 2009

此文首发在 InfoQ 中文站作者:明灵(dragon) , Fenng . Note:要转载的朋友请注意注明这篇文章的第一作者!
这篇文章是dragon 朋友来邮探讨后他做的一个总结。在 DB 中排序还是在 应用程序中排序是个很有趣的话题,dragon 第一份邮件中其实已经总结的很好了,我添加了一点建议而已。现在放上来,与大家共享。这篇文章也投稿到了 InfoQ 中文站

Q:列出在 PHP 中执行排序要优于在 MYSQL 中排序的原因?给一些必须在MYSQL中排序的实例?

A:通常来说,执行效率需要考虑 CPU、内存和硬盘等的负载情况,假定 MYSQL 服务器和 PHP 的服务器都已经按照最适合的方式来配置,那么系统的可伸缩性(Scalability)和用户感知性能(User-perceived Performance)是我们追求的主要目标。在实际运行中,MYSQL 中数据往往以 HASH tables、BTREE 等方式存贮于内存,操作速度很快;同时 INDEX 已经进行了一些预排序;很多应用中,MYSQL 排序是首选。而在应用层(PHP)中排序,也必然在内存中进行,与 MYSQL 相比具有如下优势:

  • 1、 考虑整个网站的可伸缩性和整体性能,在应用层(PHP)中排序明显会降低数据库的负载,从而提升整个网站的扩展能力。而数据库的排序,实际上成本是非常高的,消耗内存、CPU,如果并发的排序很多,DB 很容易到瓶颈。
  • 2、 如果在应用层(PHP)和MYSQL之间还存在数据中间层,合理利用,PHP会有更好的收益。
  • 3、 PHP在内存中的数据结构专门针对具体应用来设计,比数据库更为简洁、高效;
  • 4、 PHP不用考虑数据灾难恢复问题,可以减少这部分的操作损耗;
  • 5、 PHP不存在表的锁定问题;
  • 6、 MYSQL中排序,请求和结果返回还需要通过网络连接来进行,而PHP中排序之后就可以直接返回了,减少了网络IO。

至于执行速度,差异应该不会很大,除非应用设计有问题,造成大量不必要的网络IO。另外,应用层要注意PHP 的 Cache 设置,如果超出会报告内部错误;此时要根据应用做好评估,或者调整Cache。具体选择,将取决于具体的应用。

列出一些 PHP 中执行排序更优的情况:

  • 1、 数据源不在 MYSQL 中,存在硬盘、内存或者来自网络的请求等;
  • 2、 数据存在 MYSQL 中,量不大,而且没有相应的索引,此时把数据取出来用PHP排序更快;
  • 3、 数据源来自于多个 MYSQL 服务器,此时从多个 MYSQL 中取出数据,然后在PHP中排序更快;
  • 4、 除了 MYSQL 之外,存在其他数据源,比如硬盘、内存或者来自网络的请求等,此时不适合把这些数据存入 MYSQL 后再排序;

列出一些必须在 MYSQL 中排序的实例:

  • 1、 MYSQL 中已经存在这个排序的索引;
  • 2、 MYSQL 中数据量较大,而结果集需要其中很小的一个子集;比如 1000000 行数据,取TOP 10;
  • 3、 对于一次排序、多次调用的情况,比如统计聚合的情形,可以提供给不同的服务使用,那么在 MYSQL 中排序是首选的。另外,对于数据深度挖掘,通常做法是在应用层做完排序等复杂操作,把结果存入MYSQL即可,便于多次使用。
  • 4、 不论数据源来自哪里,当数据量大到一定的规模后,由于占用内存/Cache 的关系,不再适合 PHP 中排序了;此时把数据复制、导入或者存在 MYSQL ,并用 INDEX 优化,是优于 PHP 的。不过,用 Java,甚至 C++ 来处理这类操作会更好。 [有些类似大数据集聚合或者汇总的数据,在客户端排序得不偿失。当然,也有用类似搜索引擎的思路来解决类似应用的情况。]

从网站整体考虑,就必须加入人力和成本的考虑。假如网站规模和负载较小,而人力有限(人数和能力都可能有限),此时在应用层(PHP)做排序要做不 少开发和调试工作,耗费时间,得不偿失;不如在 DB 中处理,简单快速。对于大规模的网站,电力、服务器的费用很高,在系统架构上精打细算,可以节约大量的费用,是公司持续发展之必要;此时如果能在应用层(PHP) 进行排序并满足业务需求,尽量在应用层进行。

PHP 相关文章推荐
Win9x/ME下Apache+PHP安装配置
Oct 09 PHP
PHP开发入门教程之面向对象
Dec 05 PHP
win7 64位系统 配置php最新版开发环境(php+Apache+mysql)
Aug 15 PHP
php获取随机数组列表的方法
Nov 13 PHP
php简单定时执行任务的实现方法
Feb 23 PHP
php计算两个文件相对路径的方法
Mar 14 PHP
Yii实现自动加载类地图的方法
Apr 01 PHP
PHP中is_dir()函数使用指南
May 08 PHP
php获取文件类型和文件信息的方法
Jul 10 PHP
PHP QRCODE生成彩色二维码的方法
May 19 PHP
PHP生成随机数的方法总结
Mar 01 PHP
浅谈Laravel中的三种中间件的作用
Oct 13 PHP
一个php导出oracle库的php代码
Apr 20 #PHP
php一句话cmdshell新型 (非一句话木马)
Apr 18 #PHP
对squid中refresh_pattern的一些理解和建议
Apr 17 #PHP
PHP 加密与解密的斗争
Apr 17 #PHP
php error_log 函数的使用
Apr 13 #PHP
PHP Document 代码注释规范
Apr 13 #PHP
php pcntl_fork和pcntl_fork 的用法
Apr 13 #PHP
You might like
php5.2时间相差8小时
2007/01/15 PHP
php检测图片木马多进制编程实践
2013/04/11 PHP
javascript 一个自定义长度的文本自动换行的函数
2007/08/19 Javascript
Javascript 二维数组
2009/11/26 Javascript
JQuery 自定义CircleAnimation,Animate方法学习笔记
2011/07/10 Javascript
自定义右键属性覆盖浏览器默认右键行为实现代码
2013/02/02 Javascript
用RadioButten或CheckBox实现div的显示与隐藏
2013/09/21 Javascript
浅谈javascript六种数据类型以及特殊注意点
2013/12/20 Javascript
IE与FF下javascript获取网页及窗口大小的区别详解
2014/01/14 Javascript
jquery 页面滚动到底部自动加载插件集合
2014/01/31 Javascript
JavaScript中string转换成number介绍
2014/12/31 Javascript
js获取字符串字节数方法小结
2015/06/09 Javascript
分享一个精简的vue.js 图片lazyload插件实例
2017/03/13 Javascript
vue v-for循环重复数据无法添加问题解决方法【加track-by='索引'】
2019/03/15 Javascript
Python模块学习 re 正则表达式
2011/05/19 Python
python自动化测试之从命令行运行测试用例with verbosity
2014/09/28 Python
常见的在Python中实现单例模式的三种方法
2015/04/08 Python
Python scipy的二维图像卷积运算与图像模糊处理操作示例
2019/09/06 Python
python模块常用用法实例详解
2019/10/17 Python
html5给汉字加拼音加进度条的实现代码
2020/04/07 HTML / CSS
澳大利亚鞋仓库:Shoe Warehouse
2019/07/25 全球购物
加拿大大码女装购物网站:Penningtons
2020/12/26 全球购物
银行员工职业规划范文
2014/01/21 职场文书
读书演讲主持词
2014/03/18 职场文书
环保标语大全
2014/06/12 职场文书
政治学专业毕业生求职信
2014/08/11 职场文书
人大调研汇报材料
2014/08/14 职场文书
小学生勤俭节约演讲稿
2014/08/28 职场文书
区长工作作风个人整改措施
2014/10/01 职场文书
2014年远程教育工作总结
2014/12/09 职场文书
教师读书笔记
2015/06/29 职场文书
预备党员入党感言
2015/08/01 职场文书
2016年寒假社会实践活动总结
2015/10/10 职场文书
提档介绍信范文
2015/10/22 职场文书
企业愿景口号
2015/12/25 职场文书
Python中文纠错的简单实现
2021/07/07 Python