利用Python绘制MySQL数据图实现数据可视化


Posted in Python onMarch 30, 2015

本教程的所有Python代码可以在网上的IPython notebook中获取。

考虑在公司里使用Plotly?可以看一下Plotly的on-premises企业版。(注:On-premises是指软件运行在工作场所或公司内部,详见维基百科)

注意操作系统:尽管Windows或Mac用户也可以跟随本文操作,但本文假定你使用的是Ubuntu系统(Ubuntu桌面版或Ubuntu服务器版)。如果你没有Ubuntu Server,你可以通过Amazon的Web服务建立一个云平台(阅读这份教程的前半部分)。如果你用的是Mac,我们推荐你购买并下载VMware Fusion,在上面安装Ubuntu桌面版。你也可以通过Zareason购买一台便宜的预装Ubuntu桌面版/服务器版的笔记本或服务器。

使用Python读取MySQL的数据并绘图很简单,所有你需要的工具都可以免费下载。本文会展示怎么做。如果你遇到问题或者卡住了,可以给feedback@plot.ly发送邮件,也可以在本文下面评论,或者在tweeter上@plotlygraphs。
第1步:确保MySQL已安装且在运行

首先,你需要有一台安装了MySQL的计算机或服务器。你可以通过以下方法检查MySQL是否安装:打开控制台,输入“mysql”,如果你收到MySQL无法连接的错误,这意味着MySQL安装了,但是没有运行。在命令行或“Terminal”中,尝试输入sudo /etc/init.d/mysql start并按回车来启动MySQL。

如果MySQL没有安装,不要失望。在Ubuntu中下载并安装只需一行命令:

shell> sudo apt-get install mysql-server --fix-missing

安装过程中会让你输入一个密码。安装结束后,你可以在终端中键入以下命令进入MySQL控制台:
 

shell> sudo mysql -uroot -p

输入“exit”就可以退出MySQL控制台,。

本教程使用MySQL经典的“world”样例数据库。如果你想跟随我们的步骤,可以在MySQL文档中心下载world数据库。你也可以在命令行中使用wget下载:
 

shell> wget http://downloads.mysql.com/docs/world.sql.zip

然后解压文件:
 

shell> unzip world.sql.zip

(如果unzip没有安装,输入sudo apt-get install unzip安装)

现在需要把world数据库导入到MySQL,启动MySQL控制台:
 

shell> sudo mysql -uroot -p

进入控制台后,通过以下MySQL命令使用world.sql文件创建world数据库:
 

mysql> CREATE DATABASE world;
mysql> USE world;
mysql> SOURCE /home/ubuntu/world.sql;

(在上面的SOURCE命令中,确保将路径改为你自己world.sql所在目录)。
上述操作说明摘自MySQL文档中心。
第2步:使用Python连接MySQL

使用Python连接MySQL很简单。关键得安装python的MySQLdb包。首先需要安装两项依赖:
 

shell> sudo apt-get install python-dev
shell> sudo apt-get install libmysqlclient-dev

然后安装Python的MySQLdb包:
 

shell> sudo pip install MySQL-python

现在,启动Python并导入MySQLdb。你可以在命令行或者IPython notebook中执行:
 

shell> python
>>> import MySQLdb

创建MySQL中world数据库的连接:
 

>>> conn = MySQLdb.connect(host="localhost", user="root", passwd="XXXX", db="world")

cursor是用来创建MySQL请求的对象。
 

>>> cursor = conn.cursor()

我们将在Country表中执行查询。
第3步:Python中执行MySQL查询

cursor对象使用MySQL查询字符串执行查询,返回一个包含多个元组的元组——每行对应一个元组。如果你刚接触MySQL语法和命令,在线的MySQL参考手册是一个很不错的学习资源。
 

>>> cursor.execute('select Name, Continent, Population, LifeExpectancy, GNP from Country');
>>> rows = cursor.fetchall()

rows,也就是查询的结果,是一个包含多个元组的元组,像下面这样:

利用Python绘制MySQL数据图实现数据可视化

使用Pandas的DataFrame来处理每一行要比使用一个包含元组的元组方便。下面的Python代码片段将所有行转化为DataFrame实例:
 

>>> import pandas as pd
>>> df = pd.DataFrame( [[ij for ij in i] for i in rows] )
>>> df.rename(columns={0: 'Name', 1: 'Continent', 2: 'Population', 3: 'LifeExpectancy', 4:'GNP'}, inplace=True);
>>> df = df.sort(['LifeExpectancy'], ascending=[1]);

完整的代码可以参见IPython notebook
第4步:使用Plotly绘制MySQL数据

现在,MySQL的数据存放在Pandas的DataFrame中,可以轻松地绘图。下面的代码用来绘制国家GNP(国民生产总值)VS平均寿命的图,鼠标悬停的点会显示国家名称。确保你已经下载了Plotly的Python库。如果没有,你可以参考一下它的入门指南。
 

import plotly.plotly as py
from plotly.graph_objs import *
 
trace1 = Scatter(
   x=df['LifeExpectancy'],
   y=df['GNP'],
   text=country_names,
   mode='markers'
)
layout = Layout(
   xaxis=XAxis( title='Life Expectancy' ),
   yaxis=YAxis( type='log', title='GNP' )
)
data = Data([trace1])
fig = Figure(data=data, layout=layout)
py.iplot(fig, filename='world GNP vs life expectancy')

完整的代码在这份IPython notebook中。下面是作为一个iframe嵌入的结果图:

利用Python绘制MySQL数据图实现数据可视化

利用Plotly的Python用户指南中的气泡图教程,我们可以用相同的MySQL数据绘制一幅气泡图,气泡大小表示人口的多少,气泡的颜色代表不同的大洲,鼠标悬停会显示国家名称。下面显示的是作为一个iframe嵌入的气泡图。

利用Python绘制MySQL数据图实现数据可视化

创建这个图表以及这个博客中的所有python代码都可以从这个IPython notebook中拷贝。

Python 相关文章推荐
Python获取服务器信息的最简单实现方法
Mar 05 Python
玩转python selenium鼠标键盘操作(ActionChains)
Apr 12 Python
Python cookbook(数据结构与算法)保存最后N个元素的方法
Feb 13 Python
python如何为被装饰的函数保留元数据
Mar 21 Python
利用Python将每日一句定时推送至微信的实现方法
Aug 13 Python
解决python中无法自动补全代码的问题
Dec 04 Python
pycharm 实现显示project 选项卡的方法
Jan 17 Python
基于python-opencv3的图像显示和保存操作
Jun 27 Python
python selenium 查找隐藏元素 自动播放视频功能
Jul 24 Python
Python产生一个数值范围内的不重复的随机数的实现方法
Aug 21 Python
Python实现钉钉订阅消息功能
Jan 14 Python
重构Python代码的六个实例
Nov 25 Python
Python面向对象编程中的类和对象学习教程
Mar 30 #Python
详细介绍Python函数中的默认参数
Mar 30 #Python
在Python中利用Into包整洁地进行数据迁移的教程
Mar 30 #Python
在Linux上安装Python的Flask框架和创建第一个app实例的教程
Mar 30 #Python
使用Python中PDB模块中的命令来调试Python代码的教程
Mar 30 #Python
深入讨论Python函数的参数的默认值所引发的问题的原因
Mar 30 #Python
使用Python标准库中的wave模块绘制乐谱的简单教程
Mar 30 #Python
You might like
粗略计算在线时间,bug:ip相同
2006/12/09 PHP
同台服务器使用缓存APC效率高于Memcached的演示代码
2010/02/16 PHP
PHP中几种常见的超时处理全面总结
2012/09/11 PHP
PHP将进程作为守护进程的方法
2015/03/19 PHP
php带抄送和密件抄送的邮件发送方法
2015/03/20 PHP
phpstudy默认不支持64位php的解决方法
2017/02/20 PHP
phpMyAdmin通过密码漏洞留后门文件
2018/11/20 PHP
YII2.0框架行为(Behavior)深入详解
2019/07/26 PHP
jquery中this的使用说明
2010/09/06 Javascript
分享一个自己动手写的jQuery分页插件
2014/08/28 Javascript
JavaScript中实现PHP的打乱数组函数shuffle实例
2014/10/11 Javascript
JavaScript中DOM详解
2015/04/13 Javascript
JavaScript中函数(Function)的apply与call理解
2015/07/08 Javascript
Vue精简版风格指南(推荐)
2018/01/30 Javascript
详解在vue-cli项目下简单使用mockjs模拟数据
2018/10/19 Javascript
浅谈Vue CLI 3结合Lerna进行UI框架设计
2019/04/14 Javascript
JavaScript字符串处理常见操作方法小结
2019/11/15 Javascript
微信小程序实现列表的横向滑动方式
2020/07/15 Javascript
[01:01:13]2018DOTA2亚洲邀请赛 4.5 淘汰赛 Mineski vs VG 第三场
2018/04/06 DOTA
[11:33]DAC2018 4.5SOLO赛决赛 MidOne vs Paparazi第二场
2018/04/06 DOTA
详解Python中open()函数指定文件打开方式的用法
2016/06/04 Python
python用户管理系统的实例讲解
2017/12/23 Python
python paramiko利用sftp上传目录到远程的实例
2019/01/03 Python
PyQt5组件读取参数的实例
2019/06/25 Python
对Python 中矩阵或者数组相减的法则详解
2019/08/26 Python
python图片指定区域替换img.paste函数的使用
2020/04/09 Python
html5 localStorage本地存储_动力节点Java学院整理
2017/07/06 HTML / CSS
英国布鲁姆精品店:Bloom Boutique
2018/03/01 全球购物
JAVA和C++区别都有哪些
2015/03/30 面试题
单位办理社保介绍信
2014/01/10 职场文书
党员违纪检讨书
2014/02/18 职场文书
授权委托书样本
2014/09/25 职场文书
考研复习计划
2015/01/19 职场文书
go语言中json数据的读取和写出操作
2021/04/28 Golang
进行数据处理的6个 Python 代码块分享
2022/04/06 Python
Mysql中的触发器定义及语法介绍
2022/06/25 MySQL