利用Python进行数据可视化常见的9种方法!超实用!


Posted in Python onJuly 11, 2018

前言

如同艺术家们用绘画让人们更贴切的感知世界,数据可视化也能让人们更直观的传递数据所要表达的信息。

我们今天就分享一下如何用 Python 简单便捷的完成数据可视化。

其实利用 Python 可视化数据并不是很麻烦,因为 Python 中有两个专用于可视化的库 matplotlib 和 seaborn 能让我们很容易的完成任务。

  • Matplotlib:基于Python的绘图库,提供完全的 2D 支持和部分 3D 图像支持。在跨平台和互动式环境中生成高质量数据时,matplotlib 会很有帮助。也可以用作制作动画。
  • Seaborn:该 Python 库能够创建富含信息量和美观的统计图形。Seaborn 基于 matplotlib,具有多种特性,比如内置主题、调色板、可以可视化单变量数据、双变量数据,线性回归数据和数据矩阵以及统计型时序数据等,能让我们创建复杂的可视化图形。

我们用 Python 可以做出哪些可视化图形?

那么这里可能有人就要问了,我们为什么要做数据可视化?比如有下面这个图表:

利用Python进行数据可视化常见的9种方法!超实用!

当然如果你把这张图表丢给别人,他们倒是也能看懂,但无法很直观的理解其中的信息,而且这种形式的图表看上去也比较 low,这个时候我们如果换成直观又美观的可视化图形,不仅能突显逼格,也能让人更容易的看懂数据。

下面我们就用上面这个简单的数据集作为例子,展示用 Python 做出9种可视化效果,并附有相关代码。

导入数据集

import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_excel("E:/First.xlsx", "Sheet1")

可视化为直方图

fig=plt.figure() #Plots in matplotlib reside within a figure object, use plt.figure to create new figure
#Create one or more subplots using add_subplot, because you can't create blank figure
ax = fig.add_subplot(1,1,1)
#Variable
ax.hist(df['Age'],bins = 7) # Here you can play with number of bins
Labels and Tit
plt.title('Age distribution')
plt.xlabel('Age')
plt.ylabel('#Employee')
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为箱线图

import matplotlib.pyplot as plt
import pandas as pd
fig=plt.figure()
ax = fig.add_subplot(1,1,1)
#Variable
ax.boxplot(df['Age'])
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为小提琴图

import seaborn as sns 
sns.violinplot(df['Age'], df['Gender']) #Variable Plot
sns.despine()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为条形图

var = df.groupby('Gender').Sales.sum() #grouped sum of sales at Gender level
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('Gender')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("Gender wise Sum of Sales")
var.plot(kind='bar')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为折线图

var = df.groupby('BMI').Sales.sum()
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('BMI')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("BMI wise Sum of Sales")
var.plot(kind='line')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为堆叠柱状图

var = df.groupby(['BMI','Gender']).Sales.sum()
var.unstack().plot(kind='bar',stacked=True, color=['red','blue'], grid=False)

利用Python进行数据可视化常见的9种方法!超实用!

可视化为散点图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales']) #You can also add more variables here to represent color and size.
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为泡泡图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales'], s=df['Income']) # Added third variable income as size of the bubble
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为饼状图

var=df.groupby(['Gender']).sum().stack()
temp=var.unstack()
type(temp)
x_list = temp['Sales']
label_list = temp.index
pyplot.axis("equal") #The pie chart is oval by default. To make it a circle use pyplot.axis("equal")
#To show the percentage of each pie slice, pass an output format to the autopctparameter 
plt.pie(x_list,labels=label_list,autopct="%1.1f%%") 
plt.title("Pastafarianism expenses")
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为热度图

import numpy as np
#Generate a random number, you can refer your data values also
data = np.random.rand(4,2)
rows = list('1234') #rows categories
columns = list('MF') #column categories
fig,ax=plt.subplots()
#Advance color controls
ax.pcolor(data,cmap=plt.cm.Reds,edgecolors='k')
ax.set_xticks(np.arange(0,2)+0.5)
ax.set_yticks(np.arange(0,4)+0.5)
# Here we position the tick labels for x and y axis
ax.xaxis.tick_bottom()
ax.yaxis.tick_left()
#Values against each labels
ax.set_xticklabels(columns,minor=False,fontsize=20)
ax.set_yticklabels(rows,minor=False,fontsize=20)
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

你也可以自己试着根据两个变量比如性别(X 轴)和 BMI(Y 轴)绘出热度图。

结语

本文我们分享了如何利用 Python 及 matplotlib 和 seaborn 库制作出多种多样的可视化图形。通过上面的例子,我们应该可以感受到利用可视化能多么美丽的展示数据。而且和其它语言相比,使用 Python 进行可视化更容易简便一些。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

参考资料:

https://www.analyticsvidhya.com/blog/2015/05/data-visualization-python/

Python 相关文章推荐
设计模式中的原型模式在Python程序中的应用示例
Mar 02 Python
Python对文件和目录进行操作的方法(file对象/os/os.path/shutil 模块)
May 08 Python
基于Linux系统中python matplotlib画图的中文显示问题的解决方法
Jun 15 Python
itchat接口使用示例
Oct 23 Python
Django中URL的参数传递的实现
Aug 04 Python
python 队列基本定义与使用方法【初始化、赋值、判断等】
Oct 24 Python
python使用itchat模块给心爱的人每天发天气预报
Nov 25 Python
基于TensorFlow常量、序列以及随机值生成实例
Jan 04 Python
基于Tensorflow:CPU性能分析
Feb 10 Python
python实现Oracle查询分组的方法示例
Apr 30 Python
Python flask框架如何显示图像到web页面
Jun 03 Python
Django与数据库交互的实现
Jun 03 Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
You might like
Wordpress php 分页代码
2009/10/21 PHP
php快递单号查询接口使用示例
2014/05/05 PHP
php判断访问IP的方法
2015/06/19 PHP
PHP身份证校验码计算方法
2016/08/10 PHP
PHP获取本周所有日期或者最近七天所有日期的方法
2018/06/20 PHP
JavaScript 实现??打印?理
2007/04/28 Javascript
JavaScript 参数中的数组展开 [译]
2012/09/21 Javascript
JS 修改URL参数(实现代码)
2013/07/08 Javascript
解析JSON对象与字符串之间的相互转换
2013/12/18 Javascript
jQuery打印指定区域Html页面并自动分页
2014/07/04 Javascript
js鼠标点击图片实现随机变换图片的方法
2015/02/16 Javascript
JS简单实现多级Select联动菜单效果代码
2015/09/06 Javascript
jQuery实现form表单元素序列化为json对象的方法
2015/12/09 Javascript
JavaScript类型系统之基本数据类型与包装类型
2016/01/06 Javascript
jQuery中on绑定事件后引发的事件冒泡问题如何解决
2016/05/25 Javascript
JavaScript数据存储 Cookie篇
2016/07/02 Javascript
layui 数据表格+分页+搜索+checkbox+缓存选中项数据的方法
2019/09/21 Javascript
node省市区三级数据性能测评实例分析
2019/11/06 Javascript
typescript编写微信小程序创建项目的方法
2021/01/29 Javascript
小结Python用fork来创建子进程注意事项
2014/07/03 Python
Python导入txt数据到mysql的方法
2015/04/08 Python
python实现彩票系统
2020/06/28 Python
python将.ppm格式图片转换成.jpg格式文件的方法
2018/10/27 Python
对Python 简单串口收发GUI界面的实例详解
2019/06/12 Python
python应用文件读取与登录注册功能
2019/09/23 Python
TENSORFLOW变量作用域(VARIABLE SCOPE)
2020/01/10 Python
matplotlib quiver箭图绘制案例
2020/04/17 Python
零基础小白多久能学会python
2020/06/22 Python
python3.5的包存放的具体路径
2020/08/16 Python
物业经理求职自我评价
2013/09/22 职场文书
创伤外科专业推荐信范文
2013/11/19 职场文书
运动会800米加油稿
2014/02/22 职场文书
售后服务承诺书怎么写
2014/05/21 职场文书
诚信承诺书
2015/01/19 职场文书
广播体操比赛主持词
2015/06/29 职场文书
Java数据结构之堆(优先队列)
2022/05/20 Java/Android