Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Windows系统配置python脚本开机启动的3种方法分享
Mar 10 Python
Python写的Tkinter程序屏幕居中方法
Mar 10 Python
Python2.7编程中SQLite3基本操作方法示例
Aug 09 Python
python+matplotlib实现动态绘制图片实例代码(交互式绘图)
Jan 20 Python
Python快速查找list中相同部分的方法
Jun 27 Python
python判断字符串或者集合是否为空的实例
Jan 23 Python
Python3使用PySynth制作音乐的方法
Sep 09 Python
python实现的汉诺塔算法示例
Oct 23 Python
PyTorch 对应点相乘、矩阵相乘实例
Dec 27 Python
Python利用FFT进行简单滤波的实现
Feb 26 Python
解决pip安装的第三方包在PyCharm无法导入的问题
Oct 15 Python
深度学习tensorflow基础mnist
Apr 14 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
PHP中的float类型使用说明
2010/07/27 PHP
Zend的AutoLoad机制介绍
2012/09/27 PHP
PHP实现的AES 128位加密算法示例
2019/09/16 PHP
javascript下阻止表单重复提交、防刷新、防后退
2007/08/17 Javascript
IE下双击checkbox反应延迟问题的解决方法
2014/03/27 Javascript
深入探讨javascript中的数据类型
2015/03/04 Javascript
javascript使用shift+click实现选择和反选checkbox的方法
2015/05/04 Javascript
JS实现可展开折叠层的鼠标拖曳效果
2015/10/09 Javascript
基于jquery实现瀑布流布局
2020/06/28 Javascript
D3.js实现直方图的方法详解
2016/09/25 Javascript
JS实现动态增加和删除li标签行的实例代码
2016/10/16 Javascript
巧用Vue.js+Vuex制作专门收藏微信公众号的app
2016/11/03 Javascript
JS判断输入的字符串是否是数字的方法(正则表达式)
2016/11/29 Javascript
jquery使用EasyUI Tree异步加载JSON数据(生成树)
2017/02/11 Javascript
vue组件 $children,$refs,$parent的使用详解
2017/07/31 Javascript
[02:53]DOTA2英雄基础教程 山岭巨人小小
2013/12/09 DOTA
Python程序设计入门(2)变量类型简介
2014/06/16 Python
自动化Nginx服务器的反向代理的配置方法
2015/06/28 Python
python学习笔记之调用eval函数出现invalid syntax错误问题
2015/10/18 Python
使用Python设计一个代码统计工具
2018/04/04 Python
python将.ppm格式图片转换成.jpg格式文件的方法
2018/10/27 Python
Python中栈、队列与优先级队列的实现方法
2019/06/30 Python
在PyCharm中控制台输出日志分层级分颜色显示的方法
2019/07/11 Python
Python Numpy 控制台完全输出ndarray的实现
2020/02/19 Python
python 线性回归分析模型检验标准--拟合优度详解
2020/02/24 Python
python小白切忌乱用表达式
2020/05/29 Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
2020/09/04 Python
CSS3制作炫酷的自定义发光文字
2016/03/28 HTML / CSS
HTML+CSS3+JS 实现的下拉菜单
2020/11/25 HTML / CSS
ECOSUSI官网:女式皮革背包
2019/09/27 全球购物
what is the difference between ext2 and ext3
2015/08/25 面试题
机电专业体育教师求职信
2013/09/21 职场文书
马云北大演讲完整版:真心话,什么才是阿里的核心竞争力?
2014/04/04 职场文书
分居协议书范本
2014/11/03 职场文书
教师群众路线心得体会
2014/11/04 职场文书
校园广播站开场白
2015/06/01 职场文书