Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中实现的RC4算法
Feb 14 Python
深入理解Python中的内置常量
May 20 Python
python 3.6.5 安装配置方法图文教程
Sep 18 Python
Python 带有参数的装饰器实例代码详解
Dec 06 Python
django中ORM模型常用的字段的使用方法
Mar 05 Python
PyQT实现菜单中的复制,全选和清空的功能的方法
Jun 17 Python
Django REST Framework序列化外键获取外键的值方法
Jul 26 Python
Python Django Cookie 简单用法解析
Aug 13 Python
Python3 main函数使用sys.argv传入多个参数的实现
Dec 25 Python
python 解决selenium 中的 .clear()方法失效问题
Sep 01 Python
JupyterNotebook 输出窗口的显示效果调整实现
Sep 22 Python
浅析python连接数据库的重要事项
Feb 22 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
php5.2时间相差8小时
2007/01/15 PHP
php中sprintf与printf函数用法区别解析
2014/02/17 PHP
PHP echo()函数讲解
2019/02/15 PHP
Laravel 实现数据软删除功能
2019/08/21 PHP
js replace 与replaceall实例用法详解
2013/08/03 Javascript
JavaScript实现文字与图片拖拽效果的方法
2015/02/16 Javascript
js实现跟随鼠标移动且带关闭功能的图片广告实例
2015/02/26 Javascript
基于Jquery实现表单验证
2020/07/20 Javascript
JavaScript函数中关于valueOf和toString的理解
2016/06/14 Javascript
JavaScript中undefined和null的区别
2017/05/03 Javascript
深究AngularJS如何获取input的焦点(自定义指令)
2017/06/12 Javascript
vue-cli项目中怎么使用mock数据
2017/09/27 Javascript
vue如何通过id从列表页跳转到对应的详情页
2018/05/01 Javascript
js屏蔽退格键(backspace或者叫后退键与F5)
2019/02/10 Javascript
vue-cli3环境变量与分环境打包的方法示例
2019/02/18 Javascript
利用Vconsole和Fillder进行移动端抓包调试方法
2019/03/05 Javascript
微信小程序的mpvue框架快速上手指南
2019/05/15 Javascript
[01:05:24]Ti4 冒泡赛第二天 iG vs NEWBEE 3
2014/07/15 DOTA
MAC中PyCharm设置python3解释器
2017/12/15 Python
python生成圆形图片的方法
2020/03/25 Python
Python设计模式之简单工厂模式实例详解
2019/01/22 Python
Python中断多重循环的思路总结
2019/10/04 Python
pycharm中如何自定义设置通过“ctrl+滚轮”进行放大和缩小实现方法
2020/09/16 Python
Python 按比例获取样本数据或执行任务的实现代码
2020/12/03 Python
激光脱毛、蓝光和护肤:Tria Beauty
2019/03/28 全球购物
会计专业应届生自荐信
2014/02/07 职场文书
人民教师的自我评价分享
2014/02/21 职场文书
旅游管理毕业生自荐信范文
2014/03/19 职场文书
小学校本培训方案
2014/06/06 职场文书
纪检干部对照检查材料
2014/08/22 职场文书
政风行风评议心得体会
2014/10/21 职场文书
2014年学生会工作总结范文
2014/11/07 职场文书
房产公证书
2015/01/23 职场文书
公务员年终个人总结
2015/02/12 职场文书
2015年世界环境日活动方案
2015/05/05 职场文书
2015年街道除四害工作总结
2015/05/15 职场文书