python实现数据预处理之填充缺失值的示例


Posted in Python onDecember 22, 2017

1、给定一个数据集noise-data-1.txt,该数据集中保护大量的缺失值(空格、不完整值等)。利用“全局常量”、“均值或者中位数”来填充缺失值。

noise-data-1.txt:

5.1 3.5 1.4 0.2
4.9 3 1.4 0.2
4.7 3.2 1.3 0.2
4.6 3.1 1.5 0.2
5 3.6 1.4 0.2
5.4 3.9 1.7 0.4
4.6 3.4 1.4 0.3
5 3.4 1.5 0.2
4.4 2.9 1.4 0.2
4.9 -3.1 1.5 0.1
5.4 3.7 1.5 0.2
4.8 3.4 1.6 0.2
4.8 3 -1.4 0.1
4.3 3 1.1 0.1
5.8 4 1.2 0.2
5.7 4.4 1.5 0.4
5.4 3.9 1.3 0.4
5.1 3.5 1.4 0.3
5.7 3.8 1.7 0.3
5.1 3.8 -1.5 0.3
5.4 3.4 1.7 0.2
5.1 3.7 1.5 0.4
4.6 3.6 1 0.2
5.1 3.3 1.7 0.5
4.8 3.4 1.9 0.2

解题思路:首先读入数据,对数据进行处理,去掉空行,利用 “均值来填充缺失值,本题利用Python语言实现,代码如下:

import numpy as np
data = []
my_list = []
con=0
noise_data = open('noise-data-1.txt') 
clean_data = open("clean_data3.txt", 'w')
for line in noise_data.readlines():
 if len(line) == 0:
 break
 if line.count('\n') == len(line):
 continue 
 dataline =line.strip().split('\t')
 my_list.append(dataline)
 con+=1
for i in range(0,con):
 for j in range(0,len(my_list[i])):
 if my_list[i][j].count('.')==0:
  miss_row=[]
  for a in range(0,len(my_list[i])):
  if float(my_list[i][a])<0:
   miss_row.append(-float(my_list[i][a])) 
  miss_row.append(float(my_list[i][a])) 
  my_average=round(np.average(miss_row),1)
  my_list[i][j]=my_average
 else:
  if float(my_list[i][j])<0:
   my_list[i][j]=-float(my_list[i][j]) 
  my_list[i][j]=float(my_list[i][j]) 
print my_list
def file_write(filename,data_list):
 file1=open(filename,'w')
 for i in data_list:
 for j in i:
  if type(j)!=str:
  j=str(j)
  file1.write(j)
  file1.write(' ')
 file1.write('\n')
 file1.close()
 return file1
filename='clean_data.txt'
file_write(filename,my_list)

运行结果如下:

python实现数据预处理之填充缺失值的示例

以上这篇python实现数据预处理之填充缺失值的示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python计算回文数的方法
Mar 11 Python
Python回调函数用法实例详解
Jul 02 Python
对python中的for循环和range内置函数详解
Apr 17 Python
python 常用的基础函数
Jul 10 Python
python3对拉勾数据进行可视化分析的方法详解
Apr 03 Python
Pycharm 2019 破解激活方法图文详解
Oct 11 Python
tensorflow没有output结点,存储成pb文件的例子
Jan 04 Python
keras获得model中某一层的某一个Tensor的输出维度教程
Jan 24 Python
Pyecharts 动态地图 geo()和map()的安装与用法详解
Mar 25 Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 Python
只用40行Python代码就能写出pdf转word小工具
May 31 Python
Python合并pdf文件的工具
Jul 01 Python
NetworkX之Prim算法(实例讲解)
Dec 22 #Python
Python实现控制台中的进度条功能代码
Dec 22 #Python
Python中的探索性数据分析(功能式)
Dec 22 #Python
Python反射用法实例简析
Dec 22 #Python
Python文本特征抽取与向量化算法学习
Dec 22 #Python
用Python实现KNN分类算法
Dec 22 #Python
Python数据拟合与广义线性回归算法学习
Dec 22 #Python
You might like
我的论坛源代码(三)
2006/10/09 PHP
实用的PHP带公钥加密类分享(每次加密结果都不一样哦)
2014/08/20 PHP
PHP5全版本绕过open_basedir读文件脚本漏洞详细介绍
2015/01/20 PHP
php中ob_flush函数和flush函数用法分析
2015/03/18 PHP
详解PHP5.6.30与Apache2.4.x配置
2017/06/02 PHP
TP5框架实现一次选择多张图片并预览的方法示例
2020/04/04 PHP
浮动的div自适应居中显示的js代码
2013/12/23 Javascript
jquery的trigger和triggerHandler的区别示例介绍
2014/04/20 Javascript
js 获取时间间隔实现代码
2014/05/12 Javascript
js判断日期时间有效性的方法
2015/10/24 Javascript
javascript:void(0)是什么意思及href=#与href=javascriptvoid(0)的区别
2015/11/13 Javascript
JS添加删除DIV的简单实例
2016/07/08 Javascript
jQuery动态增减行的实例代码解析(推荐)
2016/12/05 Javascript
详解Jquery 遍历数组之$().each方法与$.each()方法介绍
2017/01/09 Javascript
jq stop()和:is(:animated)的用法及区别(详解)
2017/02/12 Javascript
Boostrap栅格系统与自己额外定义的媒体查询的冲突问题
2017/02/19 Javascript
深入理解Angularjs中$http.post与$.post
2017/05/19 Javascript
JavaScript数据结构之栈实例用法
2019/01/18 Javascript
微信小程序实现简易table表格
2020/06/19 Javascript
JavaScript ECMA-262-3 深入解析(一):执行上下文实例分析
2020/04/25 Javascript
Python远程桌面协议RDPY安装使用介绍
2015/04/15 Python
python中通过预先编译正则表达式提高效率
2017/09/25 Python
Django项目中用JS实现加载子页面并传值的方法
2018/05/28 Python
Python 3.8 新功能全解
2019/07/25 Python
django xadmin 管理器常用显示设置方式
2020/03/11 Python
Django多层嵌套ManyToMany字段ORM操作详解
2020/05/19 Python
荷兰男士时尚网上商店:Suitable
2017/12/25 全球购物
美国正宗设计师眼镜在线零售商:EYEZZ
2019/03/23 全球购物
解释一下Windows的消息机制
2014/01/30 面试题
担保书格式
2015/01/20 职场文书
阳光体育运动标语口号
2015/12/26 职场文书
2019年度行政文员工作计划范本!
2019/07/04 职场文书
python使用openpyxl库读写Excel表格的方法(增删改查操作)
2021/05/02 Python
python 实现两个变量值进行交换的n种操作
2021/06/02 Python
详解Python+OpenCV进行基础的图像操作
2022/02/15 Python
Linux下使用C语言代码搭建一个简单的HTTP服务器
2022/04/13 Servers