Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之Import 模块
Oct 13 Python
简化Python的Django框架代码的一些示例
Apr 20 Python
基于python yield机制的异步操作同步化编程模型
Mar 18 Python
Python 实现 贪吃蛇大作战 代码分享
Sep 07 Python
python matlibplot绘制3D图形
Jul 02 Python
python实现文件助手中查看微信撤回消息
Apr 29 Python
python opencv实现证件照换底功能
Aug 19 Python
python实现猜拳游戏
Mar 04 Python
OpenCV Python实现拼图小游戏
Mar 23 Python
Selenium向iframe富文本框输入内容过程图解
Apr 10 Python
Python实现UDP程序通信过程图解
May 15 Python
Python可变集合和不可变集合的构造方法大全
Dec 06 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
PHP 截取字符串函数整理(支持gb2312和utf-8)
2010/02/16 PHP
PHP __autoload()方法真的影响性能吗?
2012/03/30 PHP
Symfony2创建页面实例详解
2016/03/18 PHP
学习ExtJS 访问容器对象
2009/10/07 Javascript
javascript 学习笔记(八)javascript对象
2011/04/12 Javascript
JS实现黑客帝国文字下落效果
2015/09/01 Javascript
原生JS实现美图瀑布流布局赏析
2015/09/07 Javascript
详解JavaScript正则表达式之分组匹配及反向引用
2016/03/09 Javascript
NodeJS整合银联网关支付(DEMO)
2016/11/09 NodeJs
利用JS屏蔽页面中的Enter按键提交表单的方法
2016/11/25 Javascript
从零学习node.js之模块规范(一)
2017/02/21 Javascript
使用JavaScript进行表单校验功能
2017/08/01 Javascript
python爬取安居客二手房网站数据(实例讲解)
2017/10/19 Javascript
Vue自定义toast组件的实例代码
2018/08/15 Javascript
element-ui tooltip修改背景颜色和箭头颜色的实现
2019/12/16 Javascript
[04:31]2016国际邀请赛中国区预选赛妖精采访
2016/06/27 DOTA
python 不以科学计数法输出的方法
2018/07/16 Python
Python使用pymysql从MySQL数据库中读出数据的方法
2018/07/25 Python
Windows 8.1 64bit下搭建 Scrapy 0.22 环境
2018/11/18 Python
django中上传图片分页三级联动效果的实现代码
2019/08/30 Python
Python基于time模块表示时间常用方法
2020/06/18 Python
python操作微信自动发消息的实现(微信聊天机器人)
2020/07/14 Python
详解CSS3浏览器兼容
2016/12/14 HTML / CSS
UNIONBAY官网:美国青少年服装品牌
2019/03/26 全球购物
介绍一下Python中webbrowser的用法
2013/05/07 面试题
大学生专科毕业生自我评价
2013/11/17 职场文书
家长给老师的道歉信
2014/01/13 职场文书
人力资源管理专业求职信
2014/07/23 职场文书
2014年军人思想汇报范文
2014/10/12 职场文书
教师师德表现自我评价
2015/03/05 职场文书
哈姆雷特读书笔记
2015/06/29 职场文书
初中政治教学反思
2016/02/23 职场文书
python3 sqlite3限制条件查询的操作
2021/04/07 Python
python之json文件转xml文件案例讲解
2021/08/07 Python
基于Python实现射击小游戏的制作
2022/04/06 Python
Elasticsearch6.2服务器升配后的bug(避坑指南)
2022/09/23 Servers