利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现目录树生成示例
Mar 28 Python
Python import自定义模块方法
Feb 12 Python
python运行时间的几种方法
Jun 17 Python
Python如何快速上手? 快速掌握一门新语言的方法
Nov 14 Python
Python Tkinter模块实现时钟功能应用示例
Jul 23 Python
用python 实现在不确定行数情况下多行输入方法
Jan 28 Python
Python面向对象程序设计中类的定义、实例化、封装及私有变量/方法详解
Feb 28 Python
python opencv 读取图片 返回图片某像素点的b,g,r值的实现方法
Jul 03 Python
Django的CVB实例详解
Feb 10 Python
Python3监控疫情的完整代码
Feb 20 Python
自定义实现 PyQt5 下拉复选框 ComboCheckBox的完整代码
Mar 30 Python
python 元组的使用方法
Jun 09 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
PHP定时执行计划任务的多种方法小结
2011/12/19 PHP
php编写的简单页面跳转功能实现代码
2013/11/27 PHP
解决Laravel5.2 Auth认证退出失效的问题
2019/10/14 PHP
ajax更新数据后,jquery、jq失效问题
2011/03/16 Javascript
跨浏览器通用、可重用的选项卡tab切换js代码
2011/09/20 Javascript
JSON辅助格式化处理方法
2013/03/26 Javascript
js removeChild 方法深入理解
2016/08/16 Javascript
JavaScript每天必学之基础知识
2016/09/17 Javascript
JavaScript中setTimeout的那些事儿
2016/11/14 Javascript
JS高级运动实例分析
2016/12/20 Javascript
jQuery图片切换动画效果
2017/02/28 Javascript
vue2.0获取自定义属性的值
2017/03/28 Javascript
thinkjs 文件上传功能实例代码
2017/11/08 Javascript
详解webpack提取第三方库的正确姿势
2017/12/22 Javascript
简单谈谈CommonsChunkPlugin抽取公共模块
2017/12/31 Javascript
vue 使用vue-i18n做全局中英文切换的方法
2018/10/29 Javascript
Vue-cli3.X使用px2 rem遇到的问题及解决方法
2019/08/08 Javascript
如何使用50行javaScript代码实现简单版的call,apply,bind
2019/08/14 Javascript
jQuery实现的移动端图片缩放功能组件示例
2020/05/01 jQuery
python提取页面内url列表的方法
2015/05/25 Python
python如何实现远程控制电脑(结合微信)
2015/12/21 Python
Random 在 Python 中的使用方法
2018/08/09 Python
Django错误:TypeError at / 'bool' object is not callable解决
2019/08/16 Python
Python&&GDAL实现NDVI的计算方式
2020/01/09 Python
如何在网站上添加谷歌定位信息
2016/04/16 HTML / CSS
把富文本的回车转为br标签
2019/08/09 HTML / CSS
突袭HTML5之Javascript API扩展2—地理信息服务及地理位置API学习
2013/01/31 HTML / CSS
美国宠物护理专家:Revival Animal Health
2020/01/05 全球购物
C#面试常见问题
2013/02/25 面试题
信息合作协议书
2014/10/09 职场文书
办公室主任个人对照检查材料思想汇报
2014/10/11 职场文书
优秀班主任材料
2014/12/16 职场文书
酒店工程部主管岗位职责
2015/04/16 职场文书
党员公开承诺书2016
2016/03/24 职场文书
2019学校请假条格式及范文
2019/06/25 职场文书
nginx处理http请求实现过程解析
2021/03/31 Servers