利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
深入解析Python中的lambda表达式的用法
Aug 28 Python
新手如何快速入门Python(菜鸟必看篇)
Jun 10 Python
Python+Django搭建自己的blog网站
Mar 13 Python
Python unittest 简单实现参数化的方法
Nov 30 Python
对Pytorch中nn.ModuleList 和 nn.Sequential详解
Aug 18 Python
python实现文件的分割与合并
Aug 29 Python
在pycharm中为项目导入anacodna环境的操作方法
Feb 12 Python
Python2 与Python3的版本区别实例分析
Mar 30 Python
Python如何根据时间序列数据作图
May 12 Python
Python语言编写智力问答小游戏功能
Oct 13 Python
python删除csv文件的行列
Apr 06 Python
python基础详解之if循环语句
Apr 24 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
PHP代码优化之成员变量获取速度对比
2014/02/28 PHP
PHP获取ip对应地区和使用网络类型的方法
2015/03/11 PHP
php之header的不同用法总结(实例讲解)
2017/11/28 PHP
laravel实现前后台路由分离的方法
2019/10/13 PHP
JavaScript入门教程(2) JS基础知识
2009/01/31 Javascript
js获取指定日期前后的日期代码
2013/08/20 Javascript
文本框回车提交与禁止提交示例
2013/09/27 Javascript
JavaScript简单实现鼠标拖动选择功能
2014/03/06 Javascript
jQuery的load()方法及其回调函数用法实例
2015/03/25 Javascript
jquery点击切换背景色的简单实例
2016/08/25 Javascript
vue使用stompjs实现mqtt消息推送通知
2017/06/22 Javascript
vue2.0s中eventBus实现兄弟组件通信的示例代码
2017/10/25 Javascript
vue 页面加载进度条组件实例
2018/02/05 Javascript
vuex actions传递多参数的处理方法
2018/09/18 Javascript
vue中使用axios post上传头像/图片并实时显示到页面的方法
2018/09/27 Javascript
Postman的下载及安装教程详解
2018/10/16 Javascript
在node中使用jwt签发与验证token的方法
2019/04/03 Javascript
微信小程序中限制激励式视频广告位显示次数(实现思路)
2019/12/06 Javascript
js中Function引用类型常见有用的方法和属性详解
2019/12/11 Javascript
微信小程序 scroll-view 实现锚点跳转功能
2019/12/12 Javascript
微信小程序轮播图swiper代码详解
2020/12/01 Javascript
vue+elementUI动态增加表单项并添加验证的代码详解
2020/12/17 Vue.js
[00:39]DOTA2上海特级锦标赛 Liquid战队宣传片
2016/03/04 DOTA
在Python的Django框架的视图中使用Session的方法
2015/07/23 Python
python字符串string的内置方法实例详解
2018/05/14 Python
在python中利用KNN实现对iris进行分类的方法
2018/12/11 Python
Python3实现的简单工资管理系统示例
2019/03/12 Python
tensorflow实现tensor中满足某一条件的数值取出组成新的tensor
2020/01/04 Python
python实现猜单词游戏
2020/05/22 Python
2014年就业工作总结
2014/11/26 职场文书
三十年同学聚会致辞
2015/07/28 职场文书
2019教师的学习计划
2019/06/25 职场文书
CocosCreator入门教程之网络通信
2021/04/16 Javascript
如何有效防止sql注入的方法
2021/05/25 SQL Server
吉利入股戴姆勒后smart“长大了”
2022/04/21 数码科技
MySQL中dd::columns表结构转table过程及应用详解
2022/09/23 MySQL