pandas factorize实现将字符串特征转化为数字特征


Posted in Python onDecember 19, 2019

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

pandas factorize实现将字符串特征转化为数字特征

都是字符串特征,无法用于训练,当然可以单独建立map硬编码处理,但是pandas已经封装好了相应的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

pandas factorize实现将字符串特征转化为数字特征

以上这篇pandas factorize实现将字符串特征转化为数字特征就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python正则表达式中的括号匹配问题
Dec 14 Python
状态机的概念和在Python下使用状态机的教程
Apr 11 Python
Python生成器(Generator)详解
Apr 13 Python
Python的CGIHTTPServer交互实现详解
Feb 08 Python
通过Python 接口使用OpenCV的方法
Apr 02 Python
删除DataFrame中值全为NaN或者包含有NaN的列或行方法
Nov 06 Python
Python中zip()函数的简单用法举例
Sep 02 Python
python中的TCP(传输控制协议)用法实例分析
Nov 15 Python
python的range和linspace使用详解
Nov 27 Python
详解python中的三种命令行模块(sys.argv,argparse,click)
Dec 15 Python
Python爬虫之爬取二手房信息
Apr 27 Python
python中pandas对多列进行分组统计的实现
Jun 18 Python
Python 解决OPEN读文件报错 ,路径以及r的问题
Dec 19 #Python
简单了解Python3 bytes和str类型的区别和联系
Dec 19 #Python
Python监控服务器实用工具psutil使用解析
Dec 19 #Python
Python使用pymysql模块操作mysql增删改查实例分析
Dec 19 #Python
python 普通克里金(Kriging)法的实现
Dec 19 #Python
Python函数参数类型及排序原理总结
Dec 19 #Python
python中with语句结合上下文管理器操作详解
Dec 19 #Python
You might like
memcached 和 mysql 主从环境下php开发代码详解
2010/05/16 PHP
深入file_get_contents与curl函数的详解
2013/06/25 PHP
如何让搜索引擎抓取AJAX内容解决方案
2014/08/25 PHP
Laravel中Facade的加载过程与原理详解
2017/09/22 PHP
js 格式化时间日期函数小结
2010/03/20 Javascript
Javascript 检测键盘按键信息及键码值对应介绍
2013/01/03 Javascript
AngularJS初始化过程分析(引导程序)
2014/12/06 Javascript
使用Raygun来自动追踪AngularJS中的异常
2015/06/23 Javascript
jQuery实现简易的天天爱消除小游戏
2015/10/16 Javascript
node.js插件nodeclipse安装图文教程
2020/10/19 Javascript
JavaScript数据操作_浅谈原始值和引用值的操作本质
2016/08/23 Javascript
JavaScript实现简单的双色球(实例讲解)
2017/07/31 Javascript
js实现动态添加上传文件页面
2018/10/22 Javascript
element vue Array数组和Map对象的添加与删除操作
2018/11/14 Javascript
laypage+SpringMVC实现后端分页
2019/07/27 Javascript
JS实现的雪花飘落特效示例
2019/12/03 Javascript
[08:44]和酒神一起战斗 DOTA2教你做大人
2014/03/27 DOTA
[05:15]2018年度CS GO社区贡献奖-完美盛典
2018/12/16 DOTA
记一次python 内存泄漏问题及解决过程
2018/11/29 Python
解决python3 requests headers参数不能有中文的问题
2019/08/21 Python
Python中os模块功能与用法详解
2020/02/26 Python
简单了解如何封装自己的Python包
2020/07/08 Python
利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)
2020/09/04 Python
远程Wi-Fi宠物监控相机:Petcube
2017/04/26 全球购物
Joules美国官网:出色的英国风格
2017/10/30 全球购物
英国时尚运动品牌的合集:The Sports Edit
2017/12/20 全球购物
高中军训广播稿
2014/01/14 职场文书
高中自我评价范文
2014/01/27 职场文书
中文专业毕业生自荐信
2014/05/24 职场文书
企业群众路线教育实践活动心得体会
2014/11/03 职场文书
农民工工资保障承诺书
2015/05/04 职场文书
老公写给老婆的检讨书
2015/05/06 职场文书
科级干部培训心得体会
2016/01/06 职场文书
高中诗歌鉴赏教学反思
2016/02/16 职场文书
会议主持词通用版
2019/04/02 职场文书
SQL Server使用PIVOT与unPIVOT实现行列转换
2022/05/25 SQL Server