pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中装饰器的一个妙用
Feb 08 Python
python根据日期返回星期几的方法
Jul 06 Python
Flask框架Flask-Login用法分析
Jul 23 Python
使用python验证代理ip是否可用的实现方法
Jul 25 Python
python实现简单多人聊天室
Dec 11 Python
python3使用pandas获取股票数据的方法
Dec 22 Python
Python参数类型以及常见的坑详解
Jul 08 Python
python3 批量获取对应端口服务的实例
Jul 25 Python
python实现名片管理器的示例代码
Dec 17 Python
Python脚本导出为exe程序的方法
Mar 25 Python
pyecharts在数据可视化中的应用详解
Jun 08 Python
pytorch中index_select()的用法详解
Jan 06 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
PHP文件上传之多文件上传的实现思路
2016/01/27 PHP
JavaScript高级程序设计 读书笔记之八 Function类及闭包
2012/02/27 Javascript
JQuery实现简单时尚快捷的气泡提示插件
2012/12/20 Javascript
jQuery 浮动导航菜单适合购物商品类型的网站
2014/09/09 Javascript
jQuery如何防止这种冒泡事件发生
2015/02/27 Javascript
JavaScript定时显示广告代码分享
2015/03/02 Javascript
JavaScript中数组添加值和访问值常见问题
2016/02/06 Javascript
使用jQuery制作遮罩层弹出效果的极简实例分享
2016/05/12 Javascript
JS实现的RGB网页颜色在线取色器完整实例
2016/12/21 Javascript
React-Native做一个文本输入框组件的实现代码
2017/08/10 Javascript
在vue项目中安装使用Mint-UI的方法
2017/12/27 Javascript
详解如何webpack使用DllPlugin
2018/09/30 Javascript
JavaScript设计模式之命令模式实例分析
2019/01/16 Javascript
使用vue-router切换页面时实现设置过渡动画
2019/10/31 Javascript
小程序实现按下录音松开识别语音
2019/11/22 Javascript
easyUI使用分页过滤器对数据进行分页操作实例分析
2020/06/01 Javascript
python生成随机验证码(中文验证码)示例
2014/04/03 Python
Python THREADING模块中的JOIN()方法深入理解
2015/02/18 Python
wxPython中listbox用法实例详解
2015/06/01 Python
Python的Django框架中使用SQLAlchemy操作数据库的教程
2016/06/02 Python
python中的计时器timeit的使用方法
2017/10/20 Python
Python正则表达式和re库知识点总结
2019/02/11 Python
基于Python批量生成指定尺寸缩略图代码实例
2019/11/20 Python
德国童装购物网站:NICKI´S.com
2018/04/20 全球购物
Bibloo罗马尼亚网站:女装、男装、童装及鞋子和配饰
2019/07/20 全球购物
自荐信怎么写好
2013/11/11 职场文书
有多年工作经验的自我评价
2014/03/02 职场文书
群众路线党课主持词
2014/04/01 职场文书
年终奖发放方案
2014/06/02 职场文书
领导干部作风建设总结
2014/10/23 职场文书
幼儿园小班教师个人工作总结
2015/02/06 职场文书
销售开票员岗位职责
2015/04/15 职场文书
签证扫盲贴,41个常见签证知识,需要的拿走
2019/08/09 职场文书
用javascript制作qq注册动态页面
2021/04/14 Javascript
Python的三个重要函数详解
2022/01/18 Python
Python中使用Opencv开发停车位计数器功能
2022/04/04 Python