pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python自动化测试实例解析
Sep 28 Python
在Python的Django框架中包装视图函数
Jul 20 Python
python中利用xml.dom模块解析xml的方法教程
May 24 Python
Python 查看文件的读写权限方法
Jan 23 Python
python实现聊天小程序
Mar 13 Python
利用Python实现在同一网络中的本地文件共享方法
Jun 04 Python
python中的tcp示例详解
Dec 09 Python
基于python if 判断选择结构的实例详解
May 06 Python
Python坐标线性插值应用实现
Nov 13 Python
PyQt5多线程刷新界面防假死示例
Dec 13 Python
Pytorch之contiguous的用法
Dec 31 Python
Selenium Webdriver元素定位的八种常用方式(小结)
Jan 13 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
MySQL授权问题总结
2007/05/06 PHP
php中hashtable实现示例分享
2014/02/13 PHP
php检查是否是ajax请求的方法
2015/04/16 PHP
PHP的Yii框架中行为的定义与绑定方法讲解
2016/03/18 PHP
Laravel4中的Validator验证扩展用法详解
2016/07/26 PHP
php实现将base64格式图片保存在指定目录的方法
2016/10/13 PHP
php获取微信基础接口凭证Access_token
2018/08/23 PHP
通过身份证号得到出生日期和性别的js代码
2009/11/23 Javascript
JavaScript 拾碎[三] 使用className属性
2010/10/16 Javascript
javascript运行机制之this详细介绍
2014/02/07 Javascript
js中confirm实现执行操作前弹出确认框的方法
2014/11/01 Javascript
JS实现重新加载当前页面或者父页面的几种方法
2016/11/30 Javascript
js实现放大镜特效
2017/05/18 Javascript
jquery插件开发之选项卡制作详解
2017/08/30 jQuery
vue如何解决循环引用组件报错的问题
2018/09/22 Javascript
js module大战
2019/04/19 Javascript
详解Vue2.5+迁移至Typescript指南
2019/08/01 Javascript
在vue中使用jsx语法的使用方法
2019/09/30 Javascript
vue如何在项目中调用腾讯云的滑动验证码
2020/07/15 Javascript
vant 自定义 van-dropdown-item的用法
2020/08/05 Javascript
[05:02][DOTA2]DOTA进化论 第一期
2013/09/27 DOTA
python实现异步回调机制代码分享
2014/01/10 Python
flask中主动抛出异常及统一异常处理代码示例
2018/01/18 Python
Python批处理删除和重命名文件夹的实例
2018/07/11 Python
python2 与 pyhton3的输入语句写法小结
2018/09/10 Python
解决安装python库时windows error5 报错的问题
2018/10/21 Python
对python 多线程中的守护线程与join的用法详解
2019/02/18 Python
python应用文件读取与登录注册功能
2019/09/23 Python
python、Matlab求定积分的实现
2019/11/20 Python
python输入一个水仙花数(三位数) 输出百位十位个位实例
2020/05/03 Python
HTML5实现的图片无限加载的瀑布流效果另带边框圆角阴影
2014/03/07 HTML / CSS
会走动的图形html5时钟示例
2014/04/27 HTML / CSS
春节联欢会主持词
2014/03/24 职场文书
个性车贴标语
2014/06/24 职场文书
4s店销售经理岗位职责
2014/07/19 职场文书
SQL实现LeetCode(196.删除重复邮箱)
2021/08/07 MySQL