基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python daemon守护进程实现
Aug 27 Python
Python用zip函数同时遍历多个迭代器示例详解
Nov 14 Python
flask框架实现连接sqlite3数据库的方法分析
Jul 16 Python
python for 循环获取index索引的方法
Feb 01 Python
Python 学习教程之networkx
Apr 15 Python
python调用摄像头拍摄数据集
Jun 01 Python
python实现列表的排序方法分享
Jul 01 Python
python使用多线程编写tcp客户端程序
Sep 02 Python
python内置函数sorted()用法深入分析
Oct 08 Python
python numpy 矩阵堆叠实例
Jan 17 Python
python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例
Mar 06 Python
微信小程序调用python模型
Apr 21 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
亲密接触PHP之PHP语法学习笔记1
2006/12/17 PHP
PHP备份/还原MySQL数据库的代码
2011/01/06 PHP
分析PHP中单双引号的误区和双引号小隐患
2016/07/19 PHP
PHP弱类型的安全问题详细总结
2016/09/25 PHP
PHP培训要多少钱
2017/06/06 PHP
laravel migrate初学常见错误的解决方法
2017/10/11 PHP
浅析PHP中的 inet_pton 网络函数
2019/12/16 PHP
PHP 超级全局变量相关总结
2020/06/30 PHP
用apply让javascript函数仅执行一次的代码
2010/06/27 Javascript
EXTJS FORM HIDDEN TEXTFIELD 赋值 使用value不好用的问题
2011/04/16 Javascript
javascript SpiderMonkey中的函数序列化如何进行
2012/12/05 Javascript
jquery实现简单的二级导航下拉菜单效果
2015/09/07 Javascript
jQuery网页右侧广告跟随滚动代码分享
2020/04/20 Javascript
Angular1.x复杂指令实例详解
2017/03/01 Javascript
jQuery Position方法使用和兼容性
2017/08/23 jQuery
Vue使用json-server进行后端数据模拟功能
2018/04/17 Javascript
Vue入门之数量加减运算操作示例
2018/12/11 Javascript
使用vue打包进行云服务器上传的问题
2020/03/02 Javascript
Linux CentOS7下安装python3 的方法
2018/01/21 Python
python使用sqlite3时游标使用方法
2018/03/13 Python
Python把csv数据写入list和字典类型的变量脚本方法
2018/06/15 Python
Laravel+Dingo/Api 自定义响应的实现
2019/02/17 Python
Python通过Manager方式实现多个无关联进程共享数据的实现
2019/11/07 Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
2019/11/16 Python
Python如何实现大型数组运算(使用NumPy)
2020/07/24 Python
matplotlib相关系统目录获取方式小结
2021/02/03 Python
HTML5 Web存储方式的localStorage和sessionStorage进行数据本地存储案例应用
2012/12/09 HTML / CSS
吃透移动端 Html5 响应式布局
2019/12/16 HTML / CSS
理肤泉俄罗斯官网:La Roche-Posay俄罗斯
2018/07/24 全球购物
Java如何格式化日期
2012/08/07 面试题
保护环境倡议书500字
2014/05/19 职场文书
诚信承诺书模板
2014/05/26 职场文书
2014年志愿者工作总结
2014/11/20 职场文书
学习与创新自我评价
2015/03/09 职场文书
告知书格式
2015/07/01 职场文书
Redis RDB技术底层原理详解
2021/09/04 Redis