对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Socket编程过程中实现UDP端口复用的实例分享
Mar 19 Python
python3.6 +tkinter GUI编程 实现界面化的文本处理工具(推荐)
Dec 20 Python
数组保存为txt, npy, csv 文件, 数组遍历enumerate的方法
Jul 09 Python
使用Python实现一个栈判断括号是否平衡
Aug 23 Python
Python实现的列表排序、反转操作示例
Mar 13 Python
python3使用matplotlib绘制散点图
Mar 19 Python
Python 离线工作环境搭建的方法步骤
Jul 29 Python
详细介绍Python进度条tqdm的使用
Jul 31 Python
Python使用百度翻译开发平台实现英文翻译为中文功能示例
Aug 08 Python
使用Keras建立模型并训练等一系列操作方式
Jul 02 Python
Python之qq自动发消息的示例代码
Feb 18 Python
Python 恐龙跑跑小游戏实现流程
Feb 15 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
做了CDN获取用户真实IP的函数代码(PHP与Asp设置方式)
2013/04/13 PHP
解析PHP跨站刷票的实现代码
2013/06/18 PHP
解析PHP中DIRECTORY_SEPARATOR,PATH_SEPARATOR两个常量的作用
2013/06/21 PHP
用JavaScript和注册表脚本实现右键收藏Web页选中文本
2007/01/28 Javascript
javascript void(0)的妙用
2009/10/21 Javascript
JQuery的Alert消息框插件使用介绍
2010/10/09 Javascript
javascript getElementsByTagName
2011/01/31 Javascript
javascript学习笔记(四) Number 数字类型
2012/06/19 Javascript
js返回前一页刷新本页重载页面
2014/07/29 Javascript
JavaScript实现从数组中选出和等于固定值的n个数
2014/09/03 Javascript
原生javascript实现获取指定元素下所有后代元素的方法
2014/10/28 Javascript
angular中使用路由和$location切换视图
2015/01/23 Javascript
js使用post 方式打开新窗口
2015/02/26 Javascript
javascript算法题:求任意一个1-9位不重复的N位数在该组合中的大小排列序号
2015/04/01 Javascript
js实现同一页面多个运动效果的方法
2015/04/10 Javascript
JavaScript和HTML DOM的区别与联系及Javascript和DOM的关系
2015/11/15 Javascript
jQuery获取radio选中项的值实例
2016/06/18 Javascript
jQuery Validate 相关参数及常用的自定义验证规则
2017/03/06 Javascript
Vue 组件传值几种常用方法【总结】
2018/05/28 Javascript
引入外部js脚本加载慢与页面白屏问题的解决
2018/12/10 Javascript
详解基于Wepy开发小程序插件(推荐)
2019/08/01 Javascript
Js参数RSA加密传输之jsencrypt.js的使用
2020/02/07 Javascript
[01:06:19]DOTA2-DPC中国联赛定级赛 LBZS vs SAG BO3第二场 1月8日
2021/03/11 DOTA
Python的ORM框架SQLObject入门实例
2014/04/28 Python
python开发之list操作实例分析
2016/02/22 Python
Python3中在Anaconda环境下安装basemap包
2018/10/21 Python
Django的性能优化实现解析
2019/07/30 Python
python pycharm的安装及其使用
2019/10/11 Python
2020新版本pycharm+anaconda+opencv+pyqt环境配置学习笔记,亲测可用
2020/03/24 Python
Python startswith()和endswith() 方法原理解析
2020/04/28 Python
HTML5页面中尝试调起APP功能
2017/09/12 HTML / CSS
MCM英国官网:奢侈皮具制品
2017/04/18 全球购物
大学生水果店创业计划书
2014/01/28 职场文书
小学生检讨书大全
2014/02/06 职场文书
2014教师教育实践活动对照检查材料思想汇报
2014/09/21 职场文书
Mysql实现简易版搜索引擎的示例代码
2021/08/30 MySQL