对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中设置变量作为默认值时容易遇到的错误
Apr 03 Python
Python实现的数据结构与算法之基本搜索详解
Apr 22 Python
Python中关于Sequence切片的下标问题详解
Jun 15 Python
老生常谈Python序列化和反序列化
Jun 28 Python
Python 私有函数的实例详解
Sep 11 Python
python机器学习之贝叶斯分类
Mar 26 Python
Python实现统计给定字符串中重复模式最高子串功能示例
May 16 Python
selenium+python自动化测试之鼠标和键盘事件
Jan 23 Python
Python 给定的经纬度标注在地图上的实现方法
Jul 05 Python
tensorflow 实现打印pb模型的所有节点
Jan 23 Python
pycharm新建Vue项目的方法步骤(图文)
Mar 04 Python
浅谈python 中的 type(), dtype(), astype()的区别
Apr 09 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
php获取某个目录大小的代码
2008/09/10 PHP
提示Trying to clone an uncloneable object of class Imagic的解决
2011/10/27 PHP
php中限制ip段访问、禁止ip提交表单的代码分享
2014/08/22 PHP
Zend Framework教程之连接数据库并执行增删查的方法(附demo源码下载)
2016/03/21 PHP
解决yii2左侧菜单子级无法高亮问题的方法
2016/05/08 PHP
js 鼠标点击事件及其它捕获
2009/06/04 Javascript
JQuery中的ready函数冲突的解决方法
2010/05/17 Javascript
输入框的字数时时统计—关于 onpropertychange 和 oninput 使用
2011/10/21 Javascript
JavaScript图片放大技术(放大镜)实现代码分享
2013/11/14 Javascript
关于js数组去重的问题小结
2014/01/24 Javascript
js实现仿京东2级菜单效果(带延时功能)
2015/08/27 Javascript
JavaScript基础重点(必看)
2016/07/09 Javascript
JS实现兼容火狐及IE iframe onload属性的遮罩层隐藏及显示效果
2016/08/23 Javascript
javascript宿主对象之window.navigator详解
2016/09/07 Javascript
jQuery操作json常用方法示例
2017/01/04 Javascript
JavaScript创建对象的七种方式(推荐)
2017/06/26 Javascript
Angular2 http jsonp的实例详解
2017/08/31 Javascript
Vue 父子组件的数据传递、修改和更新方法
2018/03/01 Javascript
使用JS实现导航切换时高亮显示的示例讲解
2018/08/22 Javascript
详解vue数组遍历方法forEach和map的原理解析和实际应用
2018/11/15 Javascript
微信小程序 拍照或从相册选取图片上传代码实例
2019/08/28 Javascript
python的常见命令注入威胁
2013/02/18 Python
在Python中测试访问同一数据的竞争条件的方法
2015/04/23 Python
python实现对csv文件的列的内容读取
2018/07/04 Python
python软件都是免费的吗
2020/06/18 Python
Python从MySQL数据库中面抽取试题,生成试卷
2021/01/14 Python
艺人经纪人岗位职责
2014/04/15 职场文书
超市优秀员工事迹材料
2014/05/01 职场文书
副科级后备干部考察材料
2014/05/15 职场文书
党员演讲稿
2014/09/04 职场文书
2015年“世界无车日”活动方案
2015/05/06 职场文书
导游词之山西祁县乔家大院
2019/10/14 职场文书
Web前端:CSS最强总结 附详细代码
2021/03/31 HTML / CSS
vite+vue3.0+ts+element-plus快速搭建项目的实现
2021/06/24 Vue.js
yyds什么意思?90后已经听不懂00后讲话了……
2022/02/03 杂记
【海涛解说】pis亲自推荐,其实你从来不会玩NW
2022/04/01 DOTA