Python sklearn中的.fit与.predict的用法说明


Posted in Python onJune 28, 2020

我就废话不多说了,大家还是直接看代码吧~

clf=KMeans(n_clusters=5) #创建分类器对象
fit_clf=clf.fit(X) #用训练器数据拟合分类器模型
clf.predict(X) #也可以给新数据数据对其预测

print(clf.cluster_centers_) #输出5个类的聚类中心

y_pred = clf.fit_predict(X) #用训练器数据X拟合分类器模型并对训练器数据X进行预测

print(y_pred) #输出预测结果

补充知识:sklearn中调用某个机器学习模型model.predict(x)和model.predict_proba(x)的区别

model.predict_proba(x)不同于model.predict(),它返回的预测值为获得所有结果的概率。(有多少个分类结果,每行就有多少个概率,对每个结果都有一个概率值,如0、1两分类就有两个概率)

我们直接上代码,通过具体例子来进一步讲解:

python3 代码实现:

# -*- coding: utf-8 -*-
"""
Created on Sat Jul 27 21:25:39 2019

@author: ZQQ
"""
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
import numpy as np
import warnings
warnings.filterwarnings("ignore")
# 这个方法只是解决了表面,没有根治

# 数据(特征,属性)
x_train = np.array([[1,2,3], 
          [1,5,4], 
          [2,2,2], 
          [4,5,6], 
          [3,5,4], 
          [1,7,2]]) 
# 数据的标签
y_train = np.array([1, 0, 1, 1, 0, 0]) 
 
# 测试数据
x_test = np.array([[2,1,2], 
          [3,2,6], 
          [2,6,4]]) 
 
# 导入模型
model = LogisticRegression() 
 
#model = RandomForestClassifier()

#model=XGBClassifier()

model.fit(x_train, y_train)

# 返回预测标签 
print(model.predict(x_test)) 
 
print('---------------------------------------')

# 返回预测属于某标签的概率 
print(model.predict_proba(x_test))

运行结果:

Python sklearn中的.fit与.predict的用法说明

分析结果:

使用model.predict() :

预测[2,1,2]为1类

预测[3,2,6]为1类

预测[2,6,4]为0类

使用model.predict_proba() :

预测[2,1,2]的标签是0的概率为0.19442289,1的概率为0.80557711

预测[3,2,6]的标签是0的概率为0.04163615,1的概率为0.95836385

预测[2,6,4]的标签是0的概率为0.83059324,1的概率为0.16940676

预测为0类的概率值和预测为1的概率值和为1

同理,如果标签继续增加,3类:0,1, 2

预测为0类的概率值:a

预测为1类的概率值:b

预测为2类的概率值:c

预测出来的概率值的和a+b+c=1

注:model.predict_proba()返回所有标签值可能性概率值,这些值是如何排序的呢?

返回模型中每个类的样本概率,其中类按类self.classes_进行排序。

通过numpy.unique(label)方法,对label中的所有标签值进行从小到大的去重排序。

得到一个从小到大唯一值的排序。这也就对应于model.predict_proba()的行返回结果。

以上这篇Python sklearn中的.fit与.predict的用法说明就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单上手Python中装饰器的使用
Jul 12 Python
快速实现基于Python的微信聊天机器人示例代码
Mar 03 Python
Python numpy 常用函数总结
Dec 07 Python
python如何在循环引用中管理内存
Mar 20 Python
PyTorch线性回归和逻辑回归实战示例
May 22 Python
python的常用模块之collections模块详解
Dec 06 Python
python cumsum函数的具体使用
Jul 29 Python
Pycharm中Python环境配置常见问题解析
Jan 16 Python
Python实现栈的方法详解【基于数组和单链表两种方法】
Feb 22 Python
Keras 快速解决OOM超内存的问题
Jun 11 Python
Python虚拟环境库virtualenvwrapper安装及使用
Jun 17 Python
Python turtle编写简单的球类小游戏
Mar 31 Python
浅谈sklearn中predict与predict_proba区别
Jun 28 #Python
解决Pytorch自定义层出现多Variable共享内存错误问题
Jun 28 #Python
Pytorch学习之torch用法----比较操作(Comparison Ops)
Jun 28 #Python
PyTorch的torch.cat用法
Jun 28 #Python
使用pytorch 筛选出一定范围的值
Jun 28 #Python
解析python 中/ 和 % 和 //(地板除)
Jun 28 #Python
pytorch 常用函数 max ,eq说明
Jun 28 #Python
You might like
phpmyadmin显示utf8_general_ci中文乱码的问题终级篇
2013/04/08 PHP
php判断电脑访问、手机访问的例子
2014/05/10 PHP
PHP return语句另类用法不止是在函数中
2014/09/17 PHP
修改Laravel5.3中的路由文件与路径
2016/08/10 PHP
详解no input file specified 三种解决方法
2019/11/29 PHP
Thinkphp 框架扩展之行为扩展原理与实现方法分析
2020/04/23 PHP
在网页中屏蔽快捷键
2006/09/06 Javascript
学习js所必须要知道的一些
2007/03/07 Javascript
更正确的asp冒泡排序
2007/05/24 Javascript
jquery last-child 列表最后一项的样式
2010/01/22 Javascript
javascript forEach通用循环遍历方法
2010/10/11 Javascript
javascript 原型继承介绍
2011/08/30 Javascript
js调用webservice中的方法实现思路及代码
2013/02/25 Javascript
node.js中的path.basename方法使用说明
2014/12/09 Javascript
javascript事件委托的方式绑定详解
2015/06/10 Javascript
浅谈js 闭包引起的内存泄露问题
2015/06/22 Javascript
基于jquery实现瀑布流布局
2020/06/28 Javascript
Angular.JS中指令ng-if的注意事项小结
2017/06/21 Javascript
浅谈NodeJs之数据库异常处理
2017/10/25 NodeJs
vue最简单的前后端交互示例详解
2018/10/11 Javascript
NodeJS使用Range请求实现下载功能的方法示例
2018/10/12 NodeJs
在Vue.js中使用TypeScript的方法
2020/03/19 Javascript
如何编写一个 Webpack Loader的实现
2020/10/18 Javascript
Python+Socket实现基于TCP协议的客户与服务端中文自动回复聊天功能示例
2017/08/31 Python
Python使用base64模块进行二进制数据编码详解
2018/01/11 Python
快速解决vue.js 模板和jinja 模板冲突的问题
2019/07/26 Python
基于Python实现全自动下载抖音视频
2020/11/06 Python
Roxy俄罗斯官方网站:冲浪和滑雪板的一切
2020/06/20 全球购物
幼儿园户外活动总结
2014/07/04 职场文书
2014领导班子专题民主生活会对照检查材料思想汇报
2014/09/23 职场文书
2015年度残疾人工作总结
2015/05/14 职场文书
圣诞晚会主持词
2015/07/01 职场文书
消防安全培训工作总结
2015/10/23 职场文书
2016年优秀少先队员事迹材料
2016/02/26 职场文书
Python实现仓库管理系统
2022/05/30 Python
阿里云服务器部署RabbitMQ集群的详细教程
2022/06/01 Servers