对sklearn的使用之数据集的拆分与训练详解(python3.6)


Posted in Python onDecember 14, 2018

研修课上讲了两个例子,融合一下。

主要演示大致的过程:

导入->拆分->训练->模型报告

以及几个重要问题:

①标签二值化

②网格搜索法调参

③k折交叉验证

④增加噪声特征(之前涉及)

from sklearn import datasets
#从cross_validation导入会出现warning,说已弃用
from sklearn.model_selection import train-test_split
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.svm import SVC
import sklearn.exceptioins
#导入鸢尾花数据集
iris = datasets.load_iris()
#将数据集拆分为训练集和测试集各一半
#其中X为数据特征(花萼、花瓣的高度宽度),为150*4的矩阵
#Y为鸢尾花种类(0, 1, 2三种),为150*1矩阵
#如果使用标签二值化, 将0, 1, 2表示为100 010 001
#使用y.label_binarize(y, classes[0, 1, 2]),变为150*3矩阵
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.5, random_state=0)
#set the parameters by cross_validation
turn_parameters = [{'kernel' : ['rbf', 'gamma' : [1e-3, 1e - 4, 'C':[1,10,100,1000]}, 
{'kernel':['linear'], 'C':[1,10,100,1000]}
]
#clf分离器
#使用网格搜索法调超参数
#训练集做5折交叉验证
clf = GridSearchCV(SVC(C=1), turned_parameters, cv=5, scoring='%s_weighted' % score)
#用前一半train数据再做5折交叉验证
#因为之前的train_test_split已经分割为2份了
#fit-拟合
clf.fit(X_train, y_train)
#超参数
print(clf.best_params_)
#得分
for params, mean_score, scores in clf.gird_scores_:
 print("%.3f (+/-%.0.03f) for %r" % (mean_score, scores.std()*1.96,params))
#分类报告
y_true, y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))

以上这篇对sklearn的使用之数据集的拆分与训练详解(python3.6)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
SublimeText 2编译python出错的解决方法(The system cannot find the file specified)
Nov 27 Python
Python中endswith()函数的基本使用
Apr 07 Python
python从入门到精通(DAY 3)
Dec 20 Python
Java多线程编程中ThreadLocal类的用法及深入
Jun 21 Python
Flask框架的学习指南之制作简单blog系统
Nov 20 Python
DataFrame 将某列数据转为数组的方法
Apr 13 Python
Python解析Excle文件中的数据方法
Oct 23 Python
将Python字符串生成PDF的实例代码详解
May 17 Python
python的pytest框架之命令行参数详解(下)
Jun 27 Python
python文件处理fileinput使用方法详解
Jan 02 Python
python GUI库图形界面开发之PyQt5布局控件QVBoxLayout详细使用方法与实例
Mar 06 Python
Python 内存管理机制全面分析
Jan 16 Python
python列表list保留顺序去重的实例
Dec 14 #Python
Python机器学习之scikit-learn库中KNN算法的封装与使用方法
Dec 14 #Python
Python面向对象之类的内置attr属性示例
Dec 14 #Python
python模糊图片过滤的方法
Dec 14 #Python
python 随机打乱 图片和对应的标签方法
Dec 14 #Python
对python打乱数据集中X,y标签对的方法详解
Dec 14 #Python
Python实现带参数的用户验证功能装饰器示例
Dec 14 #Python
You might like
我的论坛源代码(八)
2006/10/09 PHP
PHP4 与 MySQL 数据库操作函数详解
2006/12/06 PHP
解析php中的fopen()函数用打开文件模式说明
2013/06/20 PHP
ThinkPHP模板标签eq if 中区分0,null,false的方法
2017/03/24 PHP
JavaScript 实现模态对话框 源代码大全
2009/05/02 Javascript
jquery左边浮动到一定位置时显示返回顶部按钮
2014/06/05 Javascript
node.js中的fs.mkdirSync方法使用说明
2014/12/17 Javascript
jQuery中$this和$(this)的区别介绍(一看就懂)
2015/07/06 Javascript
自己动手写的jquery分页控件(非常简单实用)
2015/10/28 Javascript
前端构建工具之gulp的配置与搭建详解
2017/06/12 Javascript
zTree树形插件异步加载方法详解
2017/06/14 Javascript
JavaScript数组去重算法实例小结
2018/05/07 Javascript
用Node编写RESTful API接口的示例代码
2018/07/04 Javascript
Vue跨域请求问题解决方案过程解析
2020/08/07 Javascript
python实现随机梯度下降(SGD)
2020/03/24 Python
python实现kNN算法
2017/12/20 Python
对python借助百度云API对评论进行观点抽取的方法详解
2019/02/21 Python
python面向对象法实现图书管理系统
2019/04/19 Python
Python generator生成器和yield表达式详解
2019/08/08 Python
django 数据库连接模块解析及简单长连接改造方法
2019/08/29 Python
python打印直角三角形与等腰三角形实例代码
2019/10/20 Python
在Django中实现添加user到group并查看
2019/11/18 Python
python uuid生成唯一id或str的最简单案例
2021/01/13 Python
css3 2D图片转动样式可以扩充到Js当中
2014/04/29 HTML / CSS
使用SVG实现提示框功能的示例代码
2020/06/05 HTML / CSS
Giglio英国站:意大利奢侈品购物网
2018/03/06 全球购物
西班牙最大的在线滑板和街头服饰商店:Fillow.net
2019/04/15 全球购物
YBF Beauty官网:美丽挚友,美国知名彩妆品牌
2020/11/22 全球购物
女大学生毕业找工作的自我评价
2013/10/03 职场文书
英语教师岗位职责
2014/03/16 职场文书
纺织工程专业推荐信
2014/09/08 职场文书
学生检讨书怎么写
2014/10/09 职场文书
学生逃课检讨书1000字
2014/10/20 职场文书
2015最新婚礼主持词
2015/06/30 职场文书
jackson json序列化实现首字母大写,第二个字母需小写
2021/06/29 Java/Android
Java中的Kotlin 内部类原理
2022/06/16 Java/Android