python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python线程锁(thread)学习示例
Dec 04 Python
Python数据结构之Array用法实例
Oct 09 Python
浅析Python中MySQLdb的事务处理功能
Sep 21 Python
利用python获取某年中每个月的第一天和最后一天
Dec 15 Python
Python 数据结构之旋转链表
Feb 25 Python
Python使用pyh生成HTML文档的方法示例
Mar 10 Python
Python管理Windows服务小脚本
Mar 12 Python
Python实现手写一个类似django的web框架示例
Jul 20 Python
Python 通过调用接口获取公交信息的实例
Dec 17 Python
python如何给字典的键对应的值为字典项的字典赋值
Jul 05 Python
Pytorch环境搭建与基本语法
Jun 03 Python
Django Paginator分页器的使用示例
Jun 23 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
第十节--抽象方法和抽象类
2006/11/16 PHP
PHP与MySQL开发的8个技巧小结
2010/12/17 PHP
PHP利用REFERER根居访问来地址进行页面跳转
2013/09/28 PHP
基于PHP实现商品成交时发送短信功能
2016/05/11 PHP
php读取本地json文件的实例
2018/03/07 PHP
javascript 表单规则集合对象
2009/07/21 Javascript
display和visibility的区别示例介绍
2014/02/26 Javascript
jQuery实现返回顶部功能适合不支持js的浏览器
2014/08/19 Javascript
js实现文本框支持加减运算的方法
2015/08/19 Javascript
浅析JavaScript声明变量
2015/12/21 Javascript
深入理解js promise chain
2016/05/05 Javascript
JCrop+ajaxUpload 图像切割上传的实例代码
2016/07/20 Javascript
jquery插件锦集【推荐】
2016/12/16 Javascript
简单实现JS计算器功能
2016/12/21 Javascript
javascript实现切割轮播效果
2019/11/28 Javascript
[01:57]DOTA2上海特锦赛小组赛解说单车采访花絮
2016/02/27 DOTA
[01:20]2018DOTA2亚洲邀请赛总决赛战队Mineski晋级之路
2018/04/07 DOTA
python错误处理详解
2014/09/28 Python
在Python的setuptools框架下生成egg的教程
2015/04/13 Python
Python进程间通信用法实例
2015/06/04 Python
基于Python log 的正确打开方式
2018/04/28 Python
python字典值排序并取出前n个key值的方法
2018/10/17 Python
Python装饰器用法实例分析
2019/01/14 Python
深入了解Python枚举类型的相关知识
2019/07/09 Python
Python类中的魔法方法之 __slots__原理解析
2019/08/26 Python
pygame实现俄罗斯方块游戏(AI篇1)
2019/10/29 Python
python super()函数的基本使用
2020/09/10 Python
Daniel Wellington官方海外旗舰店:丹尼尔惠灵顿DW手表
2018/02/22 全球购物
C#里面可以避免一个类被其他类继承么?如何?
2013/09/26 面试题
面试求职的个人自我评价
2013/11/16 职场文书
公司财务总监岗位职责
2013/12/14 职场文书
关于安全的广播稿
2014/10/23 职场文书
2014年会计工作总结
2014/11/27 职场文书
2015年女职工工作总结
2015/05/15 职场文书
Python带你从浅入深探究Tuple(基础篇)
2021/05/15 Python
springboot如何初始化执行sql语句
2021/06/22 Java/Android