python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python排序搜索基本算法之选择排序实例分析
Dec 09 Python
Python使用matplotlib绘图无法显示中文问题的解决方法
Mar 14 Python
Python切片操作深入详解
Jul 27 Python
Python多进程池 multiprocessing Pool用法示例
Sep 07 Python
python3.4爬虫demo
Jan 22 Python
几行Python代码爬取3000+上市公司的信息
Jan 24 Python
情人节快乐! python绘制漂亮玫瑰
Aug 18 Python
python 线性回归分析模型检验标准--拟合优度详解
Feb 24 Python
python计算Content-MD5并获取文件的Content-MD5值方式
Apr 03 Python
Python Tornado实现WEB服务器Socket服务器共存并实现交互的方法
May 26 Python
Python pysnmp使用方法及代码实例
Aug 24 Python
15个Pythonic的代码示例(值得收藏)
Oct 29 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
php数组转换js数组操作及json_encode的用法详解
2013/10/26 PHP
PHP错误Cannot use object of type stdClass as array in错误的解决办法
2014/06/12 PHP
smarty内置函数foreach用法实例
2015/01/22 PHP
Yii框架布局文件的动态切换操作示例
2019/11/11 PHP
laravel中Redis队列监听中断的分析
2020/09/14 PHP
dess中一个简单的多路委托的实现
2010/07/20 Javascript
javascript伸缩型菜单实现代码
2015/11/16 Javascript
详解JavaScript正则表达式之RegExp对象
2015/12/13 Javascript
HTML5 canvas 9绘制图片实例详解
2016/09/06 Javascript
js模态对话框使用方法详解
2017/02/16 Javascript
JavaScript之浏览器对象_动力节点Java学院整理
2017/07/03 Javascript
原生JS实现的轮播图功能详解
2018/08/06 Javascript
微信小程序非swiper组件实现的自定义伪3D轮播图效果示例
2018/12/11 Javascript
Vue动态面包屑功能的实现方法
2019/07/01 Javascript
JS实现基本的网页计算器功能示例
2020/01/16 Javascript
微信小程序开发(三):返回上一级页面并刷新操作示例【页面栈】
2020/06/01 Javascript
Python中用Spark模块的使用教程
2015/04/13 Python
python数组复制拷贝的实现方法
2015/06/09 Python
利用python实现简单的邮件发送客户端示例
2017/12/23 Python
pandas计数 value_counts()的使用
2019/06/24 Python
Python编程学习之如何判断3个数的大小
2019/08/07 Python
python构建指数平滑预测模型示例
2019/11/21 Python
Python更换pip源方法过程解析
2020/05/19 Python
详解Html5中video标签那些属性和方法
2019/07/01 HTML / CSS
澳大利亚时尚前卫设计师珠宝在线:Amber Sceats
2017/10/04 全球购物
EJB包括(SessionBean,EntityBean)说出他们的生命周期,及如何管理事务的?
2013/02/17 面试题
人力资源部门的主要职能
2014/02/22 职场文书
开展读书活动总结
2014/06/30 职场文书
高中生国庆节演讲稿范文2014
2014/09/21 职场文书
2014年便民服务中心工作总结
2014/12/20 职场文书
2015年党员公开承诺书范文
2015/01/22 职场文书
2015年父亲节活动总结
2015/02/12 职场文书
春季运动会加油词
2015/07/18 职场文书
2016廉政教育学习心得体会
2016/01/25 职场文书
pytorch分类模型绘制混淆矩阵以及可视化详解
2022/04/07 Python
python数字图像处理:图像简单滤波
2022/06/28 Python