python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
学习python (1)
Oct 31 Python
python基于mysql实现的简单队列以及跨进程锁实例详解
Jul 07 Python
Python的加密模块md5、sha、crypt使用实例
Sep 28 Python
python获取一组汉字拼音首字母的方法
Jul 01 Python
python查看FTP是否能连接成功的方法
Jul 30 Python
用python一行代码得到数组中某个元素的个数方法
Jan 28 Python
python图片二值化提高识别率代码实例
Aug 24 Python
Python OpenCV视频截取并保存实现代码
Nov 30 Python
在python shell中运行python文件的实现
Dec 21 Python
如何通过Django使用本地css/js文件
Jan 20 Python
python 中 .py文件 转 .pyd文件的操作
Mar 04 Python
python b站视频下载的五种版本
May 27 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
PHP计算2点经纬度之间的距离代码
2013/08/12 PHP
php生成xml时添加CDATA标签的方法
2014/10/17 PHP
详解WordPress开发中用于获取分类及子页面的函数用法
2016/01/08 PHP
php mysql 封装类实例代码
2016/09/18 PHP
PHP生成短网址的思路以及实现方法的详解
2019/03/25 PHP
关于Ext中form移除textfield方法:hide(),setVisible(false),remove()
2010/12/02 Javascript
Jquery实现页面加载时弹出对话框代码
2013/04/19 Javascript
js父窗口关闭时子窗口随之关闭完美解决方案
2014/04/29 Javascript
JavaScript闭包函数访问外部变量的方法
2014/08/27 Javascript
javascript中2个感叹号的用法实例详解
2014/09/04 Javascript
Javascript中的包装类型介绍
2015/04/02 Javascript
JQuery控制radio选中和不选中方法总结
2015/04/15 Javascript
JavaScript中实现map功能代码分享
2015/06/11 Javascript
iscroll.js的上拉下拉刷新时无法回弹的解决方法
2016/02/18 Javascript
Omi v1.0.2发布正式支持传递javascript表达式
2017/03/21 Javascript
Vue.JS项目中5个经典Vuex插件
2017/11/28 Javascript
JS实现带阴历的日历功能详解
2019/01/24 Javascript
Vue v-model组件封装(类似弹窗组件)
2020/01/08 Javascript
python处理文本文件并生成指定格式的文件
2014/07/31 Python
选择python进行数据分析的理由和优势
2019/06/25 Python
python面试题之列表声明实例分析
2019/07/08 Python
python传到前端的数据,双引号被转义的问题
2020/04/03 Python
python计算Content-MD5并获取文件的Content-MD5值方式
2020/04/03 Python
如何对python的字典进行排序
2020/06/19 Python
详解CSS3中Media Queries的相关使用
2015/07/17 HTML / CSS
荷兰在线体育用品商店:Avantisport.nl
2018/07/04 全球购物
工程预算与管理应届生求职信
2013/10/06 职场文书
网络工程系信息安全技术专业大学生求职信
2013/10/22 职场文书
幼儿园教育教学反思
2014/01/31 职场文书
入学申请自荐信范文
2014/02/26 职场文书
社区国庆节活动总结
2015/03/23 职场文书
公司市场部岗位职责
2015/04/15 职场文书
硕士毕业答辩开场白
2015/05/27 职场文书
浅谈Python列表嵌套字典转化的问题
2021/04/07 Python
pandas:get_dummies()与pd.factorize()的用法及区别说明
2021/05/21 Python
利用Apache Common将java对象池化的问题
2022/06/16 Servers