Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简洁的十分钟Python入门教程
Apr 03 Python
高质量Python代码编写的5个优化技巧
Nov 16 Python
Python爬虫_城市公交、地铁站点和线路数据采集实例
Jan 10 Python
python如何在列表、字典中筛选数据
Mar 19 Python
终端命令查看TensorFlow版本号及路径的方法
Jun 13 Python
python对html过滤处理的方法
Oct 21 Python
pyqt5与matplotlib的完美结合实例
Jun 21 Python
对Python3之方法的覆盖与super函数详解
Jun 26 Python
python实现UDP协议下的文件传输
Mar 20 Python
Django-migrate报错问题解决方案
Apr 21 Python
Python使用xpath实现图片爬取
Sep 16 Python
Python实现双向链表
May 25 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
AJAX for PHP简单表数据查询实例
2007/01/02 PHP
PHP 的异常处理、错误的抛出及回调函数等面向对象的错误处理方法
2012/12/07 PHP
在Ubuntu 14.04上部署 PHP 环境及 WordPress
2014/09/02 PHP
win7安装php框架Yii的方法
2016/01/25 PHP
基于php判断客户端类型
2016/10/14 PHP
tp5 实现列表数据根据状态排序
2019/10/18 PHP
javascript contains和compareDocumentPosition 方法来确定是否HTML节点间的关系
2010/02/04 Javascript
JavaScript Event学习第二章 Event浏览器兼容性
2010/02/07 Javascript
js以对象为索引的关联数组
2010/07/04 Javascript
基于jQuery的烟花效果(运动相关)点击屏幕出烟花
2012/06/14 Javascript
jQuery.prototype.init选择器构造函数源码思路分析
2013/02/05 Javascript
Ext JS 4实现带week(星期)的日期选择控件(实战二)
2013/08/21 Javascript
简介JavaScript中的getUTCFullYear()方法的使用
2015/06/10 Javascript
JavaScript函数基础详解
2017/02/03 Javascript
JavaScript中的FileReader图片预览上传功能实现代码
2017/07/24 Javascript
jQuery实现合并表格单元格中相同行操作示例
2019/01/28 jQuery
微信小程序引入VANT组件的方法步骤
2019/09/19 Javascript
jQuery单页面文字搜索插件jquery.fullsearch.js的使用方法
2020/02/04 jQuery
[00:56]跨越时空加入战场 全新祈求者身心“失落奇艺侍祭”展示
2019/07/20 DOTA
Java中重定向输出流实现用文件记录程序日志
2015/06/12 Python
基于python内置函数与匿名函数详解
2018/01/09 Python
对python xlrd读取datetime类型数据的方法详解
2018/12/26 Python
Python时间序列缺失值的处理方法(日期缺失填充)
2019/08/11 Python
关于PyTorch 自动求导机制详解
2019/08/18 Python
python实现对列表中的元素进行倒序打印
2019/11/23 Python
Django查询优化及ajax编码格式原理解析
2020/03/25 Python
Python如何生成xml文件
2020/06/04 Python
Python通用唯一标识符uuid模块使用案例
2020/09/10 Python
使用HTML5技术开发一个属于自己的超酷颜色选择器
2013/09/22 HTML / CSS
工商管理实习自我鉴定
2013/09/28 职场文书
物流专员岗位职责
2014/02/17 职场文书
奉献家乡演讲稿
2014/09/13 职场文书
不听老师话的万能检讨书
2014/10/04 职场文书
2015年体育部工作总结
2015/04/02 职场文书
2019学生会干事辞职信
2019/06/27 职场文书
Pandas数据类型之category的用法
2021/06/28 Python