Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 网络编程起步(Socket发送消息)
Sep 06 Python
Python程序语言快速上手教程
Jul 18 Python
Python写的贪吃蛇游戏例子
Jun 16 Python
python实现调用其他python脚本的方法
Oct 05 Python
Python装饰器使用实例:验证参数合法性
Jun 24 Python
Python字符串格式化的方法(两种)
Sep 19 Python
python3爬取各类天气信息
Feb 24 Python
python使用tornado实现简单爬虫
Jul 28 Python
基于wxPython的GUI实现输入对话框(1)
Feb 27 Python
将Pytorch模型从CPU转换成GPU的实现方法
Aug 19 Python
python jenkins 打包构建代码的示例代码
Nov 29 Python
详解KMP算法以及python如何实现
Sep 18 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
五款常用mysql slow log分析工具的比较分析
2011/05/22 PHP
php生成EAN_13标准条形码实例
2013/11/13 PHP
php分页示例分享
2014/04/30 PHP
yii分页组件用法实例分析
2015/12/28 PHP
java模拟PHP的pack和unpack类
2016/04/13 PHP
php微信公众平台开发(三)订阅事件处理
2016/12/06 PHP
js验证表单大全
2006/11/25 Javascript
一个无限级XML绑定跨框架菜单(For IE)
2007/01/27 Javascript
关于javascript document.createDocumentFragment()
2009/04/04 Javascript
javascript实现复制与粘贴操作实例
2014/10/16 Javascript
JavaScript中的类(Class)详细介绍
2014/12/30 Javascript
jQuery图片轮播功能实例代码
2017/01/29 Javascript
js/jquery控制页面动态加载数据 滑动滚动条自动加载事件的方法
2017/02/08 Javascript
jQuery实现遍历复选框的方法示例
2017/03/06 Javascript
ES6中参数的默认值语法介绍
2017/05/03 Javascript
js动态引入的四种方法
2018/05/05 Javascript
layui的select联动实现代码
2019/09/28 Javascript
js实现无缝轮播图特效
2020/05/09 Javascript
浅析PEP572: 海象运算符
2019/10/15 Python
关于ResNeXt网络的pytorch实现
2020/01/14 Python
基于HTML5+Webkit实现树叶飘落动画
2017/12/28 HTML / CSS
UGG澳洲官网:UGG Australia
2018/04/26 全球购物
澳大利亚女士时装在线:Rockmans
2018/09/26 全球购物
英国设计的甲板鞋和船鞋:Chatham
2018/12/06 全球购物
美国高端牛仔品牌:Silver Jeans
2019/12/12 全球购物
Linux文件系统类型
2012/09/16 面试题
安全检查管理制度
2014/02/02 职场文书
大二法学专业职业生涯规划范文
2014/02/12 职场文书
社区工作者感言
2014/03/02 职场文书
医学生就业推荐表自我鉴定
2014/03/26 职场文书
企业法人代表证明书
2014/09/27 职场文书
一年级语文下册复习计划
2015/01/17 职场文书
置业顾问岗位职责
2015/02/09 职场文书
女性健康讲座主持词
2015/07/04 职场文书
Python Pandas pandas.read_sql函数实例用法
2021/06/21 Python
python自动化八大定位元素讲解
2021/07/09 Python