Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用xlrd读取Excel格式文件的方法
Mar 10 Python
Python脚本实现格式化css文件
Apr 08 Python
python使用str & repr转换字符串
Oct 13 Python
Python正则表达式如何进行字符串替换实例
Dec 28 Python
Python 实现简单的shell sed替换功能(实例讲解)
Sep 29 Python
Python socket套接字实现C/S模式远程命令执行功能案例
Jul 06 Python
python正则表达式之对号入座篇
Jul 24 Python
python实现QQ邮箱/163邮箱的邮件发送
Jan 22 Python
关于Django Models CharField 参数说明
Mar 31 Python
如何通过python检查文件是否被占用
Dec 18 Python
MATLAB 全景图切割及盒图显示的实现步骤
May 14 Python
tensorflow中的梯度求解及梯度裁剪操作
May 26 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
关于PHP文件的自动运行方法分析
2016/05/13 PHP
PHP简单实现合并2个数字键数组值的方法
2017/05/30 PHP
PHP面向对象程序设计(OOP)之方法重写(override)操作示例
2018/12/21 PHP
关于laravel-admin ueditor 集成并解决刷新的问题
2019/10/21 PHP
找出字符串中出现次数最多的字母和出现次数精简版
2012/11/07 Javascript
给artDialog 5.02 增加ajax get功能详细介绍
2012/11/13 Javascript
jquery 跳到顶部和底部动画2句代码简单实现
2013/07/18 Javascript
js判断浏览器类型的方法
2013/08/07 Javascript
javascript实现百度地图鼠标滑动事件显示、隐藏
2015/04/02 Javascript
详解JavaScript逻辑And运算符
2015/12/04 Javascript
jQuery+PHP实现微信转盘抽奖功能的方法
2016/05/25 Javascript
bootstrap组件之导航组件使用方法
2017/01/19 Javascript
Vue项目结合Vue-layer实现弹框式编辑功能(实例代码)
2020/03/11 Javascript
解决pycharm 误删掉项目文件的处理方法
2018/10/22 Python
python 利用for循环 保存多个图像或者文件的实例
2018/11/09 Python
python 画出使用分类器得到的决策边界
2019/08/21 Python
Python3多线程版TCP端口扫描器
2019/08/31 Python
python中count函数简单用法
2020/01/05 Python
python mysql 字段与关键字冲突的解决方式
2020/03/02 Python
python中wx模块的具体使用方法
2020/05/15 Python
Python+logging输出到屏幕将log日志写入文件
2020/11/11 Python
python 实现Harris角点检测算法
2020/12/11 Python
白色公司:The White Company
2017/10/11 全球购物
Optimalprint加拿大:在线打印服务
2020/04/03 全球购物
英国奢侈品在线精品店:Hervia
2020/09/03 全球购物
shallow copy和deep copy的区别
2016/05/09 面试题
PyQt 如何创建自定义QWidget
2021/03/24 Python
财经学院自荐信范文
2014/02/02 职场文书
电子专业毕业生自荐信
2014/05/25 职场文书
私营公司诉讼代理委托书范本
2014/09/13 职场文书
受资助学生感谢信
2015/01/21 职场文书
党小组评议意见
2015/06/02 职场文书
2015年计算机教师工作总结
2015/07/22 职场文书
2016入党培训心得体会范文
2016/01/08 职场文书
《折线统计图》教学反思
2016/02/22 职场文书
html实现弹窗的实例
2021/06/09 HTML / CSS