python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中pygame安装方法图文详解
Nov 11 Python
Python使用ntplib库同步校准当地时间的方法
Jul 02 Python
python多进程实现进程间通信实例
Nov 24 Python
python+influxdb+shell编写区域网络状况表
Jul 27 Python
python 使用turtule绘制递归图形(螺旋、二叉树、谢尔宾斯基三角形)
May 30 Python
Python在cmd上打印彩色文字实现过程详解
Aug 07 Python
python BlockingScheduler定时任务及其他方式的实现
Sep 19 Python
django数据模型on_delete, db_constraint的使用详解
Dec 24 Python
通过cmd进入python的步骤
Jun 16 Python
python对execl 处理操作代码
Jun 22 Python
Python爬虫获取豆瓣电影并写入excel
Jul 31 Python
详解Django中 render() 函数的使用方法
Apr 22 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
Windows PHP5和Apache的安装与配置
2009/06/08 PHP
php实现html标签闭合检测与修复方法
2015/07/09 PHP
php 计算两个时间相差的天数、小时数、分钟数、秒数详解及实例代码
2016/11/09 PHP
Redis构建分布式锁
2017/03/28 PHP
php插件Xajax使用方法详解
2017/08/31 PHP
PHP命名空间与自动加载类详解
2018/09/04 PHP
js中同步与异步处理的方法和区别总结
2013/12/25 Javascript
利用jquery.qrcode在页面上生成二维码且支持中文
2014/02/12 Javascript
JS遍历数组及打印数组实例分析
2016/01/21 Javascript
使用UrlConnection实现后台模拟http请求的简单实例
2017/01/04 Javascript
vue2 中如何实现动态表单增删改查实例
2017/06/09 Javascript
jQuery动画_动力节点节点Java学院整理
2017/07/04 jQuery
微信小程序模板和模块化用法实例分析
2017/11/28 Javascript
vue动态绑定class选中当前列表变色的方法示例
2018/12/19 Javascript
JavaScript实现获取两个排序数组的中位数算法示例
2019/02/26 Javascript
python文件操作的简单方法总结
2019/11/07 Python
如何基于python3和Vue实现AES数据加密
2020/03/27 Python
对python pandas中 inplace 参数的理解
2020/06/27 Python
Django如何实现密码错误报错提醒
2020/09/04 Python
Python利用pip安装tar.gz格式的离线资源包
2020/09/14 Python
Django 实现图片上传和下载功能
2020/12/31 Python
蛋白质世界:Protein World
2017/11/23 全球购物
捷克汽车配件和工具销售网站:TorriaCars
2018/02/26 全球购物
法国二手手袋、手表和奢侈珠宝购物网站:Collector Square
2018/07/05 全球购物
英国领先的在线礼品店:Getting Personal
2019/09/24 全球购物
十一个高级MySql面试题
2014/10/06 面试题
简短大学毕业感言
2014/01/18 职场文书
小学生个人先进事迹材料
2014/05/08 职场文书
知识竞赛拉拉队口号
2014/06/16 职场文书
网络技术专业求职信
2014/07/13 职场文书
城管执法人员纪律作风整顿思想汇报
2014/09/13 职场文书
小学优秀班主任材料
2014/12/17 职场文书
向雷锋同志学习倡议书
2015/04/27 职场文书
2015年党总支工作总结
2015/05/25 职场文书
Golang之sync.Pool使用详解
2021/05/06 Golang
使用Redis做预定库存缓存功能
2022/04/02 Redis