python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
35个Python编程小技巧
Apr 01 Python
Python Web开发模板引擎优缺点总结
May 06 Python
Python排序搜索基本算法之插入排序实例分析
Dec 11 Python
对python中执行DOS命令的3种方法总结
May 12 Python
Python定义二叉树及4种遍历方法实例详解
Jul 05 Python
python模糊图片过滤的方法
Dec 14 Python
Python正则匹配判断手机号是否合法的方法
Dec 09 Python
Python程序打包工具py2exe和PyInstaller详解
Jun 28 Python
Python爬虫抓取技术的一些经验
Jul 12 Python
Python利用WMI实现ping命令的例子
Aug 14 Python
使用Python paramiko模块利用多线程实现ssh并发执行操作
Dec 05 Python
Python pymysql模块安装并操作过程解析
Oct 13 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
十大催泪虐心动漫电影,有几部你还没看
2020/03/04 日漫
古巴咖啡 Cubita琥爵咖啡 独特的加勒比海风味咖啡
2021/03/06 新手入门
php getimagesize 上传图片的长度和宽度检测代码
2010/05/15 PHP
PHP获取搜索引擎关键字来源的函数(支持百度和谷歌等搜索引擎)
2012/10/03 PHP
浅析PHP的ASCII码转换类
2013/07/05 PHP
PHP+Mysql+Ajax实现淘宝客服或阿里旺旺聊天功能(前台页面)
2017/06/16 PHP
PHP中soap用法示例【SoapServer服务端与SoapClient客户端编写】
2018/12/25 PHP
javascript数组的扩展实现代码集合
2008/06/01 Javascript
JQuery Tips(3) 关于$()包装集内元素的改变
2009/12/14 Javascript
jQuery MD5加密实现代码
2010/03/15 Javascript
Jquery公告滚动+AJAX后台得到数据
2011/04/14 Javascript
改善用户体验的五款jQuery插件分享
2011/05/22 Javascript
使用javascript过滤html的字符串(注释标记法)
2013/07/08 Javascript
Javascript 颜色渐变效果的实现代码
2013/10/01 Javascript
jQuery实现类似淘宝网图片放大效果的方法
2015/07/08 Javascript
jQuery使用正则表达式限制文本框只能输入数字
2016/06/18 Javascript
nodejs根据ip数组在百度地图中进行定位
2017/03/06 NodeJs
详解vue-cli+element-ui树形表格(多级表格折腾小计)
2019/04/17 Javascript
JS 获取文件后缀,判断文件类型(比如是否为图片格式)
2020/05/09 Javascript
[03:02]安得倚天剑,跨海斩长鲸——中国军团出征DOTA2国际邀请赛
2018/08/14 DOTA
基于pandas将类别属性转化为数值属性的方法
2018/07/25 Python
Python Scapy随心所欲研究TCP协议栈
2018/11/20 Python
Ubuntu18.04安装 PyCharm并使用 Anaconda 管理的Python环境
2020/04/08 Python
pycharm 添加解释器的方法步骤
2020/08/31 Python
欧洲著名的珠宝和手表网上商城:uhrcenter
2017/04/10 全球购物
中国茶叶、茶具一站式网上购物商城:醉品茶城
2018/07/03 全球购物
成考报名单位证明范本
2014/01/16 职场文书
临床护士自荐信
2014/01/31 职场文书
银行行长竞聘演讲稿
2014/04/23 职场文书
社区班子对照检查材料
2014/08/27 职场文书
2014年食堂工作总结
2014/11/20 职场文书
2015试用期转正工作总结
2014/12/12 职场文书
2019年汽车租赁合同范本!
2019/08/12 职场文书
python基于tkinter制作无损音乐下载工具
2021/03/29 Python
Spring事务管理下synchronized锁失效问题的解决方法
2022/03/31 Java/Android
聊聊配置 Nginx 访问与错误日志的问题
2022/05/25 Servers