python使用pandas抽样训练数据中某个类别实例


Posted in Python onFebruary 28, 2020

废话真的一句也不想多说,直接看代码吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

补充拓展:pandas实现对dataframe抽样

随机抽样

import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)

分层抽样

利用sklean中的函数灵活进行抽样

from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之python消息摘要算法使用示例
Feb 10 Python
python连接oracle数据库实例
Oct 17 Python
Python实现在tkinter中使用matplotlib绘制图形的方法示例
Jan 18 Python
详解python实现识别手写MNIST数字集的程序
Aug 03 Python
CentOS 7 安装python3.7.1的方法及注意事项
Nov 01 Python
python字符串和常用数据结构知识总结
May 21 Python
执行Django数据迁移时报 1091错误及解决方法
Oct 14 Python
python 实现保存最新的三份文件,其余的都删掉
Dec 22 Python
Python 余弦相似度与皮尔逊相关系数 计算实例
Dec 23 Python
pytorch 实现在预训练模型的 input上增减通道
Jan 06 Python
Python-for循环的内部机制
Jun 12 Python
Python QTimer实现多线程及QSS应用过程解析
Jul 11 Python
如何使用repr调试python程序
Feb 28 #Python
Python编程快速上手——Excel到CSV的转换程序案例分析
Feb 28 #Python
python对文件的操作方法汇总
Feb 28 #Python
最新2019Pycharm安装教程 亲测
Feb 28 #Python
Python发送手机动态验证码代码实例
Feb 28 #Python
Python 开发工具PyCharm安装教程图文详解(新手必看)
Feb 28 #Python
Python3使用xlrd、xlwt处理Excel方法数据
Feb 28 #Python
You might like
PHP教程 基本语法
2009/10/23 PHP
php绘图之加载外部图片的方法
2015/01/24 PHP
PHP开发中AJAX技术的简单应用
2015/12/11 PHP
PHP入门教程之表单与验证实例详解
2016/09/11 PHP
php将print_r处理后的数据还原为原始数组的解决方法
2016/11/02 PHP
PHP读取文件的常见几种方法
2016/11/03 PHP
PHP实现图的邻接矩阵表示及几种简单遍历算法分析
2017/11/24 PHP
jquery 弹出层注册页面等(asp.net后台)
2010/06/17 Javascript
不用构造函数(Constructor)new关键字也能实现JavaScript的面向对象
2013/01/11 Javascript
js网页版计算器的简单实现
2013/07/02 Javascript
js获取指定日期周数以及星期几的小例子
2014/06/27 Javascript
js实现不提交表单获取单选按钮值的方法
2015/08/21 Javascript
JS实现IE状态栏文字缩放效果代码
2015/10/24 Javascript
JavaScript统计网站访问次数的实现代码
2015/11/18 Javascript
教你如何终止JQUERY的$.AJAX请求
2016/02/23 Javascript
angular $watch 一个变量的变化(实例讲解)
2017/08/02 Javascript
vue如何根据网站路由判断页面主题色详解
2018/11/02 Javascript
vue的三种图片引入方式代码实例
2019/11/19 Javascript
vue el-table实现行内编辑功能
2019/12/11 Javascript
如何使用原生Js实现随机点名详解
2021/01/06 Javascript
python抓取网页内容示例分享
2014/02/24 Python
使用Python读取大文件的方法
2018/02/11 Python
python代码 输入数字使其反向输出的方法
2018/12/22 Python
python中时间转换datetime和pd.to_datetime详析
2019/08/11 Python
使用NumPy读取MNIST数据的实现代码示例
2019/11/20 Python
Python调用shell cmd方法代码示例解析
2020/06/18 Python
Django执行源生mysql语句实现过程解析
2020/11/12 Python
无需JS和jQuery代码实现CSS3鼠标浮动放大图片
2016/11/21 HTML / CSS
自动化专业大学生职业生涯规划范文:爱拚才会赢
2014/09/12 职场文书
2015年元旦联欢晚会活动总结
2014/11/28 职场文书
机动车交通事故协议书
2015/01/29 职场文书
银行求职信范文怎么写
2015/03/20 职场文书
2016年幼儿园万圣节活动总结
2016/04/05 职场文书
Python中Numpy和Matplotlib的基本使用指南
2021/11/02 Python
springboot用户数据修改的详细实现
2022/04/06 Java/Android
Win11软件图标固定到任务栏
2022/04/19 数码科技