python 实现读取csv数据,分类求和 再写进 csv


Posted in Python onMay 18, 2020

这两天在测试过程中,遇到这样的问题:

数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。

比如说,这样的数据

python 实现读取csv数据,分类求和 再写进 csv

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本 :

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到:

python 实现读取csv数据,分类求和 再写进 csv

这对于大数据量的处理特别方便。

补充知识:python处理csv文件(场景分类)

最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])
 
for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)
 
for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容:找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python的dict,set,list,tuple应用详解
Jul 24 Python
为Python的web框架编写前端模版的教程
Apr 30 Python
python实现文件路径和url相互转换的方法
Jul 06 Python
python爬虫实现教程转换成 PDF 电子书
Feb 19 Python
Python字典数据对象拆分的简单实现方法
Dec 05 Python
Python中文编码知识点
Feb 18 Python
Python3几个常见问题的处理方法
Feb 26 Python
flask框架单元测试原理与用法实例分析
Jul 23 Python
flask框架配置mysql数据库操作详解
Nov 29 Python
通过实例学习Python Excel操作
Jan 06 Python
python 实现图片批量压缩的示例
Dec 18 Python
Python命令行参数argv和argparse该如何使用
Feb 08 Python
python 实现分组求和与分组累加求和代码
May 18 #Python
Django ORM实现按天获取数据去重求和例子
May 18 #Python
如何实现更换Jupyter Notebook内核Python版本
May 18 #Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 #Python
Pycharm安装并配置jupyter notebook的实现
May 18 #Python
Django中的AutoField字段使用
May 18 #Python
jupyter notebook运行命令显示[*](解决办法)
May 18 #Python
You might like
PHP+DBM的同学录程序(5)
2006/10/09 PHP
网页常用特效代码整理
2006/06/23 Javascript
JS Timing
2007/04/21 Javascript
CSS JavaScript 实现菜单功能 改进版
2008/12/09 Javascript
基于jquery的无缝循环新闻列表插件
2011/03/07 Javascript
JavaScript 图像动画的小demo
2012/05/23 Javascript
JQuery筛选器全系列介绍
2013/08/27 Javascript
JS和函数式语言的三特性
2014/03/05 Javascript
js实现iPhone界面风格的单选框和复选框按钮实例
2015/08/18 Javascript
js文本框走动跑马灯效果代码分享
2015/08/25 Javascript
JavaScript编写九九乘法表(两种任选)
2017/02/04 Javascript
AngularJS自定义指令实现面包屑功能完整实例
2017/05/17 Javascript
基于vue2.0的活动倒计时组件countdown(附源码下载)
2018/10/09 Javascript
微信小程序的授权实现过程解析
2019/08/02 Javascript
layui之数据表格--与后台交互获取数据的方法
2019/09/29 Javascript
vue elementUI 表单校验的实现代码(多层嵌套)
2019/11/06 Javascript
[51:17]Mski vs VGJ.S Supermajor小组赛C组 BO3 第三场 6.3
2018/06/04 DOTA
Python 3实战爬虫之爬取京东图书的图片详解
2017/10/09 Python
利用python实现微信头像加红色数字功能
2018/03/26 Python
Python爬虫包BeautifulSoup实例(三)
2018/06/17 Python
python3.6.3安装图文教程 TensorFlow安装配置方法
2020/06/24 Python
Python中生成一个指定长度的随机字符串实现示例
2019/11/06 Python
Python 脚本拉取 Docker 镜像问题
2019/11/10 Python
django框架中间件原理与用法详解
2019/12/10 Python
MNIST数据集转化为二维图片的实现示例
2020/01/10 Python
python with (as)语句实例详解
2020/02/04 Python
pytorch梯度剪裁方式
2020/02/04 Python
Python使用paramiko连接远程服务器执行Shell命令的实现
2021/03/04 Python
我看到了用指针调用函数的不同语法形式
2014/07/16 面试题
电气工程师岗位职责
2014/01/01 职场文书
《骑牛比赛》教后反思
2014/04/22 职场文书
公务员个人总结
2015/02/12 职场文书
2015年高校教师个人工作总结
2015/05/25 职场文书
2020优秀员工演讲稿(三篇)
2019/10/17 职场文书
CSS 伪元素::marker详解
2021/06/26 HTML / CSS
python自动化八大定位元素讲解
2021/07/09 Python