python 实现读取csv数据,分类求和 再写进 csv


Posted in Python onMay 18, 2020

这两天在测试过程中,遇到这样的问题:

数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。

比如说,这样的数据

python 实现读取csv数据,分类求和 再写进 csv

需要对AskPrice值相同对应的AskQuantity 统计出来。

直接上脚本 :

import pandas as pd
import csv
df=pd.read_csv('D:\test\orderBook.csv')
df_sum = df.groupby('AskPrice')['AskQuantity'].sum() 
df_sum.to_csv('D:\test\orderBook2.csv')

然后运行得到:

python 实现读取csv数据,分类求和 再写进 csv

这对于大数据量的处理特别方便。

补充知识:python处理csv文件(场景分类)

最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。

import numpy as np
import os
import xlrd
import pandas as pd
import shutil
list_0 = []
list_file = []
flag = []
filename = os.listdir('F:\工作\比赛\未来杯\image_scene_training\data')
af = pd.read_excel('19.xlsx')
ww = af.values.tolist()
for i in ww:
  for j in i:
    list_0.append(j)
for name in filename:
  list_file.append(name[0:-4])
 
for name in list_file:
  if name in list_0:
    flag.append(True)
  else:
    flag.append(False)
 
for name in list_file:
  if flag[list_file.index(name)]:
    oldname = u'F:\工作\比赛\未来杯\image_scene_training\data\\'+name+'.jpg'
    newname = u'F:\工作\比赛\未来杯\image_scene_training\\train_data\\beach\\'+name+'.jpg'
    shutil.copyfile(oldname,newname)

unicodeDecodeError:'utf-8' codec can't decode byte 0xce in position 72: invalid continuation byte

1:升级pip python -m pip install --upgrade pip

2:改python文件内容:找到lib\site-packages\pip\compat\__init__.py

return s.decode('utf-8')

将‘utf-8'改成'gbk'

以上这篇python 实现读取csv数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python ZipFile模块详解
Nov 01 Python
python有证书的加密解密实现方法
Nov 19 Python
python检测远程服务器tcp端口的方法
Mar 14 Python
Mac中升级Python2.7到Python3.5步骤详解
Apr 27 Python
使用Python+Splinter自动刷新抢12306火车票
Jan 03 Python
Python使用zip合并相邻列表项的方法示例
Mar 17 Python
Python设计模式之抽象工厂模式原理与用法详解
Jan 15 Python
Tensorflow实现在训练好的模型上进行测试
Jan 20 Python
Python读取文件内容为字符串的方法(多种方法详解)
Mar 04 Python
详解Python 循环嵌套
Jul 09 Python
python 爬取B站原视频的实例代码
Sep 09 Python
Python 类,对象,数据分类,函数参数传递详解
Sep 25 Python
python 实现分组求和与分组累加求和代码
May 18 #Python
Django ORM实现按天获取数据去重求和例子
May 18 #Python
如何实现更换Jupyter Notebook内核Python版本
May 18 #Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 #Python
Pycharm安装并配置jupyter notebook的实现
May 18 #Python
Django中的AutoField字段使用
May 18 #Python
jupyter notebook运行命令显示[*](解决办法)
May 18 #Python
You might like
文章推荐系统(二)
2006/10/09 PHP
PHP 加密解密内部算法
2010/04/22 PHP
基于PHPExcel的常用方法总结
2013/06/13 PHP
php 利用socket发送HTTP请求(GET,POST)
2015/08/24 PHP
ThinkPHP数据操作方法总结
2015/09/28 PHP
php 流程控制switch的简单实例
2016/06/07 PHP
PHP判断是否是微信打开还是浏览器打开的方法
2019/02/27 PHP
PHP7 list() 函数修改
2021/03/09 PHP
解决AJAX中跨域访问出现'没有权限'的错误
2008/08/20 Javascript
Chosen 基于jquery的选择框插件使用方法
2012/05/30 Javascript
jquery+Jscex打造游戏力度条
2020/09/12 Javascript
js实现同一个页面,多个enter事件绑定的示例
2018/10/10 Javascript
angularjs自定义过滤器demo示例
2019/08/24 Javascript
package.json配置文件构成详解
2019/08/27 Javascript
vue路由缓存的几种实现方式小结
2020/02/02 Javascript
[01:58]DOTA2上海特级锦标赛现场采访:RTZ这个ID到底好不好
2016/03/25 DOTA
Python查找相似单词的方法
2015/03/05 Python
在Python中使用HTMLParser解析HTML的教程
2015/04/29 Python
python对html代码进行escape编码的方法
2015/05/04 Python
详解Python中用于计算指数的exp()方法
2015/05/14 Python
深入解析Python编程中JSON模块的使用
2015/10/15 Python
你还在@微信官方?聊聊Python生成你想要的微信头像
2019/09/25 Python
tensorflow实现在函数中用tf.Print输出中间值
2020/01/21 Python
在PyCharm中安装PaddlePaddle的方法
2021/02/05 Python
分享一个H5原生form表单的checkbox特效代码
2018/02/26 HTML / CSS
趣天网日本站:Qoo10 JP
2019/09/18 全球购物
俄罗斯GamePark游戏商店网站:购买游戏、游戏机和配件
2020/03/13 全球购物
水污染治理专业毕业生推荐信
2013/11/14 职场文书
运动会通讯稿400字
2014/01/28 职场文书
2014年道德讲堂实施方案
2014/03/05 职场文书
GMP办公室主任岗位职责
2014/03/14 职场文书
口才训练演讲稿范文
2014/09/16 职场文书
2014年小学重阳节活动策划方案
2014/09/16 职场文书
全国爱牙日活动总结
2015/02/05 职场文书
2015年检察院个人工作总结
2015/05/20 职场文书
居安思危观后感
2015/06/11 职场文书