Python csv文件记录流程代码解析


Posted in Python onJuly 16, 2020

1、合并所有测试集和训练集的文件:

使用cmd到所在盘下,输入copy *.CSV all_***.csv即可

2、单独提取异常数据列作为csv文件:

import csv
import codecs
#coding:utf-8
with open("G:\\data_release\\train1.0\\all_train.csv","rt",encoding="utf-8")as f:
reader=csv.DictReader(f)
column=[row['triggername'] for row in reader]
file_name="G:\\data_release\\train1.0\\triggername.csv"
file_csv = codecs.open(file_name,'w+','utf-8')
writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)
for data in column:
 writer.writerow(data)

虽然可以写入,但是出现乱码原因应该为csv的BOM没有更改

解决方法:将encoding='utf8'改为encoding='gb18030'

但是打开文件发现并不是所有内容都在第一列,有一些出现第二列,原因是一句话里面出现了逗号

解决方法:遍历列表将逗号改为空格

i=0
while i < len(column):
column[i].replace(","," ")
i+=1

不知道怎么的不适合我用的csv文件,还在继续检查中

3、删除一些字符,如果知道字符的位置可以在列表的基础上进行操作

去除首部空格 line=line.lstrip()

4、导入一个csv文件的时候 data = pd.read_csv('G:\pytorch\data1.csv',encoding='utf-8')

报错的内容是这样的:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

修改至data = pd.read_csv('F:\data1.csv', encoding='unicode_escape',header=None,sep = '\t',error_bad_lines=False)也没有用

删除整行重复项:

from more_itertools import unique_everseen
with open('F:\data1.csv','r') as f, open('F:\data2.csv','w') as out_file:
    out_file.writelines(unique_everseen(f))

5、unexpected index是代码的缩进出现问题

6、文本文件用rt,二进制文件用rb打开

with open("fer2013.csv", "rt", encoding="utf-8") as vsvfile:
   reader = csv.reader(vsvfile)
   rows = [row for row in reader]
      print(rows)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
基于python实现微信模板消息
Dec 21 Python
Python采用Django制作简易的知乎日报API
Aug 03 Python
Python3.4编程实现简单抓取爬虫功能示例
Sep 14 Python
python实现数独游戏 java简单实现数独游戏
Mar 30 Python
实践Vim配置python开发环境
Jul 02 Python
python实现图片批量压缩程序
Jul 23 Python
图文详解python安装Scrapy框架步骤
May 20 Python
Python语言进阶知识点总结
May 28 Python
使用IDLE的Python shell窗口实例详解
Nov 19 Python
Django 如何使用日期时间选择器规范用户的时间输入示例代码详解
May 22 Python
在python中list作函数形参,防止被实参修改的实现方法
Jun 05 Python
如何以Winsows Service方式运行JupyterLab
Aug 30 Python
Python 抓取数据存储到Redis中的操作
Jul 16 #Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 #Python
解决python对齐错误的方法
Jul 16 #Python
Python爬虫实例——爬取美团美食数据
Jul 15 #Python
django Model层常用验证器及自定义验证器详解
Jul 15 #Python
浅谈Django前端后端值传递问题
Jul 15 #Python
浅谈python出错时traceback的解读
Jul 15 #Python
You might like
PHP环境搭建最新方法
2006/09/05 PHP
php简单统计在线人数的方法
2016/05/10 PHP
JS中剪贴板兼容性、判断复制成功或失败
2021/03/09 Javascript
jQuery中的bind绑定事件与文本框改变事件的临时解决方法
2010/08/13 Javascript
利用了jquery的ajax实现二级联互动菜单
2013/12/02 Javascript
简介JavaScript中getUTCMonth()方法的使用
2015/06/10 Javascript
在for循环中length值是否需要缓存
2015/07/27 Javascript
谈谈encodeURI和encodeURIComponent以及escape的区别与应用
2015/11/24 Javascript
AngularJS页面访问时出现页面闪烁问题的解决
2016/03/06 Javascript
JS弹出新窗口被拦截的解决方法
2016/08/09 Javascript
Nodejs 复制文件/文件夹的方法
2017/08/24 NodeJs
JavaScript requestAnimationFrame动画详解
2017/09/14 Javascript
react-navigation 如何判断用户是否登录跳转到登录页的方法
2017/12/01 Javascript
JQuery判断radio单选框是否选中并获取值的方法
2019/01/17 jQuery
JS/jQuery实现简单的开关灯效果【案例】
2019/02/19 jQuery
简单了解微信小程序 e.target与e.currentTarget的不同
2019/09/27 Javascript
[43:32]Winstrike vs VGJ.S 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
python使用7z解压apk包的方法
2015/04/18 Python
Python解析命令行读取参数--argparse模块使用方法
2018/01/23 Python
python正则实现提取电话功能
2018/02/24 Python
Python分析彩票记录并预测中奖号码过程详解
2019/07/09 Python
手把手教你进行Python虚拟环境配置教程
2020/02/03 Python
matplotlib运行时配置(Runtime Configuration,rc)参数rcParams解析
2021/01/05 Python
Python爬虫自动化爬取b站实时弹幕实例方法
2021/01/26 Python
css3实现3D文本悬停改变效果的示例代码
2019/01/16 HTML / CSS
德国家具在线:Fashion For Home
2017/03/11 全球购物
预订旅游活动、景点和旅游:GetYourGuide
2019/09/29 全球购物
自我鉴定 电子商务专业
2014/01/30 职场文书
高等教育学自荐书范文
2014/02/10 职场文书
党员学习群众路线教育实践活动对照检查材料
2014/09/23 职场文书
党员组织生活会发言材料
2014/10/17 职场文书
先进党支部事迹材料
2014/12/24 职场文书
党员倡议书
2015/01/19 职场文书
2016年端午节校园广播稿
2015/12/18 职场文书
pytorch查看网络参数显存占用量等操作
2021/05/12 Python
GitHub上77.9K的Axios项目有哪些值得借鉴的地方详析
2021/06/15 Javascript