Python 读取某个目录下所有的文件实例


Posted in Python onJune 23, 2018

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码

<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
 #准确获取一个txt的位置,利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把结果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的数据清空 
 datas.clear()
 
 #把数据add到datas中,可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路径
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的数据输出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #释放资源
 unique_keywords.close()</span>

以上这篇Python 读取某个目录下所有的文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用reportlab画图示例(含中文汉字)
Dec 03 Python
python中django框架通过正则搜索页面上email地址的方法
Mar 21 Python
Flask框架的学习指南之开发环境搭建
Nov 20 Python
Python中如何获取类属性的列表
Dec 26 Python
Python实现FTP弱口令扫描器的方法示例
Jan 31 Python
Python实现定时自动关闭的tkinter窗口方法
Feb 16 Python
详解Python 切片语法
Jun 10 Python
python实现删除列表中某个元素的3种方法
Jan 15 Python
解决Tensorboard 不显示计算图graph的问题
Feb 15 Python
Python读取excel文件中带公式的值的实现
Apr 17 Python
python分布式爬虫中消息队列知识点详解
Nov 26 Python
Python 全局空间和局部空间
Apr 06 Python
python保存数据到本地文件的方法
Jun 23 #Python
基于Python List的赋值方法
Jun 23 #Python
python统计多维数组的行数和列数实例
Jun 23 #Python
Python返回数组/List长度的实例
Jun 23 #Python
python 定义给定初值或长度的list方法
Jun 23 #Python
Python列表解析配合if else的方法
Jun 23 #Python
基于Python列表解析(列表推导式)
Jun 23 #Python
You might like
layui框架实现文件上传及TP3.2.3(thinkPHP)对上传文件进行后台处理操作示例
2018/05/12 PHP
childNodes.length与children.length的区别
2009/05/14 Javascript
让textarea自动调整大小的js代码
2011/04/12 Javascript
jquery 操作日期、星期、元素的追加的实现代码
2012/02/07 Javascript
Lazy Load 延迟加载图片的jQuery插件中文使用文档
2012/10/18 Javascript
js判断变量是否未定义的代码
2020/03/28 Javascript
优化RequireJS项目的相关技巧总结
2015/07/01 Javascript
jQuery中extend函数详解
2015/07/13 Javascript
郁闷!ionic中获取ng-model绑定的值为undefined如何解决
2016/08/27 Javascript
JS控制HTML元素的显示和隐藏的两种方法
2016/09/27 Javascript
js浏览器html5表单验证
2016/10/17 Javascript
Web前端开发之水印、图片验证码
2016/11/27 Javascript
vue2 自定义动态组件所遇到的问题
2017/06/08 Javascript
video.js 实现视频只能后退不能快进的思路详解
2018/08/09 Javascript
HTML+JS实现“代码雨”效果源码(黑客帝国文字下落效果)
2020/03/17 Javascript
详解微信小程序工程化探索之webpack实战
2020/04/20 Javascript
[05:04]完美世界携手游戏风云打造 卡尔工作室地图界面篇
2013/04/23 DOTA
[02:41]DOTA2亚洲邀请赛小组赛第三日 赛事回顾
2015/02/01 DOTA
通过python下载FTP上的文件夹的实现代码
2013/02/10 Python
Python程序员开发中常犯的10个错误
2014/07/07 Python
分享Python开发中要注意的十个小贴士
2016/08/30 Python
win10下Python3.6安装、配置以及pip安装包教程
2017/10/01 Python
TensorFlow模型保存/载入的两种方法
2018/03/08 Python
基于Python函数和变量名解析
2019/07/19 Python
python线程池如何使用
2020/05/28 Python
马德里运动鞋商店:Nigra Mercato
2020/02/16 全球购物
物流管理应届生求职信
2013/11/07 职场文书
小学体育教学反思
2014/01/31 职场文书
创业者是否需要商业计划书?
2014/02/07 职场文书
祖国在我心中演讲稿600字
2014/05/04 职场文书
反腐倡廉警示教育活动总结
2014/05/05 职场文书
学校爱国卫生月活动总结
2014/06/25 职场文书
2014年财政所工作总结
2014/11/22 职场文书
2015年全国“爱牙日”宣传活动总结
2015/03/23 职场文书
通知格式
2015/04/27 职场文书
日元符号 ¥
2022/02/17 杂记