Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python实现rest请求api示例
Apr 22 Python
使用Python编写Linux系统守护进程实例
Feb 03 Python
Python求解平方根的方法
Mar 11 Python
python实现矩阵乘法的方法
Jun 28 Python
CentOS下使用yum安装python-pip失败的完美解决方法
Aug 16 Python
Python实现统计英文文章词频的方法分析
Jan 28 Python
Django组件cookie与session的具体使用
Jun 05 Python
Python使用字典实现的简单记事本功能示例
Aug 15 Python
djano一对一、多对多、分页实例代码
Aug 16 Python
Django Admin中增加导出CSV功能过程解析
Sep 04 Python
关于Pytorch的MLP模块实现方式
Jan 07 Python
手把手教你实现PyTorch的MNIST数据集
Jun 28 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
PHP框架Laravel插件Pagination实现自定义分页
2020/04/22 PHP
PHP实现导出带样式的Excel
2016/08/28 PHP
PHP常见过waf webshell以及最简单的检测方法
2019/05/21 PHP
jQuery实现流动虚线框的方法
2015/01/29 Javascript
js window对象属性和方法相关资料整理
2015/11/11 Javascript
HTML页面,测试JS对C函数的调用简单实例
2016/08/09 Javascript
Angular.js基础学习之初始化
2017/03/10 Javascript
基于JavaScript表单脚本(详解)
2017/10/18 Javascript
javascript填充默认头像方法
2018/02/22 Javascript
JavaScript new对象的四个过程实例浅析
2018/07/31 Javascript
使用electron将vue-cli项目打包成exe的方法
2018/09/29 Javascript
[42:24]完美世界DOTA2联赛PWL S2 LBZS vs FTD.C 第三场 11.27
2020/12/01 DOTA
python编码最佳实践之总结
2016/02/14 Python
python实现微信远程控制电脑
2018/02/22 Python
在Python中获取两数相除的商和余数方法
2018/11/10 Python
Windows 8.1 64bit下搭建 Scrapy 0.22 环境
2018/11/18 Python
Django之PopUp的具体实现方法
2019/08/31 Python
Python3.8对可迭代解包的改进及用法详解
2019/10/15 Python
在Pytorch中计算自己模型的FLOPs方式
2019/12/30 Python
Django Admin设置应用程序及模型顺序方法详解
2020/04/01 Python
TensorFlow实现批量归一化操作的示例
2020/04/22 Python
python 多进程和协程配合使用写入数据
2020/10/30 Python
Django配置跨域并开发测试接口
2020/11/04 Python
HTML5离线缓存在tomcat下部署可实现图片flash等离线浏览
2012/12/13 HTML / CSS
Html5页面点击遮罩层背景关闭遮罩层
2020/11/30 HTML / CSS
德国高尔夫商店:Golfshop.de
2019/06/22 全球购物
都柏林通行卡/城市通票:The Dublin Pass
2020/02/16 全球购物
大学四年学习的自我评价分享
2013/12/09 职场文书
法院先进个人事迹材料
2014/05/04 职场文书
重大事项社会稳定风险评估方案
2014/06/15 职场文书
法定代表人资格证明书
2014/09/11 职场文书
党员自我评议个人对照检查材料
2014/09/16 职场文书
安全生产月标语
2014/10/07 职场文书
高效笔记技巧分享:学会这些让你不再困扰
2019/09/04 职场文书
Redis Stream类型的使用详解
2021/11/11 Redis
简单聊一聊SQL注入及防止SQL注入
2022/03/23 MySQL