Python判断两个文件是否相同与两个文本进行相同项筛选的方法


Posted in Python onMarch 01, 2019

python判断两个文件是否相同

import hashlib
def getHash(f):
  line=f.readline()
  hash=hashlib.md5()
  while(line):
    hash.update(line)
    line=f.readline()
  return hash.hexdigest()
def IsHashEqual(f1,f2):
  str1=getHash(f1)
  str2=getHash(f2)
  return str1==str2
if __name__ == '__main__':
  f1=open("D:/2.iso","rb")
  f2=open("E:/wenjian/1.iso","rb")
  print IsHashEqual(f1,f2)

计算2个文件的MD5值,大文件计算较慢

python对两个文本进行相同项筛选

import os
import os.path as osp
def filter(path):
  file_path = osp.join(path, 'index.txt')
  if osp.exists(file_path):
    return file_path
  index_file = open(file_path, 'a+')
  if not os.path.isdir(path):  #判断path是否为路径 
    return  
  for root, dirs, list in os.walk(path):
    for i in list: 
      dir = os.path.join(root, i)  #将分离的部分组成一个路径名 
      #if os.path.getsize(dir) < 60000:  #获取文件大小 
        #os.remove(dir)       #删除文件 
      print (i)
      index_file.write(i+'\n')
  index_file.close()    
def compare(path):
  file=osp.join(path, 'label.txt')
  file_path = osp.join(path, 'index.txt')
  with open(file_path, 'r') as file1:
     with open(file, 'r') as file2:
       same = set(file1).intersection(file2)
  same.discard('\n')
  with open('some_output_file.txt', 'w') as file_out:
     for line in same:
       file_out.write(line)
  file_out.close()
filter(r'D:\Desktop\jiaoben\ci')
compare(r'D:\Desktop\jiaoben\ci')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python根据已知邻接矩阵绘制无向图操作示例
Jun 23 Python
详解django中使用定时任务的方法
Sep 27 Python
python 美化输出信息的实例
Oct 15 Python
10分钟教你用Python实现微信自动回复功能
Nov 28 Python
Python实现查找字符串数组最长公共前缀示例
Mar 27 Python
Python进阶之@property动态属性的实现
Apr 01 Python
python实现图片插入文字
Nov 26 Python
Python正则表达式急速入门(小结)
Dec 16 Python
python变量的作用域是什么
May 26 Python
Python如何实现FTP功能
May 28 Python
Python生成器next方法和send方法区别详解
May 30 Python
详解python内置模块urllib
Sep 09 Python
Python脚本按照当前日期创建多级目录
Mar 01 #Python
Python enumerate函数功能与用法示例
Mar 01 #Python
django模板加载静态文件的方法步骤
Mar 01 #Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 #Python
Python multiprocessing多进程原理与应用示例
Feb 28 #Python
Python中的异常处理try/except/finally/raise用法分析
Feb 28 #Python
python使用phoenixdb操作hbase的方法示例
Feb 28 #Python
You might like
PHP下用rmdir实现删除目录的三种方法小结
2008/04/20 PHP
CodeIgniter采用config控制的多语言实现根据浏览器语言自动转换功能
2014/07/18 PHP
实例讲解yii2.0在php命令行中运行的步骤
2015/12/01 PHP
利用PHP生成静态html页面的原理
2016/09/30 PHP
php利用gd库为图片添加水印
2016/11/09 PHP
PHPUnit测试私有属性和方法功能示例
2018/06/12 PHP
Laravel使用原生sql语句并调用的方法
2019/10/09 PHP
PHP使用JpGraph绘制折线图操作示例【附源码下载】
2019/10/18 PHP
一个基于jquery的图片切换效果
2010/07/06 Javascript
读jQuery之十一 添加事件核心方法
2011/07/31 Javascript
关于innerHTML后丢失动态绑定的EVENT问题解决方法
2013/05/19 Javascript
JS 对输入框进行限制(常用的都有)
2013/07/30 Javascript
jQuery自动切换/点击切换选项卡效果的小例子
2013/08/12 Javascript
javascript不同类型数据之间的运算的转换方法
2014/02/13 Javascript
JavaScript中判断整数的多种方法总结
2014/11/08 Javascript
深入理解JavaScript中的对象
2015/06/04 Javascript
常用的JQuery函数及功能小结
2016/03/24 Javascript
JS实现根据密码长度显示安全条功能
2017/03/08 Javascript
详解从Vue.js源码看异步更新DOM策略及nextTick
2017/10/11 Javascript
mint-ui 时间插件使用及获取选择值的方法
2018/02/09 Javascript
clipboard在vue中的使用的方法示例
2018/10/19 Javascript
加速vue组件渲染之性能优化
2020/04/09 Javascript
vue 扩展现有组件的操作
2020/08/14 Javascript
[01:20:05]DOTA2-DPC中国联赛 正赛 Ehome vs VG BO3 第二场 2月5日
2021/03/11 DOTA
python数据类型之间怎么转换技巧分享
2019/08/20 Python
Python实现快速大文件比较代码解析
2020/09/04 Python
CSS3对图片照片进行边缘模糊处理的实现
2018/08/08 HTML / CSS
Python里面search()和match()的区别
2016/09/21 面试题
企业文化宣传标语
2014/06/09 职场文书
2015年幼儿园学期工作总结
2015/05/22 职场文书
2016年领导干部正风肃纪心得体会
2015/10/09 职场文书
导游词之山西祁县乔家大院
2019/10/14 职场文书
小程序实现悬浮按钮的全过程记录
2021/10/16 HTML / CSS
Redis调用Lua脚本及使用场景快速掌握
2022/03/16 Redis
Python之matplotlib绘制折线图
2022/04/13 Python
永中文档在线转换预览基于nginx配置部署方案
2022/06/10 Servers