python实现搜索文本文件内容脚本


Posted in Python onJune 22, 2018

本文介绍用python实现的搜索本地文本文件内容的小程序。从而学习Python I/O方面的知识。代码如下:

import os

#根据文件扩展名判断文件类型
def endWith(s,*endstring):
 array = map(s.endswith,endstring)
 if True in array:
  return True
 else:
  return False

#将全部已搜索到的关键字列表中的内容保存到result.log文件中
def writeResultLog(allExistsKeywords):
 #行分隔符
 ls = os.linesep
 #结果日志文件名
 logfilename = "result.log" #相对路径,文件在.py文件所在的目录中
 try:
  fobj = open(logfilename,'w')
 except IOError,e:
  print "*** file open error:",e
 else:
  fobj.writelines(['%s%s' % (keyword,ls) for keyword in allExistsKeywords])
  fobj.close() 


#搜索指定关键字是否在指定的文件中存在
def searchFilesContent(dirname):
 #从searchkeywords.txt文件中初始化待搜索关键字列表
 filename = "searchkeywords.txt" #相对路径,文件在.py文件所在的目录中
 #待搜索关键字列表
 allSearchKeywords=[]
 #遍历文件当前行已搜索到的关键字列表
 existsKeywordsThisLine=[]
 #全部已搜索到的关键字列表
 allExistsKeywords=[]

 try:
  fobj = open(filename,'r');
 except IOError,e:
  print "*** file open error:",e
 else:
  for eachLine in fobj:
   allSearchKeywords.append(eachLine.strip('\n')); #使用strip函数去除每行的换行符
  fobj.close();

 #从excludekeywords.txt文件中初始化要排除的搜索关键字列表
 filename = "excludekeywords.txt" #相对路径,文件在.py文件所在的目录中
 #要排除的搜索关键字列表
 allExcludedKeywords=[]
 try:
  fobj = open(filename,'r');
 except IOError,e:
  print "*** file open error:",e
 else:
  for eachLine in fobj:
   allExcludedKeywords.append(eachLine.strip('\n')); #使用strip函数去除每行的换行符
  fobj.close();

 #从全部已搜索到的关键字列表排除掉不用搜索的关键字
 for excluedkw in allExcludedKeywords:
  if(excluedkw in allSearchKeywords):
   allSearchKeywords.remove(excluedkw);


 #遍历打开所有要在其中搜索内容的文件,若待搜索关键字列表为空,则不再继续遍历
 for root,dirs,files in os.walk(dirname):
  for file in files:
   if endWith(file,'.java','.xml','.properties'): #只在扩展名为.java/.xml/.properties文件中搜索
    #打开文件
    filename = root + os.sep + file #绝对路径
    filename = filename.replace("\\","\\\\") #将路径中的单反斜杠替换为双反斜杠,因为单反斜杠可能会导致将路径中的内容进行转义了,replace函数中"\\"表示单反斜杠,"\\\\"表示双反斜杠
    try:
     fobj = open(filename,'r');
    except IOError,e:
     print "*** file open error:",e
    else:
     #遍历文件的每一行
     for fileLine in fobj:
      #判断当前行是否包含所有搜索关键字
      for keyword in allSearchKeywords:
       #若包含,并添加到该行已搜索到的关键字列表中
       if keyword.upper() in fileLine.upper(): #将搜索关键字和该行文本内容都转换为大写后再进行匹配
        existsKeywordsThisLine.append(keyword)

      #将这些搜索到的关键字添加到全部已搜索到的关键字列表中,并包含文件名信息
      for keyword in existsKeywordsThisLine:
       allExistsKeywords.append(keyword+"\t"+filename.replace("\\\\","\\"))

      #将这些搜索到的关键字从待搜索关键字列表中移除(后续将不再搜索该关键字)
      for keyword in existsKeywordsThisLine:
       allSearchKeywords.remove(keyword)

      #清空该行已搜索到的关键字列表内容
      existsKeywordsThisLine = []

      #若所有的关键字都搜索到了,则记录日志文件,并结束搜索工作
      if len(allSearchKeywords)==0:
       fobj.close();
       writeResultLog(allExistsKeywords)
       print "DONE!",
       return
     fobj.close();

 #全部文件遍历结束
 writeResultLog(allExistsKeywords)
 print "DONE!",



#仅当本python模块直接执行时,才执行如下语句,若被别的python模块引入,则不执行
if __name__ == '__main__':
 searchFilesContent(r"G:\ccsSmartPipe\SmartPipe\src\java")

1.笔者使用该程序对java项目中的源文件内容进行关键字的搜索。程序入参为该项目本地文件系统路径G:\ccsSmartPipe\SmartPipe\src\java。

2.在配置文件中searchkeywords.txt中输入要搜索的任意多个关键字

python实现搜索文本文件内容脚本

3.在配置文件中excludekeywords.txt中输入在searchkeywords.

python实现搜索文本文件内容脚本

4.程序执行完成后,即可在result.log日志文件中,查看搜索结果。即每个关键在哪些文件中存在。并给出每个文件的具体路径。

python实现搜索文本文件内容脚本

附件:源代码及配置文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python生成XML的方法实例
Mar 21 Python
Python调用C# Com dll组件实战教程
Oct 12 Python
对python同一个文件夹里面不同.py文件的交叉引用方法详解
Dec 15 Python
python爬虫解决验证码的思路及示例
Aug 01 Python
Python字符串处理的8招秘籍(小结)
Aug 13 Python
Mac 使用python3的matplot画图不显示的解决
Nov 23 Python
Python通过正则库爬取淘宝商品信息代码实例
Mar 02 Python
Python关键字及可变参数*args,**kw原理解析
Apr 04 Python
Python爬虫使用bs4方法实现数据解析
Aug 25 Python
Python爬虫破解登陆哔哩哔哩的方法
Nov 17 Python
详解Python GUI编程之PyQt5入门到实战
Dec 10 Python
使用Python爬取小姐姐图片(beautifulsoup法)
Feb 11 Python
python实现textrank关键词提取
Jun 22 #Python
python实现自主查询实时天气
Jun 22 #Python
python实现定时提取实时日志程序
Jun 22 #Python
pandas 读取各种格式文件的方法
Jun 22 #Python
python使用turtle库绘制时钟
Mar 25 #Python
Python日期时间对象转换为字符串的实例
Jun 22 #Python
python pandas 对时间序列文件处理的实例
Jun 22 #Python
You might like
codeigniter使用技巧批量插入数据实例方法分享
2013/12/31 PHP
php创建和删除目录函数介绍和递归删除目录函数分享
2014/11/18 PHP
php绘制一个扇形的方法
2015/01/24 PHP
详解Yii2 定制表单输入字段的标签和样式
2017/01/04 PHP
PHP PDO和消息队列的个人理解与应用实例分析
2019/11/25 PHP
两种常用的javascript数组去重方法思路及代码
2013/03/26 Javascript
jquery更换文章内容与改变字体大小代码
2013/09/30 Javascript
影响jQuery使用的14个方面
2014/09/01 Javascript
基于jQuery的JavaScript模版引擎JsRender使用指南
2014/12/29 Javascript
JavaScript分秒倒计时器实现方法
2015/02/02 Javascript
JQuery操作元素的css样式
2015/03/09 Javascript
jQuery实现点击某个div打开层,点击其他div关闭层实例分析(阻止冒泡)
2016/11/18 Javascript
微信小程序实现滑动删除效果
2017/05/19 Javascript
Vue.extend构造器的详解
2017/07/17 Javascript
bootstrap table实现x-editable的行单元格编辑及解决数据Empty和支持多样式问题
2017/08/10 Javascript
如何用webpack4带你实现一个vue的打包的项目
2018/06/20 Javascript
ES6 中可以提升幸福度的小功能
2018/08/06 Javascript
基于element-ui的rules中正则表达式
2018/09/04 Javascript
微信小程序实现签到功能
2018/10/31 Javascript
vue实现计算器功能
2020/02/22 Javascript
Python中的True,False条件判断实例分析
2015/01/12 Python
python中将字典形式的数据循环插入Excel
2018/01/16 Python
PyQt5+Caffe+Opencv搭建人脸识别登录界面
2019/08/28 Python
Django 自定义权限管理系统详解(通过中间件认证)
2020/03/11 Python
Python HTMLTestRunner测试报告view按钮失效解决方案
2020/05/25 Python
Python如何安装第三方模块
2020/05/28 Python
如何解决pycharm调试报错的问题
2020/08/06 Python
JBL加拿大官方商店:扬声器、耳机等
2020/10/23 全球购物
中学生自我评价范文
2014/02/08 职场文书
大学生心理活动总结
2014/07/04 职场文书
高三英语教学计划
2015/01/23 职场文书
慰问信模板
2015/02/14 职场文书
2015年会计工作总结范文
2015/05/26 职场文书
社区低保工作总结2015
2015/07/23 职场文书
科级干部培训心得体会
2016/01/06 职场文书
python实现自动清理文件夹旧文件
2021/05/10 Python