用python获取txt文件中关键字的数量


Posted in Python onDecember 24, 2020

缘起:

开发人员需要tomcat中一个项目在一个月的访问请求量,因其他原因只剩下查找tomcat请求日志的方法获取,刚好最近在学习python,于是就用python摸索了下;

大体思路:

                  1.把相应tomcat的日志文件拷到有python环境的机器

 2.用os.listdir()获取到目录下所有文件名称的列表,再用for循环遍历列表加上字符串拼接得到已文件名的具体路径

 3.用open()读取文件,下面代码中for line in f:是按行读取txt文件的内容(一行一行的读,不会加载全部文件内容)

 4.用count()方法统计以项目为名的关键字(字符串)

知识点:

文件的读取和count()方法

Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。

count()方法语法:str.count(sub, start= 0,end=len(string))

参数:

  • sub -- 搜索的子字符串
  • start -- 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
  • end -- 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

代码如下

(如果文件过多可以加工作队列(gevent库)):

import os

# 打?日?文件并计数
def read_log(url,keyword):
  count = 0
  with open(url,'r',encoding='utf-8') as f:  # 打开文件
  for line in f:                  # 按行读取txt文件
    count += line.count(keyword,53,64)  # count()方法计数,keyword为传入的关键字(字符串)
return count

path= 'E:\\python\\vscode\\工作\\log\\80\\'
dirlist = os.listdir(path)  # 获取path路径下的所有txt文件名

sum = 0
for name in dirlist: 

# 遍历获取txt文件名
  url = path + name
  num = read_log(url,keyword)
  print(str(name) + ' 文件中个数为: ' + str(num))
  sum += num
print('关键字总个数: ' + str(sum))

以上就是用python获取txt文件中关键字的数量的详细内容,更多关于python 获取关键字的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
仅用500行Python代码实现一个英文解析器的教程
Apr 02 Python
详解Django中Request对象的相关用法
Jul 17 Python
Python 正则表达式的高级用法
Dec 04 Python
python实现二分查找算法
Sep 21 Python
python之DataFrame实现excel合并单元格
Feb 22 Python
python调用外部程序的实操步骤
Mar 04 Python
python网络爬虫 Scrapy中selenium用法详解
Sep 28 Python
python SVD压缩图像的实现代码
Nov 05 Python
使用python快速实现不同机器间文件夹共享方式
Dec 22 Python
解决pycharm每次打开项目都需要配置解释器和安装库问题
Feb 26 Python
基于CentOS搭建Python Django环境过程解析
Aug 24 Python
python实现进度条的多种实现
Apr 29 Python
举例讲解Python装饰器
Dec 24 #Python
python 基于opencv操作摄像头
Dec 24 #Python
python 基于selenium实现鼠标拖拽功能
Dec 24 #Python
python实现简单猜单词游戏
Dec 24 #Python
Python 虚拟环境工作原理解析
Dec 24 #Python
python基于openpyxl生成excel文件
Dec 23 #Python
Python+unittest+requests+excel实现接口自动化测试框架
Dec 23 #Python
You might like
删除及到期域名的查看(抢域名必备哦)
2008/05/14 PHP
超级简单的php+mysql留言本源码
2009/11/11 PHP
PHP 获取目录下的图片并随机显示的代码
2009/12/28 PHP
理解php Hash函数,增强密码安全
2011/02/25 PHP
thinkPHP实现表单自动验证
2014/12/24 PHP
非常重要的php正则表达式详解
2016/01/04 PHP
深入浅析yii2-gii自定义模板的方法
2016/04/26 PHP
使用JavaScript创建新样式表和新样式规则
2016/06/14 PHP
php获取是星期几的的一些常用姿势
2019/12/15 PHP
国外Lightbox v2.03.3 最新版 下载
2007/10/17 Javascript
javascript背投广告代码的完善
2008/04/08 Javascript
JavaScript 应用技巧集合[推荐]
2009/08/30 Javascript
javascript的push使用指南
2014/12/05 Javascript
在js代码拼接dom对象到页面上的模板总结
2018/10/21 Javascript
jQuery each和js forEach用法比较
2019/02/27 jQuery
layui 选择列表,打勾,点击确定返回数据的例子
2019/09/02 Javascript
原生JavaScript实现日历功能代码实例(无引用Jq)
2019/09/23 Javascript
python抓取网页图片并放到指定文件夹
2014/04/24 Python
Python使用poplib模块和smtplib模块收发电子邮件的教程
2016/07/02 Python
Python线程池模块ThreadPoolExecutor用法分析
2018/12/28 Python
使用Python刷淘宝喵币(低阶入门版)
2019/10/30 Python
python实发邮件实例详解
2019/11/11 Python
python+opencv3生成一个自定义纯色图教程
2020/02/19 Python
pytorch 模型的train模式与eval模式实例
2020/02/20 Python
python利用xlsxwriter模块 操作 Excel
2020/10/14 Python
python 邮件检测工具mmpi的使用
2021/01/04 Python
详解HTML5 canvas绘图基本使用方法
2018/01/29 HTML / CSS
初中地理教学反思
2014/01/11 职场文书
松材线虫病防治方案
2014/06/15 职场文书
单位法定代表人授权委托书
2014/09/20 职场文书
大学辅导员述职报告
2015/01/10 职场文书
2015年手术室工作总结
2015/05/11 职场文书
借条格式范本
2015/05/25 职场文书
Python获取百度热搜的完整代码
2021/04/07 Python
JavaScript 对象创建的3种方法
2021/11/17 Javascript
台积电称即便经济低迷也没有降价的计划
2022/04/21 数码科技