python 统计文件中的字符串数目示例


Posted in Python onDecember 24, 2019

题目:

一个txt文件中已知数据格式为:

C4D
C4D/maya
C4D
C4D/su
C4D/max/AE

统计每个字段出现的次数,比如C4D、maya

先读取文件,将文件中的数据抽取出来:

def getWords(filepath):
  file = open(filepath)
  wordOne=[]
  while(file):
    line = file.readline()
    word = line.split('/')
    wordOne.extend(word)
    if(not line):      #若读取结束了
      break 
  wordtwo=[]
  for i in wordOne:
    wordtwo.extend(i.split())
  return wordtwo

说明:这个有一个要注意的地方是文件是被”\n”,”/”两种格式分割而来的,因此需要split两次。

然后定义一个dict,遍历数据,代码如下所示:

def getWordNum(words):
  dictWord={}
  for i in words:
    if(i not in dictWord):
      dictWord[i]=0
    dictWord[i]+=1
  return dictWord

主函数的调用:

filepath='data/new.txt'
words = getWords(filepath)
dictword = getWordNum(words)
print(dictword)

结果:

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明:

1,

print(type(word)) 
print(type(splitData[0]))

输出为:

<class 'list'>
<class 'str'>

就是当splitData.extend()执行之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能用split函数

2,

import os 
print(os.getcwd())

这个可以输出当前所在位置,对于读取文件很有用。

在读入文件并对文件进行切分的时候,若是含有的切分词太多,那么使用re.split()方法是最方便的,如下所示:

filepath='data/new.txt'
file = open(filepath)    #读取文件
wordOne=[]
symbol = '\n/'       #定义分隔符
symbol = "["+symbol+"]"   #拼接正则表达式
while(file):
  line = file.readline()
  word = re.split(symbol,line)
  wordOne.extend(word)
  if(not line):
    break
#通过上式得到的list中会含有很多的空字符串,所以要去空
wordOne = [x for x in wordOne if x]

以上这篇python 统计文件中的字符串数目示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中操作文件之read()方法的使用教程
May 24 Python
Python简单连接MongoDB数据库的方法
Mar 15 Python
Python在线运行代码助手
Jul 15 Python
Python 爬虫多线程详解及实例代码
Oct 08 Python
python监控键盘输入实例代码
Feb 09 Python
python使用turtle库绘制树
Jun 25 Python
python中logging模块的一些简单用法的使用
Feb 22 Python
Flask框架学习笔记之模板操作实例详解
Aug 15 Python
python同时替换多个字符串方法示例
Sep 17 Python
python生成大写32位uuid代码
Mar 03 Python
python列表删除和多重循环退出原理详解
Mar 26 Python
如何用python实现一个HTTP连接池
Jan 14 Python
如何基于python操作json文件获取内容
Dec 24 #Python
解决python 读取 log日志的编码问题
Dec 24 #Python
python实现按关键字筛选日志文件
Dec 24 #Python
python 实现提取log文件中的关键句子,并进行统计分析
Dec 24 #Python
Python3.7+tkinter实现查询界面功能
Dec 24 #Python
python 读取更新中的log 或其它文本方式
Dec 24 #Python
如何基于python操作excel并获取内容
Dec 24 #Python
You might like
令PHP初学者头疼十四条问题大总结
2008/11/12 PHP
PHP CKEditor 上传图片实现代码
2009/11/06 PHP
php检测useragent版本示例
2014/03/24 PHP
一个完整的PHP类包含的七种语法说明
2015/06/04 PHP
PHP对象实例化单例方法
2017/01/19 PHP
php面向对象之反射功能与用法分析
2017/03/29 PHP
PHPUnit + Laravel单元测试常用技能
2019/11/06 PHP
js弹窗代码 可以指定弹出间隔
2010/07/03 Javascript
基于jquery的自定义鼠标提示效果 jquery.toolTip
2010/11/14 Javascript
jQuery EasyUI API 中文文档 - TreeGrid 树表格使用介绍
2011/11/21 Javascript
js判断60秒以及倒计时示例代码
2014/01/24 Javascript
使用jQuery制作浮动工具栏的实例分享
2016/05/13 Javascript
ui组件之input多选下拉实现方法(带有搜索功能)
2016/07/14 Javascript
详解jQuery事件
2017/01/13 Javascript
js实现年月日表单三级联动
2020/04/17 Javascript
vue2组件实现懒加载浅析
2017/03/29 Javascript
ionic中的$ionicPlatform.ready事件中的通用设置
2017/06/11 Javascript
基于Vue实现后台系统权限控制的示例代码
2017/08/29 Javascript
Vue中之nextTick函数源码分析详解
2017/10/17 Javascript
ajax前台后台跨域请求处理方式
2018/02/08 Javascript
nodejs中函数的调用实例详解
2018/10/31 NodeJs
解决vscode进行vue格式化,会自动补分号和双引号的问题
2020/10/26 Javascript
python 保存float类型的小数的位数方法
2018/10/17 Python
python导入模块交叉引用的方法
2019/01/19 Python
Python搭建HTTP服务过程图解
2019/12/14 Python
利用setuptools打包python程序的方法步骤
2020/01/18 Python
解决tensorflow读取本地MNITS_data失败的原因
2020/06/22 Python
Python中return函数返回值实例用法
2020/11/19 Python
eBay法国购物网站:eBay.fr
2017/10/21 全球购物
一百多行代码实现react拖拽hooks
2021/03/23 Javascript
拾金不昧表扬信范文
2014/01/11 职场文书
团日活动总结报告
2014/06/25 职场文书
关于清明节的演讲稿2015
2015/03/18 职场文书
MySQL中IO问题的深入分析与优化
2022/04/02 MySQL
python的html标准库
2022/04/29 Python
服务器nginx权限被拒绝解决案例
2022/09/23 Servers