python实现统计文本中单词出现的频率详解


Posted in Python onMay 20, 2019

本文实例为大家分享了python统计文本中单词出现频率的具体代码,供大家参考,具体内容如下

#coding=utf-8
import os
from collections import Counter
sumsdata=[]
for fname in os.listdir(os.getcwd()):
  if os.path.isfile(fname) and fname.endswith('.txt'):
    with open(fname,'r') as fp:
      data=fp.readlines()
    sumsdata+=[line.strip().lower() for line in data]
cnt=Counter()
for word in sumsdata:
  cnt[word]+=1
cnt=dict(cnt)
for key,value in cnt.items():
  print(key+":"+str(value))

首先在和程序所在路径下创建几个文本文件,我建了两个,文件内容分别为hello python goodbye python 和 i like python。运行程序,得到以下结果

python实现统计文本中单词出现的频率详解

以上所述是小编给大家介绍的python统计文本中单词出现频率详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python导入oracle数据的方法
Jul 10 Python
python实现基本进制转换的方法
Jul 11 Python
Python多进程分块读取超大文件的方法
Apr 13 Python
python中 chr unichr ord函数的实例详解
Aug 06 Python
Python正则捕获操作示例
Aug 19 Python
python递归实现快速排序
Aug 18 Python
python3.7.0的安装步骤
Aug 27 Python
python ChainMap的使用和说明详解
Jun 11 Python
python 缺失值处理的方法(Imputation)
Jul 02 Python
python opencv实现证件照换底功能
Aug 19 Python
Tensorflow之梯度裁剪的实现示例
Mar 08 Python
如何使用 Flask 做一个评论系统
Nov 27 Python
详解Python字符串切片
May 20 #Python
Django中ORM外键和表的关系详解
May 20 #Python
利用Django模版生成树状结构实例代码
May 19 #Python
使用Python3内置文档高效学习以及官方中文文档
May 19 #Python
python反编译学习之字节码详解
May 19 #Python
python从入门到精通 windows安装python图文教程
May 18 #Python
详解用Python实现自动化监控远程服务器
May 18 #Python
You might like
PHP 文件扩展名 获取函数
2009/06/03 PHP
php过滤表单提交的html等危险代码
2014/11/03 PHP
PHP在同一域名下两个不同的项目做独立登录机制详解
2017/09/22 PHP
文本框中,回车键触发事件的js代码[多浏览器兼容]
2010/06/07 Javascript
jQuery插件开发基础简单介绍
2013/01/07 Javascript
SOSO地图JS画出标注和中心点以html形式运行
2013/08/09 Javascript
JS显示表格内指定行html代码的方法
2015/03/31 Javascript
获取阴历(农历)和当前日期的js代码
2016/02/15 Javascript
Vue.js 父子组件通讯开发实例
2016/09/06 Javascript
Angularjs自定义指令实现三级联动 选择地理位置
2017/02/13 Javascript
koa上传excel文件并解析的实现方法
2018/08/09 Javascript
LayUi中接口传数据成功,表格不显示数据的解决方法
2018/08/19 Javascript
Vue项目数据动态过滤实践及实现思路
2018/09/11 Javascript
Vue实现简单分页器
2018/12/29 Javascript
Koa从零搭建到Api实现项目的搭建方法
2019/07/30 Javascript
[01:00:04]DOTA2上海特级锦标赛B组小组赛#1 Alliance VS Spirit第二局
2016/02/26 DOTA
Python生成随机验证码的两种方法
2015/12/22 Python
利用Python画ROC曲线和AUC值计算
2016/09/19 Python
python实现数据图表
2017/07/29 Python
Python中xrange与yield的用法实例分析
2017/12/26 Python
python中将字典形式的数据循环插入Excel
2018/01/16 Python
Python编写一个优美的下载器
2018/04/15 Python
python判断数字是否是超级素数幂
2018/09/27 Python
Python Opencv任意形状目标检测并绘制框图
2019/07/23 Python
python 利用jinja2模板生成html代码实例
2019/10/10 Python
玩具反斗城美国官网:Toys"R"Us
2016/09/17 全球购物
New Balance英国官方网站:始于1906年,百年慢跑品牌
2016/12/07 全球购物
美国在线乐器和设备商店:Musician’s Friend
2018/07/06 全球购物
27个经典Linux面试题及答案,你知道几个?
2013/01/10 面试题
测绘工程个人的自我评价
2013/11/23 职场文书
创先争优承诺书范文
2014/03/31 职场文书
做一个有道德的人活动实施方案
2014/08/23 职场文书
九年级历史教学反思
2016/02/19 职场文书
详解PHP Swoole与TCP三次握手
2021/05/27 PHP
Python办公自动化之教你如何用Python将任意文件转为PDF格式
2021/06/28 Python
教你在 Java 中实现 Dijkstra 最短路算法的方法
2022/04/08 Java/Android