python统计文本文件内单词数量的方法


Posted in Python onMay 30, 2015

本文实例讲述了python统计文本文件内单词数量的方法。分享给大家供大家参考。具体实现方法如下:

# count lines, sentences, and words of a text file
# set all the counters to zero
lines, blanklines, sentences, words = 0, 0, 0, 0
print '-' * 50
try:
 # use a text file you have, or google for this one ...
 filename = 'GettysburgAddress.txt'
 textf = open(filename, 'r')
except IOError:
 print 'Cannot open file %s for reading' % filename
 import sys
 sys.exit(0)
# reads one line at a time
for line in textf:
 print line,  # test
 lines += 1
 if line.startswith('\n'):
  blanklines += 1
 else:
  # assume that each sentence ends with . or ! or ?
  # so simply count these characters
  sentences += line.count('.') + line.count('!') + line.count('?')
  # create a list of words
  # use None to split at any whitespace regardless of length
  # so for instance double space counts as one space
  tempwords = line.split(None)
  print tempwords # test
  # word total count
  words += len(tempwords)
textf.close()
print '-' * 50
print "Lines   : ", lines
print "Blank lines: ", blanklines
print "Sentences : ", sentences
print "Words   : ", words
# optional console wait for keypress
from msvcrt import getch
getch()

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python字符串过滤性能比较5种方法
Jun 22 Python
python进行TCP端口扫描的实现
Dec 21 Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 Python
python实现趣味图片字符化
Apr 30 Python
获取django框架orm query执行的sql语句实现方法分析
Jun 20 Python
Python解决pip install时出现的Could not fetch URL问题
Aug 01 Python
详解Python文件修改的两种方式
Aug 22 Python
python pptx复制指定页的ppt教程
Feb 14 Python
开启Django博客的RSS功能的实现方法
Feb 17 Python
python实现图片横向和纵向拼接
Mar 05 Python
VSCode配合pipenv搞定虚拟环境的实现方法
May 17 Python
python 如何用urllib与服务端交互(发送和接收数据)
Mar 04 Python
python使用win32com库播放mp3文件的方法
May 30 #Python
基于wxpython开发的简单gui计算器实例
May 30 #Python
python图像处理之镜像实现方法
May 30 #Python
python图像处理之反色实现方法
May 30 #Python
python中字典(Dictionary)用法实例详解
May 30 #Python
python集合用法实例分析
May 30 #Python
基于wxpython实现的windows GUI程序实例
May 30 #Python
You might like
基于PHP与XML的PDF文档生成技术
2006/10/09 PHP
php 删除cookie和浏览器重定向
2009/03/16 PHP
php 在文件指定行插入数据的代码
2010/05/08 PHP
PHP中filter函数校验数据的方法详解
2015/07/31 PHP
thinkphp实现附件上传功能
2017/05/26 PHP
PHP过滤器 filter_has_var() 函数用法实例分析
2020/04/23 PHP
尽可能写"友好"的"Javascript"代码
2007/01/09 Javascript
JavaScript 指导方针
2007/04/05 Javascript
Jquery调用webService远程访问出错的解决方法
2010/05/21 Javascript
JQuery实现鼠标滑过显示导航下拉列表
2013/09/12 Javascript
js改变文章字体大小的实例代码
2013/11/27 Javascript
JS清空多文本框、文本域示例代码
2014/02/24 Javascript
javascript单例模式的简单实现方法
2015/07/25 Javascript
详解jQuery中的元素的属性和相关操作
2015/08/14 Javascript
js钢琴按钮波浪式图片排列效果代码分享
2015/08/26 Javascript
JavaScript中innerHTML,innerText,outerHTML的用法及区别
2015/09/01 Javascript
JS截取字符串实例详解
2015/11/24 Javascript
JavaScript实现的微信二维码图片生成器的示例
2016/10/26 Javascript
教你一步步用jQyery实现轮播器
2016/12/18 Javascript
微信小程序实现表单校验功能
2020/03/30 Javascript
详解Vue用自定义指令完成一个下拉菜单(select组件)
2017/10/31 Javascript
NodeJS 实现多语言的示例代码
2018/09/11 NodeJs
基于vue v-for 多层循环嵌套获取行数的方法
2018/09/26 Javascript
JS无限级导航菜单实现方法
2019/01/05 Javascript
python中将字典形式的数据循环插入Excel
2018/01/16 Python
python数据处理之如何选取csv文件中某几行的数据
2019/09/02 Python
解决tensorflow添加ptb库的问题
2020/02/10 Python
使用Keras 实现查看model weights .h5 文件的内容
2020/06/09 Python
linux面试题参考答案(11)
2016/11/26 面试题
应聘自荐书
2013/10/08 职场文书
创先争优活动方案
2014/02/12 职场文书
群众路线学习笔记范文
2014/11/06 职场文书
作文评语怎么写
2014/12/25 职场文书
css display table 自适应高度、宽度问题的解决
2021/05/07 HTML / CSS
使用Pytorch实现two-head(多输出)模型的操作
2021/05/28 Python
postgres之jsonb属性的使用操作
2021/06/23 PostgreSQL