Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python文件及目录操作实例详解
Jun 04 Python
python语言中with as的用法使用详解
Feb 23 Python
Python 爬虫之Beautiful Soup模块使用指南
Jul 05 Python
Python输出\u编码将其转换成中文的实例
Dec 15 Python
利用nohup来开启python文件的方法
Jan 14 Python
python的turtle库使用详解
May 10 Python
pandas计数 value_counts()的使用
Jun 24 Python
Django Python 获取请求头信息Content-Range的方法
Aug 06 Python
Python3直接爬取图片URL并保存示例
Dec 18 Python
Python PyPDF2模块安装使用解析
Jan 19 Python
tensorflow 保存模型和取出中间权重例子
Jan 24 Python
pytorch 权重weight 与 梯度grad 可视化操作
Jun 05 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
PHP实现的oracle分页函数实例
2016/01/25 PHP
基于Codeigniter框架实现的student信息系统站点动态发布功能详解
2017/03/23 PHP
Windows平台PHP+IECapt实现网页批量截图并创建缩略图功能详解
2019/08/02 PHP
通过Jscript中@cc_on 语句识别IE浏览器及版本的代码
2011/05/07 Javascript
jquery的each方法使用示例分享
2014/03/25 Javascript
JS嵌套函数调用上下文的问题解决
2014/03/26 Javascript
javascript实现图片循环渐显播放的方法
2015/02/24 Javascript
基于WebUploader的文件上传js插件
2016/08/19 Javascript
jQuery点击导航栏选中更换样式的实现代码
2017/01/23 Javascript
js如何找出字符串中的最长回文串
2018/06/04 Javascript
layui从数据库中获取复选框的值并默认选中方法
2018/08/15 Javascript
vue 2.1.3 实时显示当前时间,每秒更新的方法
2018/09/16 Javascript
Three.js中矩阵和向量的使用教程
2019/03/19 Javascript
vue在自定义组件中使用v-model进行数据绑定的方法
2019/03/25 Javascript
jQuery表单选择器用法详解
2019/08/22 jQuery
js实现QQ邮箱邮件拖拽删除功能
2020/08/27 Javascript
python备份文件的脚本
2008/08/11 Python
python数据结构之二叉树的建立实例
2014/04/29 Python
Python Requests安装与简单运用
2016/04/07 Python
python实现批量监控网站
2016/09/09 Python
基于Python os模块常用命令介绍
2017/11/03 Python
Python编程之gui程序实现简单文件浏览器代码
2017/12/08 Python
Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
2019/01/04 Python
Python 多线程搜索txt文件的内容,并写入搜到的内容(Lock)方法
2019/08/23 Python
Python第三方库安装缓慢的解决方法
2021/02/06 Python
澳大利亚电商Catch新西兰站:Catch.co.nz
2020/05/30 全球购物
大学军训自我鉴定
2013/12/15 职场文书
园林资料员岗位职责
2013/12/30 职场文书
校园报刊亭创业计划书
2014/01/02 职场文书
食品安全责任书
2014/04/15 职场文书
组织生活会发言材料
2014/12/15 职场文书
2016大学生优秀志愿者事迹材料
2016/02/25 职场文书
创业的9条正确思考方式
2019/08/26 职场文书
muduo TcpServer模块源码分析
2022/04/26 Redis
MySQL 数据表操作
2022/05/04 MySQL
ubuntu开机后ROS程序自启动问题
2022/12/24 Servers