Python smallseg分词用法实例分析


Posted in Python onMay 28, 2015

本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:

#encoding=utf-8 
#import psyco 
#psyco.full() 
words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] 
from smallseg import SEG 
seg = SEG() 
print('Load dict...') 
seg.set(words) 
print("Dict is OK.") 
def cuttest(text): 
  wlist = seg.cut(text) 
  wlist.reverse() 
  tmp = " ".join(wlist) 
  print(tmp) 
  print("================================") 
if __name__=="__main__": 
  cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。") 
  cuttest("我不喜欢日本和服。") 
  cuttest("雷猴回归人间。") 
  cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作") 
  cuttest("我需要廉租房") 
  cuttest("永和服装饰品有限公司") 
  cuttest("我爱北京天安门") 
  cuttest("abc") 
  cuttest("隐马尔可夫") 
  cuttest("雷猴是个好网站") 
  cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") 
  cuttest("草泥马和欺实马是今年的流行词汇") 
  cuttest("伊藤洋华堂总府店") 
  cuttest("中国科学院计算技术研究所") 
  cuttest("罗密欧与朱丽叶") 
  cuttest("我购买了道具和服装")

smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。

修改了上面的两个地方,代码就可移植性了。效果还可以。

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
使用Python脚本生成随机IP的简单方法
Jul 30 Python
bat和python批量重命名文件的实现代码
May 19 Python
Python实现获取磁盘剩余空间的2种方法
Jun 07 Python
Python实现的堆排序算法示例
Apr 29 Python
解决tensorflow模型参数保存和加载的问题
Jul 26 Python
Python 将Matrix、Dict保存到文件的方法
Oct 30 Python
python ChainMap的使用和说明详解
Jun 11 Python
Python实现计算文件MD5和SHA1的方法示例
Jun 11 Python
Python函数参数定义及传递方式解析
Jun 10 Python
django filter过滤器实现显示某个类型指定字段不同值方式
Jul 16 Python
python绘图pyecharts+pandas的使用详解
Dec 13 Python
一小时学会TensorFlow2之基本操作2实例代码
Sep 04 Python
Python基于smtplib实现异步发送邮件服务
May 28 #Python
Python使用Scrapy爬取妹子图
May 28 #Python
Python实现统计单词出现的个数
May 28 #Python
Python下载懒人图库JavaScript特效
May 28 #Python
Python实现给qq邮箱发送邮件的方法
May 28 #Python
Python import用法以及与from...import的区别
May 28 #Python
Python中使用不同编码读写txt文件详解
May 28 #Python
You might like
介绍一些PHP判断变量的函数
2012/04/24 PHP
PHP下使用CURL方式POST数据至API接口的代码
2013/02/14 PHP
php递归函数中使用return的注意事项
2014/01/17 PHP
PIGCMS 如何关闭聊天机器人
2015/02/12 PHP
js获取div高度的代码
2008/08/09 Javascript
json 入门基础教程 推荐
2009/10/31 Javascript
js中substring和substr的定义和用法
2014/05/05 Javascript
JQuery实现表格动态增加行并对新行添加事件
2014/07/30 Javascript
jQuery使用fadeout实现元素渐隐效果的方法
2015/03/27 Javascript
js实现带圆角的两级导航菜单效果代码
2015/08/24 Javascript
自定义刻度jQuery进度条及插件
2015/09/02 Javascript
深入浅析JavaScript面向对象和原型函数
2016/02/06 Javascript
JavaScript 2048 游戏实例代码(简单易懂)
2016/03/25 Javascript
VueJs路由跳转——vue-router的使用详解
2017/01/10 Javascript
荐书|您有一份JavaScript书单待签收
2017/07/21 Javascript
微信小程序自定义导航栏
2018/12/31 Javascript
Python高效编程技巧
2013/01/07 Python
Python性能优化技巧
2015/03/09 Python
Python返回真假值(True or False)小技巧
2015/04/10 Python
python开发之字符串string操作方法实例详解
2015/11/12 Python
django rest framework之请求与响应(详解)
2017/11/06 Python
Python numpy实现二维数组和一维数组拼接的方法
2018/06/05 Python
OpenCV哈里斯(Harris)角点检测的实现
2020/01/15 Python
pandas分批读取大数据集教程
2020/06/06 Python
HTML5-WebSocket实现聊天室示例
2016/12/15 HTML / CSS
贝嫂喜欢的婴儿品牌,个性化的婴儿礼物:My 1st Years
2017/11/19 全球购物
澳大利亚宠物食品和药物在线:Jumbo Pets
2018/03/24 全球购物
班委竞选演讲稿
2014/04/28 职场文书
经济管理自荐书
2014/06/09 职场文书
学党史心得体会
2014/09/05 职场文书
捐助感谢信
2015/01/22 职场文书
大学开学典礼新闻稿
2015/07/17 职场文书
2015年音乐教研组工作总结
2015/07/22 职场文书
放假通知怎么写
2015/08/18 职场文书
服务行业标语口号
2015/12/26 职场文书
《家庭教育》读后感3篇
2019/12/18 职场文书