基于python实现检索标记敏感词并输出


Posted in Python onMay 07, 2020

 一些带有过度宣传的词,在淘宝、京东对商品的宣传有一定的限制,这些最佳,最大、盗版、水货等词语都不能用于产品的宣传,可以使用程序检测敏感词,以下既是具体代码。

#检索敏感词并描红输出
#输入
word = input("请输入或拷贝含有敏感词的宣传文字:")
#敏感词库
sensitive = ['第一','国家级','最高级','最佳','独一无二','一流','仅此一次','顶级',\
       '顶尖','尖端','极品','极佳','绝佳','绝对','终极','极致','首个','首选',\
       '独家','首发','首次']
#在输入语句中发现的敏感词,放在列表中
sensitive_find = []
#newword用于标红敏感词,word用于循环
newword = word
#遍历敏感词库
for item in sensitive:
  #将至少出现一次的敏感词放到sensitive_find中,然后标红
  if word.count(item)>0:
    sensitive_find.append(item+':'+str(word.count(item))+'次')
    #newword存放标红后的整段话,word则不变
    newword = newword.replace(item,' \033[1;31m'+item+'\033[0m')
print('发现敏感词如下:')
for item in sensitive_find:
  print(item)
print('敏感词位置已用星号进行标注:\n'+newword)

结果(ps结果中有标红的部分,这里未显示,下面用部分截图说明一下):

请输入或拷贝含有敏感词的宣传文字:天猫首发,耀世登场,世界品质,庆伟制造。本产品目前是同类产品中最高级的。2018年全网销售量第一,瑶瑶领先同类产品。国内外顶级大师鼎力支持,是您居家生活的唯一选择。
发现敏感词如下:
第一:1次
最高级:1次
顶级:1次
首发:1次
敏感词位置已用星号进行标注:
天猫 首发,耀世登场,世界品质,庆伟制造。本产品目前是同类产品中 最高级的。2018年全网销售量 第一,瑶瑶领先同类产品。国内外 顶级大师鼎力支持,是您居家生活的唯一选择。

有标红部分的截图

基于python实现检索标记敏感词并输出

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中获取对象信息的方法
Apr 27 Python
python中函数总结之装饰器闭包详解
Jun 12 Python
Django admin美化插件suit使用示例
Dec 12 Python
Python从零开始创建区块链
Mar 06 Python
python异步实现定时任务和周期任务的方法
Jun 29 Python
wxpython布局的实现方法
Nov 01 Python
pandas分组聚合详解
Apr 10 Python
通过实例了解python__slots__使用方法
Sep 14 Python
Python中的特殊方法以及应用详解
Sep 20 Python
python 两种方法删除空文件夹
Sep 29 Python
python 提取html文本的方法
May 20 Python
ubuntu安装jupyter并设置远程访问的实现
Mar 31 Python
Python3自动生成MySQL数据字典的markdown文本的实现
May 07 #Python
如何搭建pytorch环境的方法步骤
May 06 #Python
Python基于Tkinter编写crc校验工具
May 06 #Python
使用Python实现批量ping操作方法
May 06 #Python
Python super()函数使用及多重继承
May 06 #Python
python中shell执行知识点
May 06 #Python
Python 通过监听端口实现唯一脚本运行方式
May 05 #Python
You might like
从零开始的异世界生活:第二季延期后,B站上架了第二部剧场版
2020/05/06 日漫
PHP中GET变量的使用
2006/10/09 PHP
PHP实现将科学计数法转换为原始数字字符串的方法
2014/12/16 PHP
PHP利用pdo_odbc实现连接数据库示例【基于ThinkPHP5.1搭建的项目】
2019/05/13 PHP
ExtJs grid行 右键菜单的两种方法
2010/06/19 Javascript
js汉字排序问题 支持中英文混排,兼容各浏览器,包括CHROME
2011/12/20 Javascript
js DOM 元素ID就是全局变量
2012/09/20 Javascript
jquery定时滑出可最小化的底部提示层特效代码
2013/10/02 Javascript
jquery.mobile 共同布局遇到的问题小结
2015/02/10 Javascript
基于Bootstrap实现下拉菜单项和表单导航条(两个菜单项,一个下拉菜单和登录表单导航条)
2016/07/22 Javascript
jquery 多个radio的click事件实例
2016/12/03 Javascript
JS实现颜色动态淡化效果
2017/03/06 Javascript
jQuery中 DOM节点操作方法大全
2017/10/12 jQuery
使用React手写一个对话框或模态框的方法示例
2019/04/25 Javascript
详解Vue2.5+迁移至Typescript指南
2019/08/01 Javascript
只有 20 行的 JavaScript 模板引擎实例详解
2020/05/11 Javascript
Ant Design moment对象和字符串之间的相互转化教程
2020/10/27 Javascript
[06:25]DOTA2英雄梦之声_第17期_大地之灵
2014/06/20 DOTA
[01:20]DOTA2上海特级锦标赛现场采访:谁的ID最受青睐
2016/03/25 DOTA
Python中实现两个字典(dict)合并的方法
2014/09/23 Python
更换Django默认的模板引擎为jinja2的实现方法
2018/05/28 Python
python实现俄罗斯方块
2018/06/26 Python
Python实现字符串匹配的KMP算法
2019/04/04 Python
python中return的返回和执行实例
2019/12/24 Python
用python解压分析jar包实例
2020/01/16 Python
解决Tensorflow占用GPU显存问题
2020/02/03 Python
Python实现CAN报文转换工具教程
2020/05/05 Python
俄罗斯第一家多品牌在线奢侈品精品店:Aizel.ru
2020/09/06 全球购物
经理秘书找工作求职信
2013/12/19 职场文书
迎八一活动主题
2014/01/31 职场文书
人力资源主管职责范本
2014/03/05 职场文书
基层党员群众路线教育实践活动个人对照检查材料思想汇报
2014/10/05 职场文书
2014年大学宣传部工作总结
2014/12/19 职场文书
初中信息技术教学反思
2016/02/16 职场文书
Django实现drf搜索过滤和排序过滤
2021/06/21 Python
python中subplot大小的设置步骤
2021/06/28 Python