如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python爬虫教程之爬取百度贴吧并下载的示例
Mar 07 Python
在python的WEB框架Flask中使用多个配置文件的解决方法
Apr 18 Python
python安装教程 Pycharm安装详细教程
May 02 Python
python入门前的第一课 python怎样入门
Mar 06 Python
Python3.6.0+opencv3.3.0人脸检测示例
May 25 Python
python中int与str互转方法
Jul 02 Python
记一次python 内存泄漏问题及解决过程
Nov 29 Python
python3使用matplotlib绘制条形图
Mar 25 Python
python日志logging模块使用方法分析
May 23 Python
一行Python代码过滤标点符号等特殊字符
Aug 12 Python
tensorflow实现二维平面模拟三维数据教程
Feb 11 Python
python使用Windows的wmic命令监控文件运行状况,如有异常发送邮件报警
Jan 30 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
如何实现给定日期的若干天以后的日期
2006/10/09 PHP
模板引擎Smarty深入浅出介绍
2006/12/06 PHP
PHP获取当前文件所在目录 getcwd()函数
2009/05/13 PHP
细谈php中SQL注入攻击与XSS攻击
2012/06/10 PHP
PHP autoload与spl_autoload自动加载机制的深入理解
2013/06/05 PHP
浅析SVN常见问题及解决方法
2013/06/21 PHP
Zend Framework教程之Zend_Layout布局助手详解
2016/03/04 PHP
解决Laravel5.2 Auth认证退出失效的问题
2019/10/14 PHP
jQuery 阴影插件代码分享
2012/01/09 Javascript
Json对象与Json字符串互转(4种转换方式)
2013/03/27 Javascript
解决自定义$(id)的方法与jquery选择器$冲突的问题
2014/06/14 Javascript
简单实现js菜单栏切换效果
2017/03/04 Javascript
jquery.masonry瀑布流效果
2017/05/25 jQuery
jQuery实现返回顶部按钮和scroll滚动功能[带动画效果]
2017/07/05 jQuery
解决使用Vue.js显示数据的时,页面闪现原始代码的问题
2018/02/11 Javascript
vue.js使用watch监听路由变化的方法
2018/07/08 Javascript
微信小程序自定义对话框弹出和隐藏动画
2018/07/19 Javascript
解决vue select当前value没有更新到vue对象属性的问题
2018/08/30 Javascript
vue mvvm数据响应实现
2020/11/11 Javascript
详解ES6实现类的私有变量的几种写法
2021/02/10 Javascript
Python continue语句用法实例
2014/03/11 Python
详解Python的迭代器、生成器以及相关的itertools包
2015/04/02 Python
完美解决Python2操作中文名文件乱码的问题
2017/01/04 Python
Python列表list内建函数用法实例分析【insert、remove、index、pop等】
2017/07/24 Python
使用python对文件中的单词进行提取的方法示例
2018/12/21 Python
Python高级特性 切片 迭代解析
2019/08/23 Python
Python+OpenCV+图片旋转并用原底色填充新四角的例子
2019/12/12 Python
CSS3属性box-shadow使用指南
2014/12/09 HTML / CSS
利用CSS3伪元素实现逐渐发光的方格边框
2017/05/07 HTML / CSS
英国著名的美容护肤和护发产品购物网站:Lookfantastic
2020/11/23 全球购物
汽车电子与维修专业大学生求职信
2013/09/28 职场文书
学生处主任岗位职责
2013/12/01 职场文书
会计辞职信范文
2014/01/15 职场文书
学生请假条
2014/04/11 职场文书
离婚协议书范本及离婚须知
2014/10/15 职场文书
使用ORM新增数据在Mysql中的操作步骤
2021/07/26 MySQL