如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python发布模块的步骤分享
Feb 21 Python
在Linux系统上通过uWSGI配置Nginx+Python环境的教程
Dec 25 Python
python3.4用循环往mysql5.7中写数据并输出的实现方法
Jun 20 Python
Python探索之爬取电商售卖信息代码示例
Oct 27 Python
python批量修改图片尺寸,并保存指定路径的实现方法
Jul 04 Python
通过python实现弹窗广告拦截过程详解
Jul 10 Python
解决tensorflow训练时内存持续增加并占满的问题
Jan 19 Python
Python实现鼠标自动在屏幕上随机移动功能
Mar 14 Python
Pyspark读取parquet数据过程解析
Mar 27 Python
Python常用数据分析模块原理解析
Jul 20 Python
详解利用python识别图片中的条码(pyzbar)及条码图片矫正和增强
Nov 17 Python
聊聊Python String型列表求最值的问题
Jan 18 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
php 将bmp图片转为jpg等其他任意格式的图片
2009/06/21 PHP
php算开始时间到过期时间的相隔的天数
2011/01/12 PHP
PHP查询MySQL大量数据的时候内存占用分析
2011/07/22 PHP
文本加密解密
2006/06/23 Javascript
记录几个javascript有关的小细节
2007/04/02 Javascript
jquery 选择器部分整理
2009/10/28 Javascript
Jquery Ajax学习实例4 向WebService发出请求,返回实体对象的异步调用
2010/03/16 Javascript
jQuery 获取对象 定位子对象
2010/05/31 Javascript
js运动动画的八个知识点
2015/03/12 Javascript
jquery实现简单的自动播放幻灯片效果
2015/06/13 Javascript
AngularJS 实现按需异步加载实例代码
2015/10/18 Javascript
jQuery遍历DOM的父级元素、子级元素和同级元素的方法总结
2016/07/07 Javascript
jQuery获取与设置iframe高度的方法
2016/08/01 Javascript
JS实现两周内自动登录功能
2017/03/23 Javascript
学习使用Bootstrap页面排版样式
2017/05/11 Javascript
Node.JS文件系统解析实例详解
2017/05/15 Javascript
jQuery操作之效果详解
2017/05/19 jQuery
javascript编程开发中取色器及封装$函数用法示例
2017/08/09 Javascript
vue代码分割的实现(codesplit)
2018/11/13 Javascript
JS匿名函数内部this指向问题详析
2019/05/10 Javascript
uin-app+mockjs实现本地数据模拟
2020/08/26 Javascript
Python yield使用方法示例
2013/12/04 Python
Python程序退出方式小结
2017/12/09 Python
使用 Python 实现微信群友统计器的思路详解
2018/09/26 Python
对Python协程之异步同步的区别详解
2019/02/19 Python
详解Python匿名函数(lambda函数)
2019/04/19 Python
python中列表的切片与修改知识点总结
2019/07/23 Python
解决Django Static内容不能加载显示的问题
2019/07/28 Python
如何利用Python开发一个简单的猜数字游戏
2019/09/22 Python
HTML5中的强制下载属性download使用实例解析
2016/05/12 HTML / CSS
打架检讨书500字
2014/01/29 职场文书
群众路线党课主持词
2014/04/01 职场文书
反邪教警示教育方案
2014/05/13 职场文书
商业用房租赁协议书
2014/10/13 职场文书
Python利用folium实现地图可视化
2021/05/23 Python
Mysql忘记密码解决方法
2022/02/12 MySQL