利用python爬取有道词典的方法


Posted in Python onDecember 08, 2020

前言

大家好

​ 最近python爬虫有点火啊,啥python爬取马保国视频……我也来凑个热闹,今天我们来试着做个翻译软件……不是不是,说错了,今天我们来试着提交翻译内容并爬取翻译结果

主要内容

 材料

1.Python 3.8.4

2.电脑一台(应该不至于有”穷苦人家“连一台电脑都没有吧)

3.Google浏览器(其他的也行,但我是用的Google)

写程序前准备

打开Google浏览器,找的有道词典的翻译网页(http://fanyi.youdao.com/)

打开后摁F12打开开发者模式,找Network选项卡,点击Network选项卡,然后刷新一下网页

然后翻译一段文字,随便啥都行(我用的程序员的传统:hello world),然后点击翻译

在选项卡中找到以translate开头的post文件

利用python爬取有道词典的方法

箭头的地方才是真正的提交地址

记住他,写代码时要用

利用python爬取有道词典的方法

这个是提交电脑的基本信息,记住他,等会儿要用,等会儿伪装成电脑时可以用,因为电脑会有基本信息,而如果是python的话会显示成python3.8.4(因为我的版本是3.8.4),从而容易被服务器禁入

利用python爬取有道词典的方法

等会儿还要用

好,准备工作做完了,接下来开始干正事了

开始编写爬虫代码

下面是我写的代码,具体我就不细说了

#导入urllib库
import urllib.request
import urllib.parse
import json

while True: #无限循环
 content = input("请输入您要翻译的内容(输入 !!! 退出程序): ")
 #设置退出条件
 if content == '!!!':
  break

 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #选择要爬取的网页,上面找过了
 #加上一个帽子,减少被发现的概率(下面head列表的内容就是上面找的)
 head = {}
 head['User - Agent'] = '请替换'

 #伪装计算机提交翻译申请(下面的内容也在在上面有过,最好根据自己的进行修改)
 data = {}
 data['type'] = 'AUTO'
 data['i'] = content
 data['doctype'] = 'json'
 data['version'] = '2.1'
 data['keyfrom:'] = 'fanyi.web'
 data['ue'] = 'UTF-8'
 data['typoResult'] = 'true'
 data = urllib.parse.urlencode(data).encode('utf-8')

 response = urllib.request.urlopen(url, data)
 #解码
 html = response.read().decode('utf-8')

 paper = json.loads(html)

 #打印翻译结果
 print("翻译结果: %s" % (paper['translateResult'][0][0]['tgt']))

运行结果

利用python爬取有道词典的方法

到此这篇关于python爬取有道词典的文章就介绍到这了,更多相关python有道词典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中的__init__ 、__new__、__call__小结
Apr 25 Python
用python + openpyxl处理excel2007文档思路以及心得
Jul 14 Python
Python Tkinter GUI编程入门介绍
Mar 10 Python
Python读取键盘输入的2种方法
Jun 16 Python
Python的Twisted框架上手前所必须了解的异步编程思想
May 25 Python
Python字典循环添加一键多值的用法实例
Jan 20 Python
pyhanlp安装介绍和简单应用
Feb 22 Python
Python一行代码实现快速排序的方法
Apr 30 Python
python实现beta分布概率密度函数的方法
Jul 08 Python
pycharm 安装JPype的教程
Aug 08 Python
django创建简单的页面响应实例教程
Sep 06 Python
python中Django文件上传方法详解
Aug 05 Python
Python控制鼠标键盘代码实例
Dec 08 #Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 #Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 #Python
Python爬虫之App爬虫视频下载的实现
Dec 08 #Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 #Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 #Python
Python hashlib和hmac模块使用方法解析
Dec 08 #Python
You might like
PHP中文件缓存转内存缓存的方法
2011/12/06 PHP
PHP写的求多项式导数的函数代码
2012/07/04 PHP
通过dbi使用perl连接mysql数据库的方法
2014/04/16 PHP
php中mysql连接方式PDO使用详解
2015/02/25 PHP
PHP的Yii框架入门使用教程
2016/02/15 PHP
PHP Static延迟静态绑定用法分析
2016/03/16 PHP
PHP实现的分解质因数操作示例
2018/08/01 PHP
php异常处理捕获错误整理
2019/09/23 PHP
JavaScript 基础问答三
2008/12/03 Javascript
javascript window.opener的用法分析
2010/04/07 Javascript
一个可拖拽列宽表格实例演示
2012/11/26 Javascript
javascript实现仿IE顶部的可关闭警告条
2015/05/05 Javascript
JavaScript中Date.toSource()方法的使用教程
2015/06/12 Javascript
用JS实现图片轮播效果代码(一)
2016/06/26 Javascript
动态生成的DOM不会触发onclick事件的原因及解决方法
2016/08/06 Javascript
微信小程序开发之点击按钮退出小程序的实现方法
2019/04/26 Javascript
python中使用xlrd、xlwt操作excel表格详解
2015/01/29 Python
Python语言描述机器学习之Logistic回归算法
2017/12/21 Python
Python cookbook(数据结构与算法)让字典保持有序的方法
2018/02/18 Python
pyQt4实现俄罗斯方块游戏
2018/06/26 Python
python实现朴素贝叶斯算法
2018/11/19 Python
kali中python版本的切换方法
2019/07/11 Python
python飞机大战pygame游戏之敌机出场实现方法详解
2019/12/17 Python
Python使用urllib模块对URL网址中的中文编码与解码实例详解
2020/02/18 Python
Python实现随机爬山算法
2021/01/29 Python
css3打造一款漂亮的卡哇伊按钮
2013/03/20 HTML / CSS
canvas学习笔记之绘制简单路径
2019/01/28 HTML / CSS
韩国三大免税店之一:THE GRAND 中文免税店
2016/07/21 全球购物
澳大利亚婴儿礼品公司:The Baby Gift Company
2018/11/04 全球购物
税务干部群众路线教育实践活动自我剖析材料
2014/09/21 职场文书
党员自我剖析材料范文
2014/10/06 职场文书
男方婚前保证书
2015/02/28 职场文书
汽车4S店销售经理岗位职责
2015/04/02 职场文书
小学德育工作总结2015
2015/05/12 职场文书
2016年国陪研修感言
2015/11/18 职场文书
python3.9之你应该知道的新特性详解
2021/04/29 Python