利用python爬取有道词典的方法


Posted in Python onDecember 08, 2020

前言

大家好

​ 最近python爬虫有点火啊,啥python爬取马保国视频……我也来凑个热闹,今天我们来试着做个翻译软件……不是不是,说错了,今天我们来试着提交翻译内容并爬取翻译结果

主要内容

 材料

1.Python 3.8.4

2.电脑一台(应该不至于有”穷苦人家“连一台电脑都没有吧)

3.Google浏览器(其他的也行,但我是用的Google)

写程序前准备

打开Google浏览器,找的有道词典的翻译网页(http://fanyi.youdao.com/)

打开后摁F12打开开发者模式,找Network选项卡,点击Network选项卡,然后刷新一下网页

然后翻译一段文字,随便啥都行(我用的程序员的传统:hello world),然后点击翻译

在选项卡中找到以translate开头的post文件

利用python爬取有道词典的方法

箭头的地方才是真正的提交地址

记住他,写代码时要用

利用python爬取有道词典的方法

这个是提交电脑的基本信息,记住他,等会儿要用,等会儿伪装成电脑时可以用,因为电脑会有基本信息,而如果是python的话会显示成python3.8.4(因为我的版本是3.8.4),从而容易被服务器禁入

利用python爬取有道词典的方法

等会儿还要用

好,准备工作做完了,接下来开始干正事了

开始编写爬虫代码

下面是我写的代码,具体我就不细说了

#导入urllib库
import urllib.request
import urllib.parse
import json

while True: #无限循环
 content = input("请输入您要翻译的内容(输入 !!! 退出程序): ")
 #设置退出条件
 if content == '!!!':
  break

 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #选择要爬取的网页,上面找过了
 #加上一个帽子,减少被发现的概率(下面head列表的内容就是上面找的)
 head = {}
 head['User - Agent'] = '请替换'

 #伪装计算机提交翻译申请(下面的内容也在在上面有过,最好根据自己的进行修改)
 data = {}
 data['type'] = 'AUTO'
 data['i'] = content
 data['doctype'] = 'json'
 data['version'] = '2.1'
 data['keyfrom:'] = 'fanyi.web'
 data['ue'] = 'UTF-8'
 data['typoResult'] = 'true'
 data = urllib.parse.urlencode(data).encode('utf-8')

 response = urllib.request.urlopen(url, data)
 #解码
 html = response.read().decode('utf-8')

 paper = json.loads(html)

 #打印翻译结果
 print("翻译结果: %s" % (paper['translateResult'][0][0]['tgt']))

运行结果

利用python爬取有道词典的方法

到此这篇关于python爬取有道词典的文章就介绍到这了,更多相关python有道词典内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python命令行参数解析模块optparse使用实例
Apr 13 Python
python爬虫实现教程转换成 PDF 电子书
Feb 19 Python
python正则中最短匹配实现代码
Jan 16 Python
Python面向对象之类和对象属性的增删改查操作示例
Dec 14 Python
python使用threading.Condition交替打印两个字符
May 07 Python
Pandas中resample方法详解
Jul 02 Python
Python跳出多重循环的方法示例
Jul 03 Python
用Python实现BP神经网络(附代码)
Jul 10 Python
Python csv模块使用方法代码实例
Aug 29 Python
Django实现图片上传功能步骤解析
Apr 22 Python
Python源码解析之List
May 21 Python
Python实现对齐打印 format函数的用法
Apr 28 Python
Python控制鼠标键盘代码实例
Dec 08 #Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 #Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 #Python
Python爬虫之App爬虫视频下载的实现
Dec 08 #Python
Python爬虫进阶之爬取某视频并下载的实现
Dec 08 #Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 #Python
Python hashlib和hmac模块使用方法解析
Dec 08 #Python
You might like
smarty高级特性之过滤器的使用方法
2015/12/25 PHP
PHP面向对象五大原则之里氏替换原则(LSP)详解
2018/04/08 PHP
使用Git实现Laravel项目的自动化部署
2019/11/24 PHP
可拖动窗口,附带鼠标控制渐变透明,开启关闭功能
2006/06/26 Javascript
开发跨浏览器javascript常见注意事项
2009/01/01 Javascript
Jquery中ajax方法data参数的用法小结
2014/02/12 Javascript
ExtJS4 动态生成的grid导出为excel示例
2014/05/02 Javascript
用html+css+js实现的一个简单的图片切换特效
2014/05/28 Javascript
javascript中为某个元素指定事件的三种方式
2014/08/07 Javascript
javascript中闭包(Closure)详解
2016/01/06 Javascript
js通过指定下标或指定元素进行删除数组的实例
2017/01/12 Javascript
jQuery实现分页功能(含ajax请求、后台数据、附完整demo)
2017/04/03 jQuery
JavaScript生成图形验证码
2020/08/24 Javascript
javascript实现文字无缝滚动效果
2017/08/26 Javascript
解决Js先触发失去焦点事件再执行点击事件的问题
2018/08/30 Javascript
vue 集成jTopo 处理方法
2019/08/07 Javascript
Javascript如何递归遍历本地文件夹
2020/08/06 Javascript
python strip()函数 介绍
2013/05/24 Python
Python中join和split用法实例
2015/04/14 Python
利用python程序帮大家清理windows垃圾
2017/01/15 Python
pycharm重置设置,恢复默认设置的方法
2018/10/22 Python
django项目登录中使用图片验证码的实现方法
2019/08/15 Python
使用Tkinter制作信息提示框
2020/02/18 Python
Python发送手机动态验证码代码实例
2020/02/28 Python
HTML5实现音频和视频嵌入的方法
2018/08/22 HTML / CSS
为什么Runtime.exec(“ls”)没有任何输出?
2014/10/03 面试题
环境科学专业研究生求职信
2013/10/02 职场文书
夜大毕业生自我评价分享
2013/11/10 职场文书
初中音乐教学反思
2014/01/12 职场文书
《苏珊的帽子》教学反思
2014/04/07 职场文书
学习雷锋做美德少年寄语大全
2014/04/09 职场文书
新闻工作者先进事迹
2014/05/26 职场文书
创先争优一句话承诺
2014/05/29 职场文书
无财产离婚协议书范本
2014/10/28 职场文书
初中教务主任竞聘演讲稿(范文)
2019/08/20 职场文书
JS Canvas接口和动画效果大全
2021/04/29 Javascript