python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Django框架中方法的访问和查找
Jul 15 Python
Python中urllib+urllib2+cookielib模块编写爬虫实战
Jan 20 Python
Python获取当前页面内所有链接的四种方法对比分析
Aug 19 Python
Python unittest单元测试框架总结
Sep 08 Python
python 通过SSHTunnelForwarder隧道连接redis的方法
Feb 19 Python
python创建与遍历List二维列表的方法
Aug 16 Python
Python打开文件、文件读写操作、with方式、文件常用函数实例分析
Jan 07 Python
Python3中configparser模块读写ini文件并解析配置的用法详解
Feb 18 Python
python属于解释型语言么
Jun 15 Python
python的json包位置及用法总结
Jun 21 Python
python RSA加密的示例
Dec 09 Python
python中sqllite插入numpy数组到数据库的实现方法
Jun 21 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
调整PHP的性能
2013/10/30 PHP
PHP数组实例详解
2016/06/26 PHP
php 数据结构之链表队列
2017/10/17 PHP
php的无刷新操作实现方法分析
2020/02/28 PHP
jQuery ready函数滥用分析
2011/02/16 Javascript
javascript的渐进增强与平稳退化浅谈
2013/11/12 Javascript
js日期、星座的级联显示代码
2014/01/23 Javascript
javascript引用赋值(地址传值)用法实例
2015/01/13 Javascript
jquery京东商城双11焦点图多图广告特效代码分享
2015/09/06 Javascript
AngularJS上拉加载问题解决方法
2016/05/23 Javascript
js print打印网页指定区域内容的简单实例
2016/11/01 Javascript
canvas实现图片根据滑块放大缩小效果
2017/02/24 Javascript
JavaScript 过滤关键字
2017/03/20 Javascript
微信小程序封装http访问网络库实例代码
2017/05/24 Javascript
react-router实现跳转传值的方法示例
2017/05/27 Javascript
ES6中的rest参数与扩展运算符详解
2017/07/18 Javascript
详解element-ui中表单验证的三种方式
2019/09/18 Javascript
微信小程序中weui用法解析
2019/10/21 Javascript
原生js+css调节音量滑块
2020/01/15 Javascript
Vue两个版本的区别和使用方法(更深层次了解)
2020/02/16 Javascript
Pythont特殊语法filter,map,reduce,apply使用方法
2016/02/27 Python
python绘制热力图heatmap
2020/03/23 Python
Python3.7实现验证码登录方式代码实例
2020/02/14 Python
Python离线安装各种库及pip的方法
2020/11/28 Python
python实现简单猜单词游戏
2020/12/24 Python
Pytorch 图像变换函数集合小结
2021/02/01 Python
Uber Eats台湾:寻找附近提供送餐服务的餐厅
2018/05/07 全球购物
库存图片、照片、矢量图、视频和音乐:Shutterstock
2021/02/12 全球购物
寄语十八大感言
2014/02/07 职场文书
2014年驾驶员工作总结
2014/11/18 职场文书
2015年美容师个人工作总结
2015/10/14 职场文书
2019年个人工作总结范文
2019/03/25 职场文书
go语言基础 seek光标位置os包的使用
2021/05/09 Golang
Python3接口性能测试实例代码
2021/06/20 Python
Python 居然可以在 Excel 中画画你知道吗
2022/02/15 Python
CDPR谈《巫师》新作用虚幻5原因 称不会为Epic独占
2022/04/06 其他游戏