python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python中查找excel某一列的重复数据 剔除之后打印
Feb 10 Python
利用Django框架中select_related和prefetch_related函数对数据库查询优化
Apr 01 Python
python绘制立方体的方法
Jul 02 Python
selenium+python自动化测试环境搭建步骤
Jun 03 Python
简单了解python关系(比较)运算符
Jul 08 Python
Python 3.8 新功能大揭秘【新手必学】
Feb 05 Python
深入了解Python 变量作用域
Jul 24 Python
Python 实现简单的客户端认证
Jul 29 Python
python实现网页录音效果
Oct 26 Python
基于Python组装jmx并调用JMeter实现压力测试
Nov 03 Python
python 实现简易的记事本
Nov 30 Python
学点简单的Django之第一个Django程序的实现
Feb 24 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
浅谈Yii乐观锁的使用及原理
2017/07/25 PHP
php设计模式之模板模式实例分析【星际争霸游戏案例】
2020/03/24 PHP
永不消失的title提示代码
2007/02/15 Javascript
表单填写时用回车代替TAB的实现方法
2007/10/09 Javascript
Mootools 1.2教程 选项卡效果(Tabs)
2009/09/15 Javascript
写自已的js类库需要的核心代码
2012/07/16 Javascript
js 数组操作之pop,push,unshift,splice,shift
2014/01/29 Javascript
js在数组中删除重复的元素自保留一个(两种实现思路)
2014/08/22 Javascript
js实现从数组里随机获取元素
2015/01/12 Javascript
【JS+CSS3】实现带预览图幻灯片效果的示例代码
2016/03/17 Javascript
41个Web开发者必须收藏的JavaScript实用技巧
2016/07/22 Javascript
第一次接触Bootstrap框架
2016/10/24 Javascript
JavaScript中 this 指向问题深度解析
2017/02/21 Javascript
Angular.js中数组操作的方法教程
2017/07/31 Javascript
第一个Vue插件从封装到发布
2017/11/22 Javascript
Vue组件之自定义事件的功能图解
2018/02/01 Javascript
Vue 获取数组键名的方法
2018/06/21 Javascript
vue修改对象的属性值后页面不重新渲染的实例
2018/08/09 Javascript
JS运算符简单用法示例
2020/01/19 Javascript
jQuery实现动态向上滚动
2020/12/21 jQuery
[44:15]国士无双DOTA2 6.82版本详解(上)
2014/09/28 DOTA
win系统下为Python3.5安装flask-mongoengine 库
2016/12/20 Python
Python学习小技巧之列表项的拼接
2017/05/20 Python
python实现自动获取IP并发送到邮箱
2018/12/26 Python
Django结合ajax进行页面实时更新的例子
2019/08/12 Python
python爬虫模拟浏览器的两种方法实例分析
2019/12/09 Python
python实现简单的井字棋游戏(gui界面)
2021/01/22 Python
css3模拟jq点击事件的实例代码
2017/07/06 HTML / CSS
入职担保书范文
2014/05/21 职场文书
中学生运动会口号
2014/06/07 职场文书
兽医医药专业求职信
2014/07/27 职场文书
学习十八大演讲稿
2014/09/15 职场文书
公安机关党的群众路线教育实践活动剖析材料
2014/10/10 职场文书
民政局2016年“六一”儿童节慰问活动总结
2016/04/06 职场文书
《孙子兵法》:欲成大事者,需读懂这些致胜策略
2019/08/23 职场文书
Python字符串的转义字符
2022/04/07 Python