Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python解决字典中的值是列表问题的方法
Mar 04 Python
Python写的PHPMyAdmin暴力破解工具代码
Aug 06 Python
Python使用urllib模块的urlopen超时问题解决方法
Nov 08 Python
详解Python中列表和元祖的使用方法
Apr 25 Python
python使用xmlrpclib模块实现对百度google的ping功能
Jun 02 Python
通过Python爬虫代理IP快速增加博客阅读量
Dec 14 Python
Python DataFrame.groupby()聚合函数,分组级运算
Sep 18 Python
详谈tensorflow gfile文件的用法
Feb 05 Python
Python3查找列表中重复元素的个数的3种方法详解
Feb 13 Python
win10下opencv-python特定版本手动安装与pip自动安装教程
Mar 05 Python
python RSA加密的示例
Dec 09 Python
Python selenium模拟网页点击爬虫交管12123违章数据
May 26 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
解析php session_set_save_handler 函数的用法(mysql)
2013/06/29 PHP
在Debian系统下配置LNMP的教程
2015/07/09 PHP
详解PHP中的null合并运算符
2015/12/30 PHP
javascript 禁止复制网页
2009/06/11 Javascript
jquery获取iframe中的dom对象(两种方法)
2013/07/02 Javascript
新增加的内容是如何将div的scrollbar自动移动最下面
2014/01/02 Javascript
javascript实现鼠标移到Image上方时显示文字效果的方法
2015/08/07 Javascript
利用jQuery实现WordPress中@的ID悬浮显示评论内容
2015/12/11 Javascript
JavaScript iframe数据共享接口实现方法
2016/01/06 Javascript
JavaScript组合模式学习要点
2016/08/26 Javascript
详解Angularjs 如何自定义Img的ng-load 事件
2017/02/15 Javascript
react实现pure render时bind(this)隐患需注意!
2017/03/09 Javascript
对TypeScript库进行单元测试的方法
2019/07/18 Javascript
在vue项目中使用codemirror插件实现代码编辑器功能
2019/08/27 Javascript
python实现归并排序算法
2018/11/22 Python
使用python写一个自动浏览文章的脚本实例
2019/12/05 Python
Python如何基于selenium实现自动登录博客园
2019/12/16 Python
详解Python中字符串前“b”,“r”,“u”,“f”的作用
2019/12/18 Python
python对文件的操作方法汇总
2020/02/28 Python
Python3如何判断三角形的类型
2020/04/12 Python
python中if及if-else如何使用
2020/06/02 Python
浅析python 通⽤爬⾍和聚焦爬⾍
2020/09/28 Python
python爬虫看看虎牙女主播中谁最“顶”步骤详解
2020/12/01 Python
python自动打开浏览器下载zip并提取内容写入excel
2021/01/04 Python
Jeep牧马人、切诺基和自由人零配件:4 Wheel Drive Hardware
2017/07/02 全球购物
获取邓白氏信用报告:Dun & Bradstreet
2019/01/22 全球购物
英国伦敦的睡衣品牌:Asceno
2019/10/06 全球购物
Footshop法国:购买运动鞋
2020/01/19 全球购物
奥地利手表、香水、化妆品和珠宝购物网站:Brasty.at
2021/01/17 全球购物
Java基础知识面试要点
2016/07/29 面试题
家长会标语
2014/06/24 职场文书
法人单位适用的授权委托书
2014/09/19 职场文书
党的群众路线教育实践活动对照检查材料(四风)
2014/09/27 职场文书
2014年图书室工作总结
2014/12/09 职场文书
小班上学期幼儿评语
2014/12/30 职场文书
民间借贷借条如何写
2015/05/26 职场文书