爬虫代理的cookie如何生成运行


Posted in Python onSeptember 22, 2020

HTTP是用于互联网传输数据信息到本地的一种传送协议

我们在浏览器中输入输入关键词,会返回页面内容。这就是我们用浏览器向网站所在的服务器发送了一个请求,网站的服务器接收到这个请求后进行解析,然后把网页内容呈现出来。

有时候服务器网站会检测IP在一个时间段内的请求次数,如果过于频繁,就会拒绝服务,简称为封IP。

HTTP代理就是用别人的IP进行访问,进行IP伪装。

除非是访问网站或APP专用数据api接口,正常的HTTP请求都需要进行ua(User-Agent)优化,因为ua是浏览器标识,如果http请求没有ua,或ua太少,都会被网站运维统计异常的,ua越丰富分布就越真实。cookie最好是登陆获取的,一般访客的cookie,对方限制会比较严格,可以控制一个地区新访客的访问频率。另外反爬统计的js也要分析下,是不是做了机器人判断,有没有做窗口分辨率判断等。

生成cookie:

import os
import time
import zipfile

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait


class GenCookies(object):
  USER_AGENT = open('useragents.txt').readlines()
  # www.16yun.cn 代理配置
  PROXY_HOST = 't.16yun.cn' # proxy or host
  PROXY_PORT = 31111 # port
  PROXY_USER = 'USERNAME' # username
  PROXY_PASS = 'PASSWORD' # password
def open(self):
    """
    打开网页输入用户名密码并点击
    :return: None
    """
    self.browser.delete_all_cookies()
    self.browser.get(self.url)
    username = self.wait.until(EC.presence_of_element_located((By.ID, 'loginName')))
    password = self.wait.until(EC.presence_of_element_located((By.ID, 'loginPassword')))
    submit = self.wait.until(EC.element_to_be_clickable((By.ID, 'loginAction')))
    username.send_keys(self.username)
    password.send_keys(self.password)
    time.sleep(1)
    submit.click()

  def password_error(self):
    """
    判断是否密码错误
    :return:
    """
    try:
      return WebDriverWait(self.browser, 5).until(
        EC.text_to_be_present_in_element((By.ID, 'errorMsg'), '用户名或密码错误'))
    except TimeoutException:
      return False

  def get_cookies(self):
    """
    获取Cookies
    :return:
    """
    return self.browser.get_cookies()

运行cookie:

API接口开始运行
* Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
Cookies生成进程开始运行
Cookies检测进程开始运行
正在生成Cookies 账号 180000000 密码 16yun
正在测试Cookies 用户名 180000000
Cookies有效 180000000

如果HTTP请求成功,HTTP的状态码会返回200且返回数据。当然其他HTTP其他状态码也有,403表示禁止访问,504服务器内部出错等等。

以上就是爬虫代理的cookie如何生成运行的详细内容,更多关于爬虫代理 cookie的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
go和python调用其它程序并得到程序输出
Feb 10 Python
Python设置默认编码为utf8的方法
Jul 01 Python
Python urls.py的三种配置写法实例详解
Apr 28 Python
python3+pyqt5+itchat微信定时发送消息的方法
Feb 20 Python
win7下 python3.6 安装opencv 和 opencv-contrib-python解决 cv2.xfeatures2d.SIFT_create() 的问题
Oct 24 Python
python获取array中指定元素的示例
Nov 26 Python
Python for循环与getitem的关系详解
Jan 02 Python
使用 Python ssh 远程登陆服务器的最佳方案
Mar 06 Python
JetBrains PyCharm(Community版本)的下载、安装和初步使用图文教程详解
Mar 19 Python
使用PyCharm安装pytest及requests的问题
Jul 31 Python
selenium携带cookies模拟登陆CSDN的实现
Jan 19 Python
Django实现drf搜索过滤和排序过滤
Jun 21 Python
python 如何将office文件转换为PDF
Sep 22 #Python
Python制作一个仿QQ办公版的图形登录界面
Sep 22 #Python
Python使用for生成列表实现过程解析
Sep 22 #Python
python实现发送带附件的邮件代码分享
Sep 22 #Python
使用Python绘制台风轨迹图的示例代码
Sep 21 #Python
利用python绘制中国地图(含省界、河流等)
Sep 21 #Python
python利用google翻译方法实例(翻译字幕文件)
Sep 21 #Python
You might like
PHP中把对象数组转换成普通数组的方法
2015/07/10 PHP
PHP实现上传文件并存进数据库的方法
2015/07/16 PHP
Thinkphp框架开发移动端接口(1)
2016/08/18 PHP
Yii框架弹出框功能示例
2017/01/07 PHP
safari下载文件自动加了html后缀问题
2018/11/09 PHP
php实现统计IP数及在线人数的示例代码
2020/07/22 PHP
Jquery选中或取消radio示例
2013/09/29 Javascript
利用js判断浏览器类型(是否为IE,Firefox,Opera浏览器)
2013/11/22 Javascript
利用浏览器全屏api实现js全屏
2014/01/16 Javascript
Javascript 运动中Offset的bug解决方案
2014/12/24 Javascript
使用js画图之画切线
2015/01/12 Javascript
Node.js事件循环(Event Loop)和线程池详解
2015/01/28 Javascript
同一个网页中实现多个JavaScript特效的方法
2015/02/02 Javascript
jQuery实现径向动画菜单效果
2015/07/17 Javascript
vue.js学习笔记之绑定style样式和class列表
2016/10/31 Javascript
js实现文字无缝向上滚动
2017/02/16 Javascript
讲解vue-router之什么是编程式路由
2018/05/28 Javascript
jQuery实现导航样式布局操作示例【可自定义样式布局】
2018/07/24 jQuery
Node.js事件的正确使用方法
2019/04/05 Javascript
详解Vue 换肤方案验证
2019/08/28 Javascript
微信sdk实现禁止微信分享(使用原生php实现)
2019/11/15 Javascript
jQuery实现轮播图效果demo
2020/01/11 jQuery
Vue 简单实现前端权限控制的示例
2020/12/25 Vue.js
用vite搭建vue3应用的实现方法
2021/02/22 Vue.js
Linux下python制作名片示例
2018/07/20 Python
基于Python对数据shape的常见操作详解
2018/12/25 Python
Python操作注册表详细步骤介绍
2020/02/05 Python
Pycharm中安装wordcloud等库失败问题及终端通过pip安装的Python库如何添加到Pycharm解释器中(推荐)
2020/05/10 Python
俄罗斯香水和化妆品在线商店:Aroma-butik
2020/02/28 全球购物
俄罗斯三星品牌商店:Samsungstore
2020/04/05 全球购物
安全生产责任书范本
2014/04/15 职场文书
春游踏青活动方案
2014/08/14 职场文书
实习证明格式范文
2014/10/14 职场文书
餐厅服务员岗位职责
2015/02/09 职场文书
争先创优个人总结
2015/03/04 职场文书
CSS3 制作的悬停缩放特效
2021/04/13 HTML / CSS