selenium 反爬虫之跳过淘宝滑块验证功能的实现代码


Posted in Javascript onAugust 27, 2020

在处理问题的之前,给大家个第一个锦囊!

你需要将chorme更新到最新版版本84,下载对应的chorme驱动 链接:http://chromedriver.storage.googleapis.com/index.html
注意 划重点!!一定要做这一步,因为我用的83的chorme他是不行滴,~~~~~~~

问题

1.一周前我的滑块验证代码还是可以OK的,完全没问题!附代码 low一眼

url = "https://login.taobao.com/member/login.jhtml"
browser.get(url)
browser.maximize_window() # 最大化

# 填写用户名密码
user = '*****'
password = '*******'
time.sleep(8)

iframe = browser.find_element_by_xpath('//div[@class="bokmXvaDlH"]//iframe')
print(iframe)
browser.switch_to.frame(iframe)
browser.find_element_by_xpath('//*[@id="fm-login-id"]').send_keys(id)
browser.find_element_by_xpath('//*[@id="fm-login-password"]').send_keys(password)
time.sleep(2)
# 获取滑块的大小
span_background = browser.find_element_by_xpath('//*[@id="nc_1__scale_text"]/span')
span_background_size = span_background.size
print(span_background_size)

# 获取滑块的位置
button = browser.find_element_by_xpath('//*[@id="nc_1_n1z"]')
button_location = button.location
print(button_location)

# 拖动操作:drag_and_drop_by_offset
# 将滑块的位置由初始位置,右移一个滑动条长度(即为x坐标在滑块位置基础上,加上滑动条的长度,y坐标保持滑块的坐标位置)
x_location = span_background_size["width"]
y_location = button_location["y"]
print(x_location, y_location)
action = ActionChains(browser)
source = browser.find_element_by_xpath('//*[@id="nc_1_n1z"]')
action.click_and_hold(source).perform()
action.move_by_offset(300, 0)
action.release().perform()
time.sleep(1)

# 登录
browser.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
print('登录成功\n')

完全可以会很好的进入淘宝,游刃有余
2.淘宝爸爸一周后就给我泼凉水,增加了自己的反爬虫机制,出现如下错误。

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

刚开始我以为是我频繁登录,导致淘宝的机器人识别我为代码进入。一般之前都是会在30分钟内解封。结果一天之后还是存在这个问题。查阅资料,翻了我的葵花宝典还是没有解决办法。后来看到一个文章,可能是淘宝再次更新了自己对selenium的验证,导致我不在成为漏网之鱼。唉唉唉,导致我3天没有解决。现在我把自己的坑和解决办法给大家分享一哈。成功的再次成为漏网之鱼,哈哈哈!

步骤

1.首先很多熟悉JS的人都知道淘宝会检测window.navigator.webdriver(js检测特征之一),但是即使设置了"undefined"还是败下来,看看

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

2.这时候细心的就需要观察一下他的全局JS,(这个是我参考别人的思路)你会发现淘宝爸爸在你浏览器内置的JS中有这么一段恐怖的代码

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

就是这个标黄色的东西,不会容易被发现的东西被检测到你是selenium进入,是不是特别坑!那我们接下来就需要干掉他。
3.这个时候仔细想一下,我们是通过什么打开浏览器呢?是的,知道的都会说webdriver.exe这个驱动。那我们就从他开始下手,当你打开webdriver.exe它后你会发现其中的问题!
注意:划重点!!!怎么打开和修改webdriver.exe。很多人都是乱码,之前我看到Windows系统采用nodepad++去打开就可以了,注意我的不行!你们可以试一下。(有的人是可以的,但是我的老师电脑不可以),然后我就找了一个办法,需要大家会一点vim操作,很简单的!准确的说就是Linux去解决,因为他不存在编码问题,不会像傻Windows,特别蠢!!开发人员最好还是用Linux系统吧!
经过我认真不负努力的搜索,诶找到一个靠谱的文章,哈哈!外国的‘知乎'
文章链接:https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
就是他!

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

就是这段翻译后的操作。
注意 划重点 !!采用Linux系统的vim进去后你看到的也是乱码!!哈哈,but和Windows的乱码是不一样的,他会让你找到“$cdc_asdjflasutopfhvcZLmcfl_”这个字符串的,神奇吧。这就是Linux的强大!!
不会Linux命令的童鞋可以自己搜索一下,很简单的。修改后记得要保存哦!

4.可能大家觉得到这里就可以了,NO NO NO 这样子你还是登录不掉的。需要最后一个锦囊妙计!!
具体就是 你需要关闭chorme开发者模式,关闭自动测试状态,还需要将大家都熟知的把window.navigator.webdriver设为"undefined"。可能说的不太明白,图片帮你理解

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# chrome_options 初始化选项
  chrome_options = webdriver.ChromeOptions()

  # 设置浏览器初始 位置x,y & 宽高x,y
  chrome_options.add_argument(f'--window-position={217},{172}')
  chrome_options.add_argument(f'--window-size={1200},{1000}')

  # 关闭自动测试状态显示 // 会导致浏览器报:请停用开发者模式
  # window.navigator.webdriver还是返回True,当返回undefined时应该才可行。
  chrome_options.add_experimental_option("excludeSwitches", ['enable-automation'])

加上这个代码会关闭“正受到自动测试软件的控制“的显示

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# 通过浏览器的dev_tool在get页面钱将.webdriver属性改为"undefined"
  driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})""",
  })

加上这个代码可以关闭开发者模式

selenium 反爬虫之跳过淘宝滑块验证功能的实现代码

# 通过浏览器的dev_tool在get页面钱将.webdriver属性改为"undefined"
  driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})""",
  })

最后我们通过提前运行js的方法,把window.navigator.webdriver设为"undefined"!
OK !!大功告成!!通过这么一步步下来,你会发现 我的天居然没有滑块!开森!!

总结

到此这篇关于selenium 反爬虫之跳过淘宝滑块验证(2020/8)的文章就介绍到这了,更多相关selenium 跳过淘宝滑块验证内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Javascript 相关文章推荐
createElement与createDocumentFragment的点点区别小结
Dec 19 Javascript
js数组去重的常用方法总结
Jan 24 Javascript
js实现简单的可切换选项卡效果
Apr 10 Javascript
JavaScript实现基于十进制的四舍五入实例
Jul 17 Javascript
jQuery封装的屏幕居中提示信息代码
Jun 08 Javascript
JavaScript 总结几个提高性能知识点(推荐)
Feb 20 Javascript
原生js仿浏览器滚动条效果
Mar 02 Javascript
Vue中的vue-resource示例详解
Nov 02 Javascript
解决echarts的多个折现数据出现坐标和值对不上的问题
Dec 28 Javascript
js实现表单项的全选、反选及删除操作示例
Jun 05 Javascript
一篇超完整的Vue新手入门指导教程
Nov 18 Vue.js
一篇文章弄清楚Ajax请求的五个步骤
Mar 17 Javascript
JS实现拖拽元素时与另一元素碰撞检测
Aug 27 #Javascript
js实现QQ邮箱邮件拖拽删除功能
Aug 27 #Javascript
Bootstrap告警框(alert)实现弹出效果和短暂显示后上浮消失的示例代码
Aug 27 #Javascript
javascript操作向表格中动态加载数据
Aug 27 #Javascript
Vue为什么要谨慎使用$attrs与$listeners
Aug 27 #Javascript
js实现批量删除功能
Aug 27 #Javascript
js利用拖放实现添加删除
Aug 27 #Javascript
You might like
PHP 编程请选择正确的文本编辑软件
2006/12/21 PHP
ajax在joomla中的原生态应用代码
2012/07/19 PHP
初识通用数据库操作类――前端easyui-datagrid,form(php)
2015/07/31 PHP
PHP中strpos、strstr和stripos、stristr函数分析
2016/06/11 PHP
PHP实现 APP端微信支付功能
2018/06/22 PHP
通过实例解析PHP数据类型转换方法
2020/07/11 PHP
JS的IE和Firefox兼容性集锦
2006/12/11 Javascript
JavaScript 关键字屏蔽实现函数
2009/08/02 Javascript
Nodejs极简入门教程(一):模块机制
2014/10/25 NodeJs
JavaScript自定义数组排序方法
2015/02/12 Javascript
jQuery模拟黑客帝国矩阵效果实例
2015/06/28 Javascript
JS实现支持Ajax验证的表单插件
2016/03/24 Javascript
微信小程序 css使用技巧总结
2017/01/09 Javascript
jQuery表格的维护和删除操作
2017/02/03 Javascript
详解vue如何使用rules对表单字段进行校验
2018/10/17 Javascript
在NPM发布自己造的轮子的方法步骤
2019/03/09 Javascript
Vue学习笔记之计算属性与侦听器用法
2019/12/07 Javascript
[01:25]2015国际邀请赛最佳短片奖——斧王《拆塔英雄:天赋异禀》
2015/09/22 DOTA
Python代码的打包与发布详解
2014/07/30 Python
Python简易版停车管理系统
2019/08/12 Python
python实现简单银行管理系统
2019/10/25 Python
python3 sleep 延时秒 毫秒实例
2020/05/04 Python
Python是什么 Python的用处
2020/05/26 Python
CSS3教程(3):border-color网页边框色彩
2009/04/02 HTML / CSS
vue+django实现下载文件的示例
2021/03/24 Vue.js
汽车维修专业毕业生的求职信分享
2013/12/04 职场文书
销售经理岗位职责
2014/03/16 职场文书
《海底世界》教学反思
2014/04/16 职场文书
职业规划实施方案
2014/06/10 职场文书
承诺书模板
2014/08/30 职场文书
单位单身证明样本
2014/10/11 职场文书
2016年大学生暑假爱心支教活动策划书
2015/11/26 职场文书
2016感恩父亲节主题广播稿
2015/12/18 职场文书
SqlServer数据库远程连接案例教程
2021/07/15 SQL Server
奥特曼十大神器:奥特手镯在榜,第一是贝利亚的神器
2022/03/18 日漫
《Estab Life》4月6日播出 正式PV、主视觉图公开
2022/03/20 日漫