python+selenium实现登录账户后自动点击的示例


Posted in Python onDecember 22, 2017

公司在codereview的时候限制了看代码的时间,实际上不少代码属于框架自动生成,并不需要花费太多时间看,为了达标,需要刷点时间(鼠标点击网页固定区域)。我想到可以利用自动化测试的手段完成这种无效的体力劳动。

首先,明确一下需求:

  1. 自动打开网页
  2. 登陆账号 
  3. 每隔一定时间点击一下固定区域

我想到的方案有两个,sikuli或者python+selenium。sikuli的优点是逻辑操作简单直接,使用图片作为标示,缺点是需要窗口固定,并且无法后台运行。selenium稍复杂一定,但是运行速度快,窗口可以遮挡。

这里简单记录一下使用Python+selenium的小例子。

使用的版本为Python3.3以及selenium2,Windows环境(现在已经支持3.0以上的了,多处论坛博客没有更新)。

首先是软件的安装,Python不赘述了,记得设置环境变量。

下面安装selenium,如果已经安装过pip。直接运行一下命令。

pip install -U selenium

另一种方式,https://pypi.python.org/packages/source/s/selenium/selenium-2.52.0.tar.gz下载并解压。这里简述一下windows版本,其实Unix下也差不多,使用Wget下载一下安装。

使用命令(setup一般用于第三方模块的安装):

cd c:\Python3\xxxx
python setup.py install

安装过程中可能会出现ImportError: No module named setuptools,这是因为缺少setuptools模块,Python默认不安装。

在http://pypi.python.org/pypi/setuptools上面提供了各系统的安装包和安装指南,对于Windows系统,下载https://bootstrap.pypa.io/ez_setup.py自动化安装脚本。

运行:

python ez_setup.py

完成后再安装selenium即可。

这里用我自己的实例简单的讲解一下流程。

第一步先完成打开浏览器。

selenium2结合了selenium和webdriver,直接引入各个浏览器相应的驱动,打开即可,注意chrome驱动可能需要另行安装。

from selenium import webdriver
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')

打开网页后需要登录,F12打开浏览器调试器,小箭头选取元素,查看登录框账号和密码的属性,一般都有ID。selenium可以通过以下各个方法获取元素并进行各种操作,具体解释请看上方链接文档:

  1. find_element_by_id
  2. find_element_by_name
  3. find_element_by_xpath
  4. find_element_by_link_text
  5. find_element_by_partial_link_text
  6. find_element_by_tag_name
  7. find_element_by_class_name
  8. find_element_by_css_selector

其中id最为有效方便,优先考虑。选取完元素之后可以通过WebDriver API调用模拟键盘的输入和鼠标的点击操作。代码如下:

username="qun" 
passwd="passwd"
browser = webdriver.Firefox()
browser.get('https://www.xxx.com')
browser.implicitly_wait(10)
elem=browser.find_element_by_id("loginFormUserName")
elem.send_keys(username)
elem=browser.find_element_by_id("loginFormPassword")
elem.send_keys(passwd)
elem=browser.find_element_by_id("loginFormSubmit")
elem.click()

一般登录之后页面都会跳转到新的网页上,如何获取新的网页呢?这里有个窗口句柄的概念,通过切换窗口句柄来完成。注意!有时候元素在一个frame里面的时候,也需要通过swtich切换。这里出现一个wait函数(上面也有),是因为页面加载需要时间,很可能在点击之后元素才加载出来,下一节详细解释一下wait。

browser.implicitly_wait(10)
browser.switch_to_window(browser.window_handles[-1])

之后选取需要点击的区域,这里使用 xpath定位,因为在自动化测试的过程中,很有可能元素无法通过id,name等方法定位(不少人就是不写,爱table套table,我也么办法),xpath就有了用武之地。常用的偷懒方法是Firefox安装xpath插件,右键直接获取。这里不介绍,因为不提倡,使用插件会造成代码里充斥这样的东西:

XPath(/html/body/div/div[3]/div[2]/div[4]/p[2])

不到万不得已,尽可能使用元素的特征来定位,比如按钮的name。

或者通过父元素定位子元素。

username =browser.find_element_by_xpath("//input[@name='username']")
clear_button = browser.find_element_by_xpath("//form[@id='loginForm']/input[4]")

代码如下,网上经常出现的By的用法需要引入包。

from selenium.webdriver.common.by import By

这里使用另外一个函数,我不知道有什么区别- -。

for i in range(100):
  elem=WebDriverWait(browser, 30).until(
    lambda x:x.find_element_by_xpath("//table[@class='aaa']"/td[1]))
  elem.click()
  time.sleep(20)
  print ("click",i)

然后这里还要提一下wait函数,在selenium2中延迟等待分为两种,显示等待和隐式等待。  

显示等待

显式等待,就是明确的要等到某个元素的出现或者是某个元素的可点击等条件,等不到,就一直等,除非在规定的时间之内都没找到,那么就跳出Exception。

element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "myDynamicElement"))
  )

隐式等待

注意,隐式等待是告诉设置所有dom元素在寻找某个元素的时候,如果没立即找到,再尝试这么长时间。

browser.implicitly_wait(10) # seconds

两者的区别在于一个是自己直接管理超时对象,一个是交给webdriver去做。

当然也可以用休眠的方法干等。记得引入time包。

time.sleep(20)

这里只是简单的演示一下用法,有许多可以改进的地方,没有封装函数,么有使用多线程并发执行多个例程。以后有需求再改进。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python3访问并下载网页内容的方法
Jul 28 Python
解读python logging模块的使用方法
Apr 17 Python
利用python将pdf输出为txt的实例讲解
Apr 23 Python
新年快乐! python实现绚烂的烟花绽放效果
Jan 30 Python
python学生管理系统学习笔记
Mar 19 Python
python 搜索大文件的实例代码
Jul 08 Python
Python3 列表,数组,矩阵的相互转换的方法示例
Aug 05 Python
Python爬虫使用代理IP的实现
Oct 27 Python
基于python的列表list和集合set操作
Nov 24 Python
Python for循环通过序列索引迭代过程解析
Feb 07 Python
Keras 使用 Lambda层详解
Jun 10 Python
pycharm最新激活码有效期至2100年(亲测可用)
Feb 05 Python
python实现决策树
Dec 21 #Python
python利用sklearn包编写决策树源代码
Dec 21 #Python
python实现决策树分类算法
Dec 21 #Python
Python语言描述机器学习之Logistic回归算法
Dec 21 #Python
python Crypto模块的安装与使用方法
Dec 21 #Python
python编写Logistic逻辑回归
Dec 30 #Python
python+selenium识别验证码并登录的示例代码
Dec 21 #Python
You might like
社区(php&&mysql)一
2006/10/09 PHP
php中的观察者模式简单实例
2015/01/20 PHP
php登录超时检测功能实例详解
2017/03/21 PHP
Egret引擎开发指南之编译项目
2014/09/03 Javascript
angularjs的一些优化小技巧
2014/12/06 Javascript
推荐一个自己用的封装好的javascript插件
2015/01/29 Javascript
JS控制表格实现一条光线流动分割行的方法
2015/03/09 Javascript
JavaScript动态修改弹出窗口大小的方法
2015/04/06 Javascript
浅谈setTimeout 与 setInterval
2015/06/23 Javascript
详解JavaScript中的客户端消息框架设计原理
2015/06/24 Javascript
异步JavaScript编程中的Promise使用方法
2015/07/28 Javascript
js拼接html字符串的注意事项
2016/10/13 Javascript
基于BootstrapValidator的Form表单验证(24)
2016/12/12 Javascript
javascript中BOM基础知识总结
2017/02/14 Javascript
vue.js利用defineProperty实现数据的双向绑定
2017/04/28 Javascript
react router 4.0以上的路由应用详解
2017/09/21 Javascript
微信小程序之圆形进度条实现思路
2018/02/22 Javascript
快速解决处理后台返回json数据格式的问题
2018/08/07 Javascript
[03:11]2014DOTA2国际邀请赛-VG掉入败者组 独家专访357
2014/07/19 DOTA
python求众数问题实例
2014/09/26 Python
python抓取百度首页的方法
2015/05/19 Python
python 将有序数组转换为二叉树的方法
2019/03/26 Python
python实现微信定时每天和女友发送消息
2019/04/29 Python
python 实现GUI(图形用户界面)编程详解
2019/07/17 Python
Django配置文件代码说明
2019/12/04 Python
vscode写python时的代码错误提醒和自动格式化的方法
2020/05/07 Python
英国婴儿和儿童服装网站:Vertbaudet
2018/04/02 全球购物
英国户外玩具儿童游乐设备网站:TP Toys(蹦床、攀爬框架、秋千、滑梯和游戏屋)
2018/04/09 全球购物
有影响力的品牌之家:Our Social Collective
2019/06/08 全球购物
人力资源经理的岗位职责范本
2014/02/28 职场文书
酒店管理毕业生自我鉴定
2014/03/02 职场文书
信息管理专业自荐书
2014/06/05 职场文书
2014应届本科生自我评价
2014/09/13 职场文书
李强感恩观后感
2015/06/17 职场文书
2016中秋节广告语
2016/01/28 职场文书
详解解Django 多对多表关系的三种创建方式
2021/08/23 Python