python+selenium实现自动化百度搜索关键词


Posted in Python onJune 03, 2019

通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器,进行百度关键词搜索。

1、安装python3,访问官网选择对应的版本安装即可,最新版为3.7。

python+selenium实现自动化百度搜索关键词

2、安装selenium库。

使用 pip install selenium 安装即可。

同时需要安装chromedriver,并放在python安装文件夹下,如下图所示。

python+selenium实现自动化百度搜索关键词

3、获取爬虫接口链接。

注册账号,点击爬虫代理,领取每日试用。

python+selenium实现自动化百度搜索关键词

from selenium import webdriver 

import requests,time 

 #自建IP池 

def get_proxy():

  r = requests.get('http://127.0.0.1:5555/random')

  return r.text 

import random 

FILE = './tuziip.txt' 

# 读取的txt文件路径 

# 获取代理IP 

def proxy_ip():

  ip_list = []

  with open(FILE, 'r') as f:

    while True:

      line = f.readline()

      if not line:

        break

      ip_list.append(line.strip())

  ip_port = random.choice(ip_list)

  return ip_port 

def bd():

  chromeOptions = webdriver.ChromeOptions()

  # 设置代理  

chromeOptions.add_argument("--proxy-server=http://"+proxy_ip())  

# 一定要注意,=两边不能有空格,不能是这样--proxy-server = http://202.20.16.82:10152

  browser = webdriver.Chrome(chrome_options = chromeOptions)  

# 查看本机ip,查看代理是否起作用  

  browser.get("https://www.baidu.com/")  

  browser.find_element_by_id("kw").send_keys("ip")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.close()  

# 退出,清除浏览器缓存

  browser.quit() 

if __name__ == "__main__":

  while True:

    bd()

5、运行程序,如下图所示,可自动化搜索。

python+selenium实现自动化百度搜索关键词

Python 相关文章推荐
python中ConfigParse模块的用法
Sep 29 Python
Python 'takes exactly 1 argument (2 given)' Python error
Dec 13 Python
Python入门之三角函数sin()函数实例详解
Nov 08 Python
PyQt5每天必学之单行文本框
Apr 19 Python
Python Tkinter模块实现时钟功能应用示例
Jul 23 Python
python 表格打印代码实例解析
Oct 12 Python
Python生态圈图像格式转换问题(推荐)
Dec 02 Python
Python如何向SQLServer存储二进制图片
Jun 08 Python
PyCharm上安装Package的实现(以pandas为例)
Sep 18 Python
python os.listdir()乱码解决方案
Jan 31 Python
Python 批量下载阴阳师网站壁纸
May 19 Python
Python re.sub 反向引用的实现
Jul 07 Python
用Q-learning算法实现自动走迷宫机器人的方法示例
Jun 03 #Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 #Python
Python多进程入门、分布式进程数据共享实例详解
Jun 03 #Python
Python3实现定时任务的四种方式
Jun 03 #Python
500行Python代码打造刷脸考勤系统
Jun 03 #Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 #Python
Python学习笔记之抓取某只基金历史净值数据实战案例
Jun 03 #Python
You might like
超级简单的php+mysql留言本源码
2009/11/11 PHP
Thinkphp单字母函数使用指南
2016/05/08 PHP
java微信开发之上传下载多媒体文件
2016/06/24 PHP
ThinkPHP框架实现的邮箱激活功能示例
2018/06/15 PHP
图片之间的切换
2006/06/26 Javascript
基于jquery的cookie的用法
2011/01/10 Javascript
浅析BootStrap栅格系统
2016/06/07 Javascript
浅谈toLowerCase和toLocaleLowerCase的区别
2016/08/15 Javascript
浅谈AngularJS中ng-class的使用方法
2016/11/11 Javascript
基于Javascript实现的不重复ID的生成器
2016/12/25 Javascript
详解Javascript几种跨域方式总结
2017/02/27 Javascript
vue移动端屏幕适配详解
2019/04/30 Javascript
JS实现在线ps功能详解
2019/07/31 Javascript
Vuex的各个模块封装的实现
2020/06/05 Javascript
详解vue-cli项目在IE浏览器打开报错解决方法
2020/12/10 Vue.js
[01:14:34]DOTA2上海特级锦标赛C组资格赛#2 LGD VS Newbee第一局
2016/02/28 DOTA
Python实现快速排序的方法详解
2019/10/25 Python
python实现密码强度校验
2020/03/18 Python
python中pyqtgraph知识点总结
2021/01/26 Python
python urllib和urllib3知识点总结
2021/02/08 Python
鲜为人知的HTML5语音合成功能
2019/05/17 HTML / CSS
html5 横向滑动导航栏的方法示例
2020/05/08 HTML / CSS
美国知名艺术画网站:Art.com
2017/02/09 全球购物
英国家居装饰品、户外家具和玻璃器皿购物网站:Rinkit.com
2019/11/04 全球购物
南京某软件公司的.net面试题
2015/11/30 面试题
使用C#编写创建一个线程的代码
2013/01/22 面试题
毕业生求职找工作的自我评价范文
2013/11/27 职场文书
韩国商务邀请函
2014/01/14 职场文书
机关办公室岗位职责
2014/04/16 职场文书
团结演讲稿范文
2014/05/23 职场文书
后备干部推荐材料
2014/12/24 职场文书
2015年先进个人自荐书
2015/03/24 职场文书
五一晚会主持词
2015/07/01 职场文书
JavaScript实现显示和隐藏图片
2021/04/29 Javascript
Java并发编程必备之Future机制
2021/06/30 Java/Android
SQL CASE 表达式的具体使用
2022/03/21 SQL Server