python爬虫 使用真实浏览器打开网页的两种方法总结


Posted in Python onApril 21, 2018

1.使用系统自带库 os

这种方法的优点是,任何浏览器都能够使用, 缺点不能自如的打开一个又一个的网页

import os 
os.system('"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com')

2.使用python 集成的库 webbroswer

python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法:

import webbrowser 
webbrowser.open(url, new=0, autoraise=True) 
webbrowser.open_new(url) 
webbrowser.open_new_tab(url)

他们虽然是三个方法, 其实还是一个方法, 只是传递的参数不同

webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址,如果new=0, url会在同一个

浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开

其他的两个函数 webbrowser.open_new(url),webbrowser.open_new_tab(url)其实都是返回了webbrowser.open() 这个方法

只是他们没有其他的两个参数了。

在调用其他的浏览器的时候需要提前注册, 否则打开页面的是默认浏览器

import webbrowser 
chromePath = r'你的浏览器目录'   # 例如我的:D:\Google\Chrome\Application\chrome.exe 
webbrowser.register('chrome', None, webbrowser.BackgroundBrowser(chromePath)) #这里的'chrome'可以用其它任意名字,如chrome111,这里将想打开的浏览器保存到'chrome' 
webbrowser.get('chrome').open('www.baidu.com',new=1,autoraise=True)

webbrowser 这个库锁支持的浏览器类型如下:

Type Name Class Name Notes 
 'mozilla' Mozilla('mozilla') 
 'firefox' Mozilla('mozilla') 
 'netscape' Mozilla('netscape') 
 'galeon' Galeon('galeon') 
 'epiphany' Galeon('epiphany') 
 'skipstone' BackgroundBrowser('skipstone') 
 'kfmclient' Konqueror() (1) 
 'konqueror' Konqueror() (1) 
 'kfm' Konqueror() (1) 
 'mosaic' BackgroundBrowser('mosaic') 
 'opera' Opera() 
 'grail' Grail() 
 'links' GenericBrowser('links') 
 'elinks' Elinks('elinks') 
 'lynx' GenericBrowser('lynx') 
 'w3m' GenericBrowser('w3m') 
 'windows-default' WindowsDefault (2) 
 'macosx' MacOSX('default') (3) 
 'safari' MacOSX('safari') (3) 
 'google-chrome' Chrome('google-chrome') 
 'chrome' Chrome('chrome') 
 'chromium' Chromium('chromium') 
 'chromium-browser' Chromium('chromium-browser')

这些内容都可以在 源文件中看到, 路径为: python2.7/libs/webbroser.py

以上这篇python爬虫 使用真实浏览器打开网页的两种方法总结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
打开电脑上的QQ的python代码
Feb 10 Python
Python 查看文件的编码格式方法
Dec 21 Python
Python 25行代码实现的RSA算法详解
Apr 10 Python
python爬取网页转换为PDF文件
Jun 07 Python
基于Python中求和函数sum的用法详解
Jun 28 Python
Atom的python插件和常用插件说明
Jul 08 Python
基于python实现简单日历
Jul 28 Python
Python判断以什么结尾以什么开头的实例
Oct 27 Python
Python设计模式之模板方法模式实例详解
Jan 17 Python
python 实现selenium断言和验证的方法
Feb 13 Python
python编程进阶之类和对象用法实例分析
Feb 21 Python
python基于tkinter制作无损音乐下载工具
Mar 29 Python
Python针对给定字符串求解所有子序列是否为回文序列的方法
Apr 21 #Python
Django项目实战之用户头像上传与访问的示例
Apr 21 #Python
基于Python 装饰器装饰类中的方法实例
Apr 21 #Python
使用python装饰器计算函数运行时间的实例
Apr 21 #Python
Python实现针对给定字符串寻找最长非重复子串的方法
Apr 21 #Python
Python 实现一行输入多个值的方法
Apr 21 #Python
Python实现接受任意个数参数的函数方法
Apr 21 #Python
You might like
制作个性化的WordPress登陆界面的实例教程
2016/05/21 PHP
PHP判断一个变量是否为整数、正整数的方法示例
2019/09/11 PHP
js禁止小键盘输入数字功能代码
2011/08/01 Javascript
jQuery中:last选择器用法实例
2014/12/30 Javascript
js实现带有介绍的Select列表菜单实例
2015/08/18 Javascript
Javascript基础之数组的使用
2016/05/13 Javascript
jQuery Ajax 全局调用封装实例代码详解
2016/06/02 Javascript
基于Layer+jQuery的自定义弹框
2020/05/26 Javascript
jQuery中ajax错误调试分析
2016/12/01 Javascript
JavaScript中利用for循环遍历数组
2017/01/15 Javascript
Nodejs 复制文件/文件夹的方法
2017/08/24 NodeJs
Angular实现的table表格排序功能完整示例
2017/12/22 Javascript
webpack+vue2构建vue项目骨架的方法
2018/01/09 Javascript
Node.js实现简单的爬取的示例代码
2019/06/25 Javascript
vue中实现弹出层动画效果的示例代码
2020/09/25 Javascript
ant design的table组件实现全选功能以及自定义分页
2020/11/17 Javascript
vue使用element-ui实现表单验证
2020/12/13 Vue.js
python使用循环实现批量创建文件夹示例
2014/03/25 Python
使用Python装饰器在Django框架下去除冗余代码的教程
2015/04/16 Python
利用python实现xml与数据库读取转换的方法
2017/06/17 Python
Python读取excel中的图片完美解决方法
2018/07/27 Python
python的一些加密方法及python 加密模块
2019/07/11 Python
100%羊绒:NakedCashmere
2020/08/26 全球购物
Tea Collection官网:一家位于旧金山的童装公司
2020/08/07 全球购物
internal修饰符起什么作用
2013/12/16 面试题
JavaScript实现前端网页版倒计时
2021/03/24 Javascript
营业员个人总结的自我评价
2013/10/25 职场文书
学前班教师的自我鉴定
2013/12/05 职场文书
教师师德反思材料
2014/02/15 职场文书
2014年道德讲堂实施方案
2014/03/05 职场文书
护士长竞聘演讲稿
2014/04/30 职场文书
优秀党员事迹材料
2014/12/18 职场文书
2015年端午节活动方案
2015/05/05 职场文书
医护人员继续教育学习心得体会
2016/01/19 职场文书
解决Golang中goroutine执行速度的问题
2021/05/02 Golang
Django基础CBV装饰器和中间件
2022/03/22 Python