Python提取网页中超链接的方法


Posted in Python onSeptember 18, 2016

下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接

代码如下:

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
用python实现批量重命名文件的代码
May 25 Python
python命令行参数sys.argv使用示例
Jan 28 Python
Python去除字符串两端空格的方法
May 21 Python
python爬虫爬取淘宝商品信息(selenum+phontomjs)
Feb 24 Python
Scrapy使用的基本流程与实例讲解
Oct 21 Python
在PYQT5中QscrollArea(滚动条)的使用方法
Jun 14 Python
pycharm 批量修改变量名称的方法
Aug 01 Python
python制作朋友圈九宫格图片
Nov 03 Python
解决Tensorflow 内存泄露问题
Feb 05 Python
Django中使用Json返回数据的实现方法
Jun 03 Python
python 实现学生信息管理系统的示例
Nov 28 Python
python如何调用php文件中的函数详解
Dec 29 Python
python解决Fedora解压zip时中文乱码的方法
Sep 18 #Python
Python自动化运维和部署项目工具Fabric使用实例
Sep 18 #Python
基于Python 的进程管理工具supervisor使用指南
Sep 18 #Python
打包发布Python模块的方法详解
Sep 18 #Python
在python的类中动态添加属性与生成对象
Sep 17 #Python
Python中字符串的处理技巧分享
Sep 17 #Python
Python中对象迭代与反迭代的技巧总结
Sep 17 #Python
You might like
Smarty结合Ajax实现无刷新留言本实例
2007/01/02 PHP
解析php下载远程图片函数 可伪造来路
2013/06/25 PHP
CentOS6.5 编译安装lnmp环境
2014/12/21 PHP
PHP生成随机密码方法汇总
2015/08/27 PHP
PHP对象链式操作实现原理分析
2016/10/09 PHP
js中settimeout方法加参数
2014/02/28 Javascript
js实现键盘操作实现div的移动或改变的原理及代码
2014/06/23 Javascript
用JavaScript实现使用鼠标画线的示例代码
2014/08/19 Javascript
JQuery中使用.each()遍历元素学习笔记
2014/11/08 Javascript
JS中使用apply、bind实现为函数或者类传入动态个数的参数
2016/04/26 Javascript
js拼接html字符串的注意事项
2016/10/13 Javascript
从零开始学习Node.js系列教程六:EventEmitter发送和接收事件的方法示例
2017/04/13 Javascript
javascript 中iframe高度自适应(同域)实例详解
2017/05/16 Javascript
JavaScript订单操作小程序完整版
2017/06/23 Javascript
vue计算属性时v-for处理数组时遇到的一个bug问题
2018/01/21 Javascript
区别JavaScript函数声明与变量声明
2018/09/12 Javascript
微信小程序实现图片滚动效果示例
2018/12/05 Javascript
在Create React App中使用CSS Modules的方法示例
2019/01/15 Javascript
基于JavaScript实现表格隔行换色
2020/05/08 Javascript
js观察者模式的弹幕案例
2020/11/23 Javascript
Vue 实现可视化拖拽页面编辑器
2021/02/01 Vue.js
Python脚本实现格式化css文件
2015/04/08 Python
pandas apply 函数 实现多进程的示例讲解
2018/04/20 Python
python实现批量修改图片格式和尺寸
2018/06/07 Python
Python3中exp()函数用法分析
2019/02/19 Python
CSS+jQuery实现的在线答题功能
2015/04/25 HTML / CSS
爱游人:Travelliker
2017/09/05 全球购物
香蕉共和国加拿大官网:Banana Republic加拿大
2018/08/06 全球购物
DC Shoes澳大利亚官方网上商店:购买DC鞋子
2019/10/25 全球购物
服务员岗位职责
2014/01/29 职场文书
2014年五一劳动节社区活动总结
2014/04/14 职场文书
党的群众路线教育实践活动总结报告
2014/07/03 职场文书
2014年合同管理工作总结
2014/12/02 职场文书
2015年度护士个人工作总结
2015/04/09 职场文书
卫生主题班会
2015/08/14 职场文书
百年校庆宣传标语口号
2015/12/26 职场文书