python使用正则表达式提取网页URL的方法


Posted in Python onMay 26, 2015

本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下:

import re
import urllib
url="https://3water.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
 print i
else:
 print 'this is over'
Python 相关文章推荐
用Python制作在地图上模拟瘟疫扩散的Gif图
Mar 31 Python
在Python的Flask框架中实现单元测试的教程
Apr 20 Python
Python实现ssh批量登录并执行命令
Oct 25 Python
Python实现的查询mysql数据库并通过邮件发送信息功能
May 17 Python
NLTK 3.2.4 环境搭建教程
Sep 19 Python
Python一键查找iOS项目中未使用的图片、音频、视频资源
Aug 12 Python
Pytorch中Tensor与各种图像格式的相互转化详解
Dec 26 Python
详解Python的三种拷贝方式
Feb 11 Python
python tkinter之 复选、文本、下拉的实现
Mar 04 Python
Django框架获取form表单数据方式总结
Apr 22 Python
python里反向传播算法详解
Nov 22 Python
python3通过subprocess模块调用脚本并和脚本交互的操作
Dec 05 Python
python获取指定路径下所有指定后缀文件的方法
May 26 #Python
python通过apply使用元祖和列表调用函数实例
May 26 #Python
python获取一组数据里最大值max函数用法实例
May 26 #Python
Python实现求最大公约数及判断素数的方法
May 26 #Python
Python实现队列的方法
May 26 #Python
Python实现栈的方法
May 26 #Python
Python实现二分查找算法实例
May 26 #Python
You might like
PHP5在Apache下的两种模式的安装
2006/09/05 PHP
用PHP创建PDF中文文档
2006/10/09 PHP
ThinkPHP控制器详解
2015/07/27 PHP
老生常谈php 正则中的i,m,s,x,e分别表示什么
2017/03/02 PHP
jQuery队列控制方法详解queue()/dequeue()/clearQueue()
2010/12/02 Javascript
jQuery Mobile页面跳转后未加载外部JS原因分析及解决
2013/03/18 Javascript
详解获取jq ul第一个li定位的四种解决方案
2016/11/23 Javascript
Websocket协议详解及简单实例代码
2016/12/12 Javascript
利用Plupload.js解决大文件上传问题, 带进度条和背景遮罩层
2017/03/15 Javascript
jQuery导航条固定定位效果实例代码
2017/05/26 jQuery
Vuex中mutations与actions的区别详解
2018/03/01 Javascript
p5.js实现斐波那契螺旋的示例代码
2018/03/22 Javascript
vue短信验证性能优化如何写入localstorage中
2018/04/25 Javascript
详解Vue-axios 设置请求头问题
2018/12/06 Javascript
详解Vue.js v-for不支持IE9的解决方法
2018/12/29 Javascript
vue权限管理系统的实现代码
2019/01/17 Javascript
JavaScript工具库之Lodash详解
2019/06/15 Javascript
微信小程序录音实现功能并上传(使用node解析接收)
2020/02/26 Javascript
Django中处理出错页面的方法
2015/07/15 Python
Windows下Eclipse+PyDev配置Python+PyQt4开发环境
2016/05/17 Python
python线程池threadpool使用篇
2018/04/27 Python
Python Cookie 读取和保存方法
2018/12/28 Python
使用python将请求的requests headers参数格式化方法
2019/01/02 Python
使用python serial 获取所有的串口名称的实例
2019/07/02 Python
django实现日志按日期分割
2020/05/21 Python
英国著名国际平价时尚男装品牌:Topman
2016/08/27 全球购物
松下电器美国官方商店:Panasonic美国
2016/10/14 全球购物
德国户外商店:eXXpozed
2020/07/25 全球购物
大唐面试试题(CPU,UNIX等等)
2012/01/11 面试题
学校对教师的评语
2014/04/28 职场文书
网站推广策划方案
2014/06/04 职场文书
交通志愿者活动总结
2014/06/27 职场文书
师德师风自查材料
2014/10/14 职场文书
2016年共产党员个人承诺书
2016/03/24 职场文书
来探秘“德国中小企业”的成功之道
2019/07/26 职场文书
关于PostgreSQL JSONB的匹配和交集问题
2021/09/14 PostgreSQL