python分析网页上所有超链接的方法


Posted in Python onMay 08, 2015

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
  print(link)

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python3基础之list列表实例解析
Aug 13 Python
Python Socket编程详细介绍
Mar 23 Python
浅谈Python peewee 使用经验
Oct 20 Python
python机器学习之随机森林(七)
Mar 26 Python
浅谈python中真正关闭socket的方法
Dec 18 Python
解决python执行不输出系统命令弹框的问题
Jun 24 Python
python单向链表的基本实现与使用方法【定义、遍历、添加、删除、查找等】
Oct 24 Python
python实现超市商品销售管理系统
Oct 25 Python
python异步Web框架sanic的实现
Apr 27 Python
解决pycharm debug时界面下方不出现step等按钮及变量值的问题
Jun 09 Python
解决tensorflow读取本地MNITS_data失败的原因
Jun 22 Python
Python 解析简单的XML数据
Jul 24 Python
python使用htmllib分析网页内容的方法
May 08 #Python
python使用nntp读取新闻组内容的方法
May 08 #Python
Python类的定义、继承及类对象使用方法简明教程
May 08 #Python
python通过imaplib模块读取gmail里邮件的方法
May 08 #Python
Python类定义和类继承详解
May 08 #Python
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 #Python
python通过ftplib登录到ftp服务器的方法
May 08 #Python
You might like
PHP 和 XML: 使用expat函数(三)
2006/10/09 PHP
PHP中=赋值操作符对不同数据类型的不同行为
2011/01/02 PHP
php中使用Ajax时出现Error(c00ce56e)的详细解决方案
2014/11/03 PHP
node.js不得不说的12点内容
2014/07/14 Javascript
javascript中$(function() {});写与不写有哪些区别
2015/08/10 Javascript
Node.js编写组件的三种实现方式
2016/02/25 Javascript
AngularJS创建自定义指令的方法详解
2016/11/03 Javascript
使用Ajax与服务器(JSON)通信实例
2016/11/04 Javascript
Javascript 引擎工作机制详解
2016/11/30 Javascript
使用Math.max,Math.min获取数组中的最值实例
2017/04/25 Javascript
ES6下React组件的写法示例代码
2017/05/04 Javascript
mescroll.js上拉加载下拉刷新组件使用详解
2017/11/13 Javascript
Angular实现的简单查询天气预报功能示例
2017/12/27 Javascript
JavaScript引用类型RegExp基本用法详解
2018/08/09 Javascript
详解Vue、element-ui、axios实现省市区三级联动
2019/05/07 Javascript
解决LayUI数据表格复选框不居中显示的问题
2019/09/25 Javascript
vue实现抽屉弹窗效果
2020/11/15 Javascript
[01:06:25]Secret vs Liquid 2018国际邀请赛淘汰赛BO3 第一场 8.25
2018/08/29 DOTA
Python中强大的命令行库click入门教程
2016/12/26 Python
利用Python爬虫给孩子起个好名字
2017/02/14 Python
Python中with及contextlib的用法详解
2017/06/08 Python
python实现判断一个字符串是否是合法IP地址的示例
2018/06/04 Python
Python判断一个list中是否包含另一个list全部元素的方法分析
2018/12/24 Python
Django后台admin的使用详解
2019/07/08 Python
Python3的unicode编码转换成中文的问题及解决方案
2019/12/10 Python
python实现将range()函数生成的数字存储在一个列表中
2020/04/02 Python
Python中的Cookie模块如何使用
2020/06/04 Python
python软件都是免费的吗
2020/06/18 Python
优秀团员个人的自我评价
2013/10/02 职场文书
职工趣味运动会方案
2014/02/10 职场文书
家长会主持词
2014/03/26 职场文书
董事长助理工作职责范本
2014/07/01 职场文书
施工安全汇报材料
2014/08/17 职场文书
2014年医院党建工作总结
2014/12/20 职场文书
小学运动会宣传稿
2015/07/23 职场文书
html中显示特殊符号(附带特殊字符对应表)
2021/06/21 HTML / CSS