python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
python基础教程之序列详解
Aug 29 Python
python学习 流程控制语句详解
Jun 01 Python
Python中在for循环中嵌套使用if和else语句的技巧
Jun 20 Python
Python数据结构与算法之列表(链表,linked list)简单实现
Oct 30 Python
详解Python 函数如何重载?
Apr 23 Python
python tkinter canvas 显示图片的示例
Jun 13 Python
通过字符串导入 Python 模块的方法详解
Oct 27 Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 Python
Django如何实现密码错误报错提醒
Sep 04 Python
python 自定义异常和主动抛出异常(raise)的操作
Dec 11 Python
python 如何上传包到pypi
Dec 24 Python
Python 居然可以在 Excel 中画画你知道吗
Feb 15 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
ThinkPHP写数组插入与获取最新插入数据ID实例
2014/11/03 PHP
TP(thinkPHP)框架多层控制器和多级控制器的使用示例
2018/06/13 PHP
常用参考资料(手册)下载或者链接
2006/07/22 Javascript
js判断变量是否空值的代码
2008/10/26 Javascript
jquery 常用操作方法
2010/01/28 Javascript
juery框架写的弹窗效果适合新手
2013/11/27 Javascript
给事件响应函数传参数的四种方式小结
2013/12/05 Javascript
jquery实现手机发送验证码的倒计时代码
2014/02/12 Javascript
jQuery实现的经典竖向伸缩菜单效果代码
2015/09/24 Javascript
jQuery实现批量判断表单中文本框非空的方法(2种方法)
2015/12/09 Javascript
有关jQuery中parent()和siblings()的小问题
2016/06/01 Javascript
利用forever和pm2部署node.js项目过程
2017/05/10 Javascript
详解React 的几种条件渲染以及选择
2018/10/23 Javascript
在Vant的基础上封装下拉日期控件的代码示例
2018/12/05 Javascript
JS实现继承的几种常用方式示例
2019/06/22 Javascript
浅谈webpack和webpack-cli模块源码分析
2020/01/19 Javascript
JS实现网站楼层导航效果代码实例
2020/06/16 Javascript
原生js实现随机点名
2020/07/05 Javascript
[15:28]DOTA2 HEROS教学视频教你分分钟做大人-剧毒术士
2014/06/13 DOTA
R vs. Python 数据分析中谁与争锋?
2017/10/18 Python
python 限制函数调用次数的实例讲解
2018/04/21 Python
python Pandas如何对数据集随机抽样
2019/07/29 Python
Python selenium模拟手动操作实现无人值守刷积分功能
2020/05/13 Python
Python tkinter之Bind(绑定事件)的使用示例
2021/02/05 Python
详解CSS3中使用gradient实现渐变效果的方法
2015/08/18 HTML / CSS
Static Nested Class 和 Inner Class的不同
2013/11/28 面试题
面试后的感谢信范文
2014/02/01 职场文书
房地产营销策划方案
2014/02/08 职场文书
《雨霖铃》听课反思
2014/02/13 职场文书
小区文明倡议书
2014/05/16 职场文书
法定代表人证明书
2014/11/28 职场文书
歌咏比赛主持词
2015/06/29 职场文书
Django实现翻页的示例代码
2021/05/24 Python
html+css实现分层金字塔的实例
2021/06/02 HTML / CSS
使用 MybatisPlus 连接 SqlServer 数据库解决 OFFSET 分页问题
2022/04/22 SQL Server
Redis+AOP+自定义注解实现限流
2022/06/28 Redis