python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
python字符串加密解密的三种方法分享(base64 win32com)
Jan 19 Python
用Python实现通过哈希算法检测图片重复的教程
Apr 02 Python
查看Python安装路径以及安装包路径小技巧
Apr 28 Python
详解Python的Django框架中的通用视图
May 04 Python
Linux 发邮件磁盘空间监控(python)
Apr 23 Python
Python多线程threading和multiprocessing模块实例解析
Jan 29 Python
python 对txt中每行内容进行批量替换的方法
Jul 11 Python
Python3标准库总结
Feb 19 Python
python tornado使用流生成图片的例子
Nov 18 Python
Python爬虫小例子——爬取51job发布的工作职位
Jul 10 Python
总结python 三种常见的内存泄漏场景
Nov 20 Python
python实现经纬度采样的示例代码
Dec 10 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
在PHP中操作Excel实例代码
2010/04/29 PHP
PHP 年龄计算函数(精确到天)
2012/06/07 PHP
PHP编码转换函数 自动转换字符集支持数组转换
2012/12/16 PHP
CodeIgniter中使用Smarty3基本配置
2015/06/29 PHP
基于php实现随机合并数组并排序(原排序)
2015/11/26 PHP
workerman结合laravel开发在线聊天应用的示例代码
2018/10/30 PHP
PHP笛卡尔积实现原理及代码实例
2020/12/09 PHP
javascript+dom树型菜单类,希望朋友们一起进步
2007/05/03 Javascript
poshytip 基于jquery的 插件 主要用于显示微博人的图像和鼠标提示等
2012/10/12 Javascript
window resize和scroll事件的基本优化思路
2014/04/29 Javascript
jQuery简单获取键盘事件的方法
2016/01/22 Javascript
jQuery延迟执行的实现方法
2016/12/21 Javascript
Vue实现导出excel表格功能
2018/03/30 Javascript
vue 动态绑定背景图片的方法
2018/08/10 Javascript
javascript json字符串到json对象转义问题
2019/01/22 Javascript
angular6根据environments配置文件更改开发所需要的环境的方法
2019/03/06 Javascript
vue实现计步器功能
2019/11/01 Javascript
selenium 反爬虫之跳过淘宝滑块验证功能的实现代码
2020/08/27 Javascript
python多线程编程方式分析示例详解
2013/12/06 Python
在Python上基于Markov链生成伪随机文本的教程
2015/04/17 Python
深入理解Python中装饰器的用法
2016/06/28 Python
我们为什么要减少Python中循环的使用
2019/07/10 Python
wxpython绘制音频效果
2019/11/18 Python
python通过安装itchat包实现微信自动回复收到的春节祝福
2020/01/19 Python
Jupyter Notebook打开任意文件夹操作
2020/04/14 Python
Europcar意大利:汽车租赁
2019/07/07 全球购物
英国领先的电动可调床制造商:Laybrook
2019/12/26 全球购物
写一个在SQL Server创建表的SQL语句
2012/03/10 面试题
优秀学生干部推荐材料
2014/02/03 职场文书
司机检讨书
2014/02/13 职场文书
《学会合作》教学反思
2014/04/12 职场文书
《东方明珠》教学反思
2014/04/20 职场文书
民间借贷纠纷案件代理词
2015/05/26 职场文书
《青山不老》教学反思
2016/02/22 职场文书
诚信高考倡议书
2019/06/24 职场文书
详解Mysql 函数调用优化
2021/04/07 MySQL