PHP 超链接 抓取实现代码


Posted in PHP onJune 29, 2009

通用HTML标准超链接参数取得正则表达式测试
因为最近要做一个类似专业搜索引擎的东西,需要抓取网页的所有超链接。
大家帮忙测试一下子,下面的代码是否可以针对所有的标准超链接。
测试代码如下:

<?php 
// -------------------------------------------------------------------------- 
// File name : Noname1.php 
// Description : 通用链接参数获取正则表达式测试 
// Requirement : PHP4 (http://www.php.net) 
// Copyright(C), HonestQiao, 2005, All Rights Reserved. 
// Author: HonestQiao (honestqiao@hotmail.com) 
// 参数说明: 
// $strSource: 包含标准链接的HTML网页 
// $strResult: 处理的结果 
// 附加说明: 
// 标准链接,使用<a></a>形势包含的链接 
// -------------------------------------------------------------------------- 
$strSource = <<<HTML 
<a href=1.htm>t1</a> 
<a href='2.htm'>t2</a> 
<a href="3.htm">t3</a> 
<a href=4.htm class=link>t4</a> 
HTML; 
preg_match_all('/<a.*?(?: \\t\\r\\n)?href=[\'"]?(.+?)[\'"]?(?:(?: \\t\\r\\n)+.*?)?>(.+?)<\/a.*?>/sim', $strSource, $strResult, PREG_PATTERN_ORDER); 
for($i = 0; $i < count($strResult[1]); $i++) 
{ 
printf("%d href=(%s) title=(%s) \n", $i, $strResult[1][$i], $strResult[2][$i]); 
} 
?>

如果您的测试数据,符合标准链接,但是此处没有被处理出来,请告诉我测试数据,以及你的测试环境。
谢谢。
PHP 相关文章推荐
站长助手-网站web在线管理程序 v1.0 下载
May 12 PHP
php $_SERVER[&quot;REQUEST_URI&quot;]获取值的通用解决方法
Jun 21 PHP
php小技巧 把数组的键和值交换形成了新的数组,查找值取得键
Jun 02 PHP
获取用户Ip地址通用方法与常见安全隐患(HTTP_X_FORWARDED_FOR)
Jun 01 PHP
PHP URL路由类实例
Nov 12 PHP
Php中使用Select 查询语句的实例
Feb 19 PHP
调试PHP程序的多种方法介绍
Nov 06 PHP
php中Snoopy类用法实例
Jun 19 PHP
PHP中Laravel 关联查询返回错误id的解决方法
Apr 01 PHP
php魔法函数与魔法常量使用介绍
Jul 23 PHP
学习thinkphp5.0验证类使用方法
Nov 16 PHP
php实现微信原生支付(扫码支付)功能
May 30 PHP
PHP 文件上传功能实现代码
Jun 24 #PHP
php addslashes 函数详细分析说明
Jun 23 #PHP
PHP n个不重复的随机数生成代码
Jun 23 #PHP
PHP 七大优势分析
Jun 23 #PHP
php 404错误页面实现代码
Jun 22 #PHP
PHP 多进程 解决难题
Jun 22 #PHP
PHP 高级课程笔记 面向对象
Jun 21 #PHP
You might like
解析PHP高效率写法(详解原因)
2013/06/20 PHP
PHP错误Cannot use object of type stdClass as array in错误的解决办法
2014/06/12 PHP
PHP中localeconv()函数的用法
2019/03/26 PHP
php实现根据身份证获取精准年龄
2020/02/26 PHP
Thinkphp 框架扩展之类库扩展操作详解
2020/04/23 PHP
基于jQuery的合并表格中相同文本的相邻单元格的代码
2011/04/06 Javascript
jquery插件制作简单示例说明
2012/02/03 Javascript
jQuery的显示和隐藏方法与css隐藏的样式对比
2013/10/18 Javascript
JS实现同一个网页布局滑动门和TAB选项卡实例
2015/09/23 Javascript
原生的强大DOM选择器querySelector介绍
2016/12/21 Javascript
jQuery与js实现颜色渐变的方法
2016/12/30 Javascript
jquery横向纵向鼠标滚轮全屏切换
2017/02/27 Javascript
jquery实现全选、全不选以及单选功能
2017/03/23 jQuery
浅谈Node.js CVE-2017-14849 漏洞分析(详细步骤)
2017/11/10 Javascript
javaScript中的空值和假值
2017/12/18 Javascript
Node.js 利用cheerio制作简单的网页爬虫示例
2018/03/01 Javascript
解决vue多个路由共用一个页面的问题
2018/03/12 Javascript
Vue.js 动态为img的src赋值方法
2018/03/14 Javascript
Vue运用transition实现过渡动画
2019/05/06 Javascript
教你完全理解ReentrantLock重入锁
2019/06/03 Javascript
js回文数的4种判断方法示例
2019/06/04 Javascript
JavaScript箭头函数中的this详解
2019/06/19 Javascript
[37:35]DOTA2上海特级锦标赛A组资格赛#1 Secret VS MVP.Phx第二局
2016/02/25 DOTA
python结合API实现即时天气信息
2016/01/19 Python
在windows系统中实现python3安装lxml
2016/03/23 Python
pandas实现将dataframe满足某一条件的值选出
2019/06/12 Python
Python将主机名转换为IP地址的方法
2019/08/14 Python
Python print不能立即打印的解决方式
2020/02/19 Python
Pycharm制作搞怪弹窗的实现代码
2021/02/19 Python
香港彩色隐形眼镜在线商店:Stunninglens(全球免费送货)
2019/05/10 全球购物
巴西葡萄酒商店:Divvino
2020/02/22 全球购物
前台文员我鉴定
2014/01/12 职场文书
爱心捐款倡议书范文
2014/05/12 职场文书
毕业生面试求职信
2014/06/23 职场文书
python用tkinter开发的扫雷游戏
2021/06/01 Python