php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
CI框架源码阅读,系统常量文件constants.php的配置
Feb 28 PHP
解析用PHP读写音频文件信息的详解(支持WMA和MP3)
May 10 PHP
页面利用渐进式JPEG来提升用户体验度
Dec 01 PHP
php提取身份证号码中的生日日期以及验证是否为成年人的函数
Sep 29 PHP
详解WordPress中分类函数wp_list_categories的使用
Jan 04 PHP
Symfony2函数用法实例分析
Mar 18 PHP
PHP中session跨子域的三种实现方法
Jul 25 PHP
老生常谈PHP面向对象之命令模式(必看篇)
May 24 PHP
关于ThinkPhp 框架表单验证及ajax验证问题
Jul 19 PHP
Laravel5.5新特性之友好报错以及展示详解
Aug 13 PHP
PHP实现数组的笛卡尔积运算示例
Dec 15 PHP
Yii框架的布局文件实例分析
Sep 04 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
php设计模式 Strategy(策略模式)
2011/06/26 PHP
PHP去掉json字符串中的反斜杠\及去掉双引号前的反斜杠
2015/09/30 PHP
PHP互换两个变量值的方法(不用第三变量)
2016/11/14 PHP
PHP-FPM运行状态的实时查看及监控详解
2016/11/18 PHP
PHP SPL 被遗落的宝石【SPL应用浅析】
2018/04/20 PHP
js或css文件后面跟参数的原因说明
2010/01/09 Javascript
用JQuery实现表格隔行变色和突出显示当前行的代码
2012/02/10 Javascript
Jquery创建层显示标题和内容且随鼠标移动而移动
2014/01/26 Javascript
原生javascript实现获取指定元素下所有后代元素的方法
2014/10/28 Javascript
使用window.prompt()实现弹出用户输入的对话框
2015/04/13 Javascript
jquery实现表单验证简单实例演示
2015/11/23 Javascript
JavaScript使用DeviceOne开发实战(四)仿优酷视频应用
2015/12/02 Javascript
D3.js实现散点图和气泡图的方法详解
2016/09/21 Javascript
探索Javascript中this的奥秘
2016/12/11 Javascript
JavaScript获取键盘按键的键码(参照表)
2017/01/10 Javascript
vue-router:嵌套路由的使用方法
2017/02/21 Javascript
微信小程序开发之map地图实现教程
2017/06/08 Javascript
React-Native使用Mobx实现购物车功能
2017/09/14 Javascript
node使用promise替代回调函数
2018/05/07 Javascript
js实现简单选项卡制作
2020/08/05 Javascript
axios解决高并发的方法:axios.all()与axios.spread()的操作
2020/11/09 Javascript
Python脚本暴力破解栅栏密码
2015/10/19 Python
用Python实现斐波那契(Fibonacci)函数
2016/03/25 Python
Python字符串格式化输出方法分析
2016/04/13 Python
Python基于sklearn库的分类算法简单应用示例
2018/07/09 Python
python代码编写计算器小程序
2020/03/30 Python
python实现几种归一化方法(Normalization Method)
2019/07/31 Python
django 多对多表的创建和插入代码实现
2019/09/09 Python
python使用梯度下降算法实现一个多线性回归
2020/03/24 Python
斯洛伐克电子产品购物网站:DATART
2020/04/05 全球购物
《荷花》教学反思
2014/04/16 职场文书
安全目标管理责任书
2014/07/25 职场文书
招商引资工作汇报材料
2014/10/28 职场文书
2014年采购工作总结
2014/11/20 职场文书
MySQL外键约束(FOREIGN KEY)案例讲解
2021/08/23 MySQL
为什么MySQL不建议使用SELECT *
2022/04/03 MySQL