php 信息采集程序代码


Posted in PHP onMarch 17, 2009
<? 
//采集首页地址 
$url="http://emotion.pclady.com.cn/skills/"; 
//获取页面代码 
$rs=file_get_contents($url); 
//设置匹配正则 
//$fp=fopen("text.txt","a"); 
//$fw=fwrite($fp,$rs); 
//fclose($fp); 
/*<I class=titles><A 
href="http://emotion.pclady.com.cn/skills/0903/376476.html" 
target=_blank>留住你身边的好男人</A></I>*/ 
$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i'; 
//进行正则搜索 
preg_match_all($preg,$rs,$title); 
//计算标题数量 
$count=count($title[0]); 
echo $count."<br>"; 
//通过标题数量进行内容采集 
for ($i=0;$i<$count;$i++){ //设置内容页地址 
$pr='/<a\s+href=\"[^>]+\">/isU'; 
preg_match_all($pr,$title[0][$i],$jurl); 
$substr=substr($jurl[0][0],9); 
$curl=substr($substr,0,-18); 
//获取内容页代码 
$c=file_get_contents($curl); 
//设置内容页匹配正则 
$pc='/<a\s+href=\"[^>]+\">/i'; 
//进行正则匹配搜索 
preg_match($pc,$c,$content); 
//输出标题 
echo $title[0][$i]."<br>"; 
echo $title[1][$i]."<br>"; 
$concount=count($content[0]); 
echo $concount."<br>"; 
echo $content[0][0]; 
for ($j=0;$j<$concount;$j++){ 
} 
} 
?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?
PHP 相关文章推荐
PHP IN_ARRAY 函数使用注意事项
Jul 24 PHP
ThinkPHP中实例Model方法的区别说明
Aug 21 PHP
php实现的数字验证码及数字运算验证码
Jul 30 PHP
php正则表达式学习笔记
Nov 13 PHP
php语言的7种基本的排序方法
Dec 28 PHP
smarty循环嵌套用法示例分析
Jul 19 PHP
PHP查看SSL证书信息的方法
Sep 22 PHP
PHP封装函数实现生成随机的字符串验证码
Jan 24 PHP
PHP使用Nginx实现反向代理
Sep 20 PHP
php中html_entity_decode实现HTML实体转义
Jun 13 PHP
php利用array_search与array_column实现二维数组查找
Jul 08 PHP
php中pcntl_fork详解
Apr 01 PHP
php cookie 登录验证示例代码
Mar 16 #PHP
php 删除cookie和浏览器重定向
Mar 16 #PHP
php cookis创建实现代码
Mar 16 #PHP
php session应用实例 登录验证
Mar 16 #PHP
php session处理的定制
Mar 16 #PHP
php session 检测和注销
Mar 16 #PHP
php session 预定义数组
Mar 16 #PHP
You might like
学习使用PHP数组
2006/10/09 PHP
PHP FOR MYSQL 代码生成助手(根据Mysql里的字段自动生成类文件的)
2011/07/23 PHP
探讨PHP JSON中文乱码的解决方法详解
2013/06/06 PHP
PHP中生成UUID自定义函数分享
2015/06/10 PHP
php魔术方法功能与用法实例分析
2016/10/19 PHP
解决Laravel5.x的php artisan migrate数据库迁移创建操作报错SQLSTATE[42000]
2020/04/06 PHP
如何用js控制css中的float的代码
2007/08/16 Javascript
浅谈JavaScript Date日期和时间对象
2014/12/29 Javascript
jQuery.position()方法获取不到值的安全替换方法
2015/03/13 Javascript
javascript学习笔记整理(概述、变量、数据类型简介)
2015/10/25 Javascript
AngularJS入门教程之更多模板详解
2016/08/19 Javascript
jQuery实现移动端手机商城购物车功能
2016/09/24 Javascript
基于jQuery实现滚动刷新效果
2017/01/09 Javascript
nodeJS(express4.x)+vue(vue-cli)构建前后端分离实例(带跨域)
2017/07/05 NodeJs
Angular项目从新建、打包到nginx部署全过程记录
2017/12/09 Javascript
vue中axios解决跨域问题和拦截器的使用方法
2018/03/07 Javascript
详解JavaScript的内存空间、赋值和深浅拷贝
2019/04/17 Javascript
[04:40]2016国际邀请赛中国区预选赛全程TOP10镜头集锦
2016/07/01 DOTA
Python中字符串的常见操作技巧总结
2016/07/28 Python
matplotlib绘制动画代码示例
2018/01/02 Python
python3+PyQt5泛型委托详解
2018/04/24 Python
对python tkinter窗口弹出置顶的方法详解
2019/06/14 Python
Python实现某论坛自动签到功能
2019/08/20 Python
Tensorflow的梯度异步更新示例
2020/01/23 Python
Python3实现打印任意宽度的菱形代码
2020/04/12 Python
Python模拟登录requests.Session应用详解
2020/11/17 Python
盛大笔试题
2016/11/05 面试题
营销专业应届生求职信
2013/11/26 职场文书
酒店前台接待岗位职责
2015/04/02 职场文书
社区党支部公开承诺书
2015/04/29 职场文书
环保建议书作文500字
2015/09/14 职场文书
大学生干部培训心得体会
2016/01/06 职场文书
大学生如何逃脱“毕业季创业队即散伙”魔咒?
2019/08/19 职场文书
深入理解margin塌陷和margin合并的解决方案
2021/06/26 HTML / CSS
javascript条件式访问属性和箭头函数介绍
2021/11/17 Javascript
在NumPy中深拷贝和浅拷贝相关操作的定义和背后的原理
2022/04/14 Python