dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
PHP6 mysql连接方式说明
Feb 09 PHP
PHP 各种排序算法实现代码
Aug 20 PHP
PHP下对数组进行排序的函数
Aug 08 PHP
php指定函数参数默认值示例代码
Dec 04 PHP
解决PhpMyAdmin中导入2M以上大文件限制的方法分享
Jun 06 PHP
PHP内存缓存Memcached类实例
Dec 08 PHP
Yii中的cookie的发送和读取
Jul 27 PHP
PHP静态成员变量
Feb 14 PHP
php编程实现简单的网页版计算器功能示例
Apr 26 PHP
php获取数据库中数据的实现方法
Jun 01 PHP
Laravel多域名下字段验证的方法
Apr 04 PHP
PHP pthreads v3下的Volatile简介与使用方法示例
Feb 21 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
短波问题解答
2021/02/28 无线电
PHP函数getenv简介和使用实例
2014/05/12 PHP
php单态设计模式(单例模式)实例
2014/11/18 PHP
php获取ajax的headers方法与内容实例
2017/12/27 PHP
thinkPHP5框架实现多数据库连接,跨数据连接查询操作示例
2019/05/29 PHP
传智播客学习之JavaScript基础篇
2009/11/13 Javascript
Javascript对象中关于setTimeout和setInterval的this介绍
2012/07/21 Javascript
JavaScript高级程序设计 阅读笔记(十七) js事件
2012/08/14 Javascript
浏览器加载、渲染和解析过程黑箱简析
2012/11/29 Javascript
图片img的src不变让浏览器重新加载实现方法
2013/03/29 Javascript
jquery入门必备的基本认识及实例(整理)
2013/06/24 Javascript
解析jquery获取父窗口的元素
2013/06/26 Javascript
jquery easyui滚动条部分设置介绍
2013/09/12 Javascript
jquery ztree实现树的搜索功能
2016/02/25 Javascript
基于AngularJs + Bootstrap + AngularStrap相结合实现省市区联动代码
2016/05/30 Javascript
javascript类型系统——日期Date对象全面了解
2016/07/13 Javascript
jquery属性,遍历,HTML操作方法详解
2016/09/17 Javascript
详解Node.js中的事件机制
2016/09/22 Javascript
详解vue-router基本使用
2017/04/18 Javascript
Vue2.0实现购物车功能
2017/06/05 Javascript
详解angular2.x创建项目入门指令
2018/10/11 Javascript
Vue框架下引入ActiveX控件的问题解决
2019/03/25 Javascript
vue实现单一筛选、删除筛选条件
2020/10/26 Javascript
[03:28]2014DOTA2国际邀请赛 走近EG战队天才中单Arteezy
2014/07/12 DOTA
[01:15]PWL S2开团时刻第二期——他们杀 我就白给
2020/11/25 DOTA
Python Web服务器Tornado使用小结
2014/05/06 Python
利用Python产生加密表和解密表的实现方法
2019/10/15 Python
利用HTML5实现使用按钮控制背景音乐开关
2015/09/21 HTML / CSS
GUESS德国官网:美国牛仔服装品牌
2017/02/14 全球购物
俄罗斯电子产品在线商店:UltraTrade
2020/01/30 全球购物
用JAVA SOCKET编程,读服务器几个字符,再写入本地显示
2012/11/25 面试题
综合实践活动方案
2014/02/14 职场文书
校园文化标语
2014/06/18 职场文书
本科毕业生应聘求职信
2014/07/06 职场文书
三严三实对照检查材料思想汇报
2014/09/28 职场文书
预备党员自我批评思想汇报
2014/10/10 职场文书