dede3.1分页文字采集过滤规则详说(图文教程)


Posted in PHP onApril 03, 2007

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题

一、范例部分
范例分页区域代码:
范例分页区域代码:
dede3.1分页文字采集过滤规则详说(图文教程)
范例分页区域取样代码:
  分页区域取样(匹配):
dede3.1分页文字采集过滤规则详说(图文教程)

范例分页内容过滤规则:
分页内容过滤规则:
dede3.1分页文字采集过滤规则详说(图文教程)
范例采集内容预览:
范例采集内容预览:
dede3.1分页文字采集过滤规则详说(图文教程)

范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接导入人家的代码都不能用',确实如此):
输出结果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
与原文比较下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
这是全部的代码,可导入试下:

{!-- 节点基本信息 --} {dede:item name='论坛范例_工作总结_成功(改)' 
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'} 
{/dede:item} 
{!-- 采集列表获取规则 --} 
{dede:list source='var' sourcetype='archives'  
          varstart='' varend=''} 
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}     
  {dede:need}{/dede:need} 
  {dede:cannot}{/dede:cannot} 
  {dede:linkarea}[var:区域]{/dede:linkarea} 
{/dede:list} 
{!-- 网页内容获取规则 --} 
{dede:art} 
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分页区域]</b>{/dede:sppage} 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'  
  isunit='' isdown=''} 
    {dede:match}<title>[var:内容]</title>{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = @litpic;{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}if(@me!="") @me = GetMkTime(@me); 
else @me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}@me = time();{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'  
  isunit='1' isdown=''} 
    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0"> 
{/dede:match} 
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim} 
    {dede:function}{/dede:function} 
  {/dede:note} 
  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'  
  isunit='' isdown=''} 
    {dede:match}{/dede:match} 
    {dede:function}{/dede:function} 
  {/dede:note} 
{/dede:art}
PHP 相关文章推荐
PHP入门学习的几个不错的实例代码
Jul 13 PHP
PHP Squid中可缓存的动态网页设计
Sep 17 PHP
攻克CakePHP系列二 表单数据显示
Oct 22 PHP
PHP生成Flash动画的实现代码
Mar 12 PHP
php whois查询API制作方法
Jun 23 PHP
PHP数组及条件,循环语句学习
Nov 11 PHP
关于Zend Studio 配色方案插件的介绍
Jun 24 PHP
php验证session无效的解决方法
Nov 04 PHP
PHP读取大文件末尾N行的高效方法推荐
Jun 03 PHP
PHP简单读取PDF页数的实现方法
Jul 21 PHP
PHP用FTP类上传文件视频等的简单实现方法
Sep 23 PHP
PHP使用Redis长连接的方法详解
Feb 12 PHP
dedecms模版制作使用方法
Apr 03 #PHP
经典的PHPer为什么被认为是草根?
Apr 02 #PHP
在任意字符集下正常显示网页的方法二(续)
Apr 01 #PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
You might like
数据库的日期格式转换
2006/10/09 PHP
php实现简单洗牌算法
2013/06/18 PHP
Laravel 微信小程序后端实现用户登录的示例代码
2019/11/26 PHP
php libevent 功能与使用方法详解
2020/03/04 PHP
脚本吧 - 幻宇工作室用到js,超强推荐base.js
2006/12/23 Javascript
超级兔子让浮动层消失的前因后果
2007/03/09 Javascript
写出更好的JavaScript程序之undefined篇(中)
2009/11/23 Javascript
jquery验证手机号码、邮箱格式是否正确示例代码
2013/07/28 Javascript
完美解决IE低版本不支持call与apply的问题
2013/12/05 Javascript
javascript实现获取cookie过期时间的变通方法
2014/08/14 Javascript
jQuery实现瀑布流的取巧做法分享
2015/01/12 Javascript
JavaScript数组Array对象增加和删除元素方法总结
2015/01/20 Javascript
vue组件实现文字居中对齐的方法
2017/08/23 Javascript
微信小程序显示下拉列表功能【附源码下载】
2017/12/12 Javascript
JavaScript实现区块链
2018/03/14 Javascript
node.js ws模块搭建websocket服务端的方法示例
2019/04/25 Javascript
JS实现在线ps功能详解
2019/07/31 Javascript
JavaScript Array对象使用方法解析
2019/09/24 Javascript
如何在微信小程序中使用骨架屏的步骤
2020/06/12 Javascript
[01:43]3.19DOTA2发布会 三代刀塔人第三代
2014/03/25 DOTA
python求crc32值的方法
2014/10/05 Python
python实现xlsx文件分析详解
2018/01/02 Python
TensorFlow变量管理详解
2018/03/10 Python
python读取文件名称生成list的方法
2018/04/27 Python
详解Django 中是否使用时区的区别
2018/06/14 Python
Tensorflow分类器项目自定义数据读入的实现
2019/02/05 Python
如何使用django的MTV开发模式返回一个网页
2019/07/22 Python
python shutil文件操作工具使用实例分析
2019/12/25 Python
python实现最短路径的实例方法
2020/07/19 Python
Luxplus瑞典:香水和美容护理折扣
2018/01/28 全球购物
香港草莓网:Strawberrynet香港
2019/05/10 全球购物
Java的五个基础面试题
2016/02/26 面试题
小学生演讲稿大全
2014/04/25 职场文书
演讲比赛通讯稿
2015/07/18 职场文书
劳动模范获奖感言
2015/07/31 职场文书
MySQL系列之十三 MySQL的复制
2021/07/02 MySQL