php过滤html标记属性类用法实例


Posted in PHP onSeptember 23, 2014

本文实例讲述了php 过滤html标记属性类及其用法。是PHP项目开发中比较常见的实用技巧。分享给大家供大家参考。具体方法如下:

HtmlAttributeFilter.class.php类文件如下:

<?php 
/** HTML Attribute Filter 
*  Date:  2013-09-22 
*  Author: fdipzone 
*  ver:  1.0 
* 
*  Func: 
*  public strip       过滤属性 
*  public setAllow      设置允许的属性 
*  public setException    设置特例 
*  public setIgnore     设置忽略的标记 
*  private findElements    搜寻需要处理的元素 
*  private findAttributes   搜寻属性 
*  private removeAttributes  移除属性 
*  private isException    判断是否特例 
*  private createAttributes  创建属性 
*  private protect      特殊字符转义 
*/ 
 
class HtmlAttributeFilter{ // class start 
 
  private $_str = '';      // 源字符串 
  private $_allow = array();   // 允许保留的属性 例如:array('id','class','title') 
  private $_exception = array(); // 特例 例如:array('a'=>array('href','class'),'span'=>array('class')) 
  private $_ignore = array();  // 忽略过滤的标记 例如:array('span','img') 
 
 
  /** 处理HTML,过滤不保留的属性 
  * @param String $str 源字符串 
  * @return String 
  */ 
  public function strip($str){ 
    $this->_str = $str; 
 
    if(is_string($this->_str) && strlen($this->_str)>0){ // 判断字符串 
 
      $this->_str = strtolower($this->_str); // 转成小写 
 
      $res = $this->findElements(); 
      if(is_string($res)){ 
        return $res; 
      } 
      $nodes = $this->findAttributes($res); 
      $this->removeAttributes($nodes); 
    } 
    return $this->_str; 
  } 
 
  /** 设置允许的属性 
  * @param Array $param 
  */ 
  public function setAllow($param=array()){ 
    $this->_allow = $param; 
  } 
 
  /** 设置特例 
  * @param Array $param 
  */ 
  public function setException($param=array()){ 
    $this->_exception = $param; 
  } 
 
  /** 设置忽略的标记 
  * @param Array $param 
  */ 
  public function setIgnore($param=array()){ 
    $this->_ignore = $param; 
  } 
 
  /** 搜寻需要处理的元素 */ 
  private function findElements(){ 
    $nodes = array(); 
    preg_match_all("/<([^ !\/\>\n]+)([^>]*)>/i", $this->_str, $elements); 
    foreach($elements[1] as $el_key => $element){ 
      if($elements[2][$el_key]){ 
        $literal = $elements[0][$el_key]; 
        $element_name = $elements[1][$el_key]; 
        $attributes = $elements[2][$el_key]; 
        if(is_array($this->_ignore) && !in_array($element_name, $this->_ignore)){ 
          $nodes[] = array('literal'=>$literal, 'name'=>$element_name, 'attributes'=>$attributes); 
        } 
      } 
    } 
 
    if(!$nodes[0]){ 
      return $this->_str; 
    }else{ 
      return $nodes; 
    } 
  } 
 
  /** 搜寻属性 
  * @param Array $nodes 需要处理的元素 
  */ 
  private function findAttributes($nodes){ 
    foreach($nodes as &$node){ 
      preg_match_all("/([^ =]+)\s*=\s*[\"|']{0,1}([^\"']*)[\"|']{0,1}/i", $node['attributes'], $attributes); 
      if($attributes[1]){ 
        foreach($attributes[1] as $att_key=>$att){ 
          $literal = $attributes[0][$att_key]; 
          $attribute_name = $attributes[1][$att_key]; 
          $value = $attributes[2][$att_key]; 
          $atts[] = array('literal'=>$literal, 'name'=>$attribute_name, 'value'=>$value); 
        } 
      }else{ 
        $node['attributes'] = null; 
      } 
      $node['attributes'] = $atts; 
      unset($atts); 
    } 
    return $nodes; 
  } 
 
  /** 移除属性 
  * @param Array $nodes 需要处理的元素 
  */ 
  private function removeAttributes($nodes){ 
    foreach($nodes as $node){ 
      $node_name = $node['name']; 
      $new_attributes = ''; 
      if(is_array($node['attributes'])){ 
        foreach($node['attributes'] as $attribute){ 
          if((is_array($this->_allow) && in_array($attribute['name'], $this->_allow)) || $this->isException($node_name, $attribute['name'], $this->_exception)){ 
            $new_attributes = $this->createAttributes($new_attributes, $attribute['name'], $attribute['value']); 
          } 
        } 
      } 
      $replacement = ($new_attributes) ? "<$node_name $new_attributes>" : "<$node_name>"; 
      $this->_str = preg_replace('/'.$this->protect($node['literal']).'/', $replacement, $this->_str); 
    } 
  } 
 
  /** 判断是否特例 
  * @param String $element_name  元素名 
  * @param String $attribute_name 属性名 
  * @param Array $exceptions   允许的特例 
  * @return boolean 
  */ 
  private function isException($element_name, $attribute_name, $exceptions){ 
    if(array_key_exists($element_name, $this->_exception)){ 
      if(in_array($attribute_name, $this->_exception[$element_name])){ 
        return true; 
      } 
    } 
    return false; 
  } 
 
  /** 创建属性 
  * @param String $new_attributes 
  * @param String $name 
  * @param String $value 
  * @return String 
  */ 
  private function createAttributes($new_attributes, $name, $value){ 
    if($new_attributes){ 
      $new_attributes .= " "; 
    } 
    $new_attributes .= "$name=\"$value\""; 
    return $new_attributes; 
  } 
 
 
  /** 特殊字符转义 
  * @param String $str 源字符串 
  * @return String 
  */ 
  private function protect($str){ 
    $conversions = array( 
      "^" => "\^",  
      "[" => "\[",  
      "." => "\.",  
      "$" => "\$",  
      "{" => "\{",  
      "*" => "\*",  
      "(" => "\(",  
      "\\" => "\\\\",  
      "/" => "\/",  
      "+" => "\+",  
      ")" => "\)",  
      "|" => "\|",  
      "?" => "\?",  
      "<" => "\<",  
      ">" => "\>"  
    ); 
    return strtr($str, $conversions); 
  } 
 
} // class end 
 
?>

demo示例代码如下:

<?php 
require('HtmlAttributeFilter.class.php'); 
 
$str = '<div class="bd clearfix" id="index_hilite_ul"><ul class="list"><li><img src="http://su.bdimg.com/static/skin/img/logo_white.png" width="118" height="148"><div class="cover"><a class="text" href="https://3water.com"><strong>yuna</strong><p>love</p></a><strong class="t g">want to know</strong><a href="/login.html" class="ppBtn"><strong class="text">YES</strong></a></div></li></ul></div>'; 
 
$obj = new HtmlAttributeFilter(); 
 
// 允许id属性 
$obj->setAllow(array('id')); 
 
$obj->setException(array( 
  'a' => array('href'),  // a 标签允许有 href属性特例 
  'ul' => array('class') // ul 标签允许有 class属性特例 
)); 
 
// img 标签忽略,不过滤任何属性 
$obj->setIgnore(array('img')); 
 
echo 'source str:<br>'; 
echo htmlspecialchars($str).'<br><br>'; 
echo 'filter str:<br>'; 
echo htmlspecialchars($obj->strip($str)); 
?>

本文完整源码点击此处本机下载。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
PHP4实际应用经验篇(5)
Oct 09 PHP
Godaddy空间Zend Optimizer升级方法
May 10 PHP
PHP通过header实现文本文件下载的代码
Aug 08 PHP
php 短链接算法收集与分析
Dec 30 PHP
PHP序列化/对象注入漏洞分析
Apr 18 PHP
PHP使用PHPExcel删除Excel单元格指定列的方法
Jul 06 PHP
thinkPHP显示不出验证码的原因与解决方法分析
May 20 PHP
PHP异常处理定义与使用方法分析
Jul 25 PHP
为何说PHP引用是个坑,要慎用
Apr 02 PHP
ThinkPHP5.0 图片上传生成缩略图实例代码说明
Jun 20 PHP
浅谈Laravel核心解读之Console内核
Dec 02 PHP
PHP fclose函数用法总结
Feb 15 PHP
php广告加载类用法实例
Sep 23 #PHP
php实现根据url自动生成缩略图的方法
Sep 23 #PHP
php实现的支持imagemagick及gd库两种处理的缩略图生成类
Sep 23 #PHP
PHP图片库imagemagick安装方法
Sep 23 #PHP
安装ImageMagick出现error while loading shared libraries的解决方法
Sep 23 #PHP
php实现的支持断点续传的文件下载类
Sep 23 #PHP
php实现的click captcha点击验证码类实例
Sep 23 #PHP
You might like
php的一些小问题
2010/07/03 PHP
php实现图片上传并进行替换操作
2016/03/15 PHP
PHP自定义函数获取汉字首字母的方法
2016/12/01 PHP
jQuery实现的类flash菜单效果代码
2010/05/17 Javascript
.net,js捕捉文本框回车键事件的小例子(兼容多浏览器)
2013/03/11 Javascript
判断浏览器的内核及版本号方法汇总
2015/01/05 Javascript
angular使用bootstrap方法手动启动的实例代码
2017/07/18 Javascript
JS常用的几种数组遍历方式以及性能分析对比实例详解
2018/04/11 Javascript
vue2单元测试环境搭建
2018/05/24 Javascript
vue过滤器用法实例分析
2019/03/15 Javascript
详解Vue调用手机相机和相册以及上传
2019/05/05 Javascript
vue中监听返回键问题
2019/08/28 Javascript
ES6 class类链式继承,实例化及react super(props)原理详解
2020/02/15 Javascript
[01:02:03]2014 DOTA2华西杯精英邀请赛 5 24 NewBee VS VG
2014/05/26 DOTA
Python 自动补全(vim)
2014/11/30 Python
Python中使用Boolean操作符做真值测试实例
2015/01/30 Python
python通过pil模块将raw图片转换成png图片的方法
2015/03/16 Python
python cx_Oracle模块的安装和使用详细介绍
2017/02/13 Python
PyQt5每天必学之进度条效果
2018/04/19 Python
Mac安装python3的方法步骤
2019/08/09 Python
Python编程快速上手——疯狂填词程序实现方法分析
2020/02/29 Python
python实现ftp文件传输系统(案例分析)
2020/03/20 Python
python 检测图片是否有马赛克
2020/12/01 Python
Piercing Pagoda官网:耳环、戒指、项链、手链等
2020/09/28 全球购物
如何处理简单的PHP错误
2015/10/14 面试题
管理专员自荐信
2014/01/26 职场文书
仓库组长岗位职责
2014/01/29 职场文书
读书活动总结范文
2014/04/26 职场文书
助人为乐道德模范事迹材料
2014/08/16 职场文书
2014市府办领导班子“四风问题”对照检查材料思想汇报
2014/09/24 职场文书
工作犯错保证书
2015/05/11 职场文书
2015年教研室工作总结范文
2015/05/23 职场文书
2015年度校学生会工作总结报告
2015/05/23 职场文书
2016机关干部作风建设心得体会
2016/01/21 职场文书
Python list去重且保持原顺序不变的方法
2021/04/03 Python
「地球外少年少女」BD发售宣传CM公开
2022/03/21 日漫