php 过滤器实现代码


Posted in PHP onAugust 09, 2010

在以前,一个用户通过网络主要是获取信息。而如今的网络刚更注重与用户的交互,用户不再仅仅是网站的浏览者,也是网站内容的制造者。由以前单纯的“读”向“写”以及“共同创作”发展,由被动接收信息向主动分行信息发展。而随之而来的安全问题也成了web开发者不可忽视的问题,验证第三方来源的数据成了每个web程序必不可少的功能。

在以前,PHP需要验证数据,一般都是程序员自己通过正则表达式实现,而从PHP从5.2开始把原本的PCEL中的filter函数移到了内置库中,并做了不少强化,可以用这些函数实现对数据的过滤和验证。

数据来源及验证类型
PHP中的数据来源包含两部分,其一是外部变量(如POST、GET、COOKIE等),还有一种是页面内部产生的数据。PHP针对这两种数据类型分别定义了ilter_input_**和filter_var_**系列函数。而依据验证方法的不一样又可以分为Validating和Sanitizing两种。Validating用于验证数据,返回一个布尔值。Sanitizing则按规则过滤一些特定的字符,返回的是处理后的字符串。

简单用法
比如验证一个字符串是否是一个整数,在以往我们可以通过正则表达式或是is_numeric函数实现:

$str = '51ab'; 
preg_match('/^[0-9]*$/', $str); 
is_numeric($str);

新的验证函数可以用以下方式:

$str = '51ab';
echo filter_var($str, FILTER_VALIDATE_INT) ? 'is valid' : 'is not valid';FILTER_VALIDATE_INT是PHP定义的一个过滤器,用于验证$str是否为一个整数。实际上这就是一个数值常量,通过echo FILTER_VALIDATE_INT;发现值为257。所以我们也可以用:

$str = '51ab';
echo filter_var($str, 257) ? 'is valid' : 'is not valid';PHP中定义了大量常用的过滤器,我们可以通过filter_list()获得所有支持的过滤器名称(用字符串表示),然后再用filter_id(string)获取其数值:

print_r(filter_list()); // 所有支持的过滤器名称。
echo '=========';
echo filter_id('int'); // 'int' 是filter_list返回的一个过滤器名称。以上将输入出类似以下内容:

array(0=>int',1=>'boolean',2=>'float',3=>'validate_regexp')
==========
257Sanitizing过滤器
上面这个是验证数据格式是否正确,有时候过滤掉无关的内容也是挺重要的。SANITIZE过滤提供了这种功能,比如过滤掉一个email中多余的字符:

$email = '<script>alert("test");</sript>xxx@caixw.com';
echo $email; // 直接输出,将会执行script脚本。
echo filter_var($email, FILTER_SANITIZE_EMAIL); // 会过滤掉<和>输出scriptalerttestscriptxxx@caixw.com选项和标志
filter_var的功能还不止于此,还可以指定第三个参数,附加一些特殊的选项,比如一个规定了最大值的整数:

$options = array( 
'options'=>array('max_range'=>50), 
'flags'=>FILTER_FLAG_ALLOW_OCTAL, 
); 
$str = '51'; 
echo filter_var($str, FILTER_VALIDATE_INT, $options) ? 'is valid' : 'is not valid';

上面将返回is not valid。因为max_range规定其最大值只能为50。而FILTER_FLAG_ALLOW_OCTAL则允许验证的数据是一个八进制的,也即是0开头的。

$options参数是一个数组,包含两个元素:options和flags。若是只有flags元素,则也可以直接传递而不用数组。

验证外部数据
除了PHP脚本自己产生的数据,来自用户提交的数据占大部分。当然我们也可以直接用filter_var进行过滤:

if(isset($_GET['age'])) 
{ 
echo filter_var($_GET['age'], FILTER_VALIDATE_INT) ? 'is valid' : 'is not valid'; 
}

但是PHP中还专门提供了几个函数用于验证外部来源的数据:
if(filter_has_var(INPUT_GET, 'age')) 
{ 
echo filter_input(INPUT_GET, 'age', FILTER_VALIDATE_INT) ? 'is valid' : 'is not valid'; 
}

相较于filter_var,filter_input多了一个参数(第一个参数)用于指定数据的来源。而filter_has_var()而用来判断是否存在指定的数据。

一次过滤多个数据
PHP还提供了filter_var_array和filter_input_array函数用于一次性验证多个数据。

这是来自php.net上的一个实例,用于说明filter_var_array()怎么使用。

$data = array( 
'product_id' => 'libgd<script>', 
'component' => '10', 
'versions' => '2.0.33', 
'testscalar' => array('2', '23', '10', '12'), 
'testarray' => '2', 
); $args = array( 
'product_id' => FILTER_SANITIZE_ENCODED, 
'component' => array('filter' => FILTER_VALIDATE_INT, 
'flags' => FILTER_FORCE_ARRAY, 
'options' => array('min_range' => 1, 'max_range' => 10) 
), 
'versions' => FILTER_SANITIZE_ENCODED, 
'doesnotexist' => FILTER_VALIDATE_INT, 
'testscalar' => array( 
'filter' => FILTER_VALIDATE_INT, 
'flags' => FILTER_REQUIRE_SCALAR, 
), 
'testarray' => array( 
'filter' => FILTER_VALIDATE_INT, 
'flags' => FILTER_FORCE_ARRAY, 
) 
); 
$myinputs = filter_var_array($data, $args);

自定义过滤器
可以通过传递一个特殊的过滤器FILTER_CALLBACK来指定一个自定义的过滤器,下面这个过滤器将把所有邮箱地址的@转换成#。
function fun($value) 
{ 
return strtr($value,'@','#'); 
} 
$var = filter_var('abc@caixw.com', FILTER_CALLBACK, array('options' => 'fun')); 
echo $var;

其它

ID(过滤器常量) 名称(filter_list()函数返回的名称) 可用选项 标志位 描述
Validating
FILTER_VALIDATE_BOOLEAN "boolean" FILTER_NULL_ON_FAILURE 当难的数据为"1","true","on","yes"时返回true,否则返回false。当设置了FILTER_NULL_ON_FAILURE标志位,则仅在值是"0","false","off","no", 和""是返回false,其它非true值返回null。
FILTER_VALIDATE_EMAIL "validate_email" 验证邮箱
FILTER_VALIDATE_FLOAT "float" decimal FILTER_FLAG_ALLOW_THOUSAND 验证浮点数
FILTER_VALIDATE_INT "int" min_range, max_range FILTER_FLAG_ALLOW_OCTAL, FILTER_FLAG_ALLOW_HEX 验证一个指定范围内的整数值
FILTER_VALIDATE_IP "validate_ip" FILTER_FLAG_IPV4, FILTER_FLAG_IPV6, FILTER_FLAG_NO_PRIV_RANGE, FILTER_FLAG_NO_RES_RANGE 验证IP地址
FILTER_VALIDATE_REGEXP "validate_regexp" regexp 验证一个正则表达式
FILTER_VALIDATE_URL "validate_url" FILTER_FLAG_PATH_REQUIRED, FILTER_FLAG_QUERY_REQUIRED 验证一个URL
Sanitizing
FILTER_SANITIZE_EMAIL "email" 移除除英文字符,数字以及!#$%&'*+-/=?^_`{|}~@.[]之外的字符。
FILTER_SANITIZE_ENCODED "encoded" FILTER_FLAG_STRIP_LOW, FILTER_FLAG_STRIP_HIGH, FILTER_FLAG_ENCODE_LOW, FILTER_FLAG_ENCODE_HIGH URL编码字符串,去除或编码指定字符串。
FILTER_SANITIZE_MAGIC_QUOTES "magic_quotes" 应用 addslashes()函数
FILTER_SANITIZE_NUMBER_FLOAT "number_float" FILTER_FLAG_ALLOW_FRACTION, FILTER_FLAG_ALLOW_THOUSAND, FILTER_FLAG_ALLOW_SCIENTIFIC 移除除数字,+-以及.,eE以外的字符
FILTER_SANITIZE_NUMBER_INT "number_int" 移除除数字以及+-以外的字符
FILTER_SANITIZE_SPECIAL_CHARS "special_chars" FILTER_FLAG_STRIP_LOW, FILTER_FLAG_STRIP_HIGH, FILTER_FLAG_ENCODE_HIGH HTML转义字符,'"&>
FILTER_SANITIZE_STRING "string" FILTER_FLAG_NO_ENCODE_QUOTES, FILTER_FLAG_STRIP_LOW, FILTER_FLAG_STRIP_HIGH, FILTER_FLAG_ENCODE_LOW, FILTER_FLAG_ENCODE_HIGH, FILTER_FLAG_ENCODE_AMP 去除标签,或是去除或编码指定的字符。
FILTER_SANITIZE_STRIPPED "stripped" Alias of "string" filter.
FILTER_SANITIZE_URL "url" 删除所有字符除字母、数字以及$-_.+!*'(),{}|\\^~[]`#%";/?:@&=
FILTER_UNSAFE_RAW "unsafe_raw" FILTER_FLAG_STRIP_LOW, FILTER_FLAG_STRIP_HIGH, FILTER_FLAG_ENCODE_LOW, FILTER_FLAG_ENCODE_HIGH, FILTER_FLAG_ENCODE_AMP 不做任何改变,或是按标志位去除或是编码指定字母。
FILTER_CALLBACK "callback" FILTER_FLAG_STRIP_LOW, FILTER_FLAG_STRIP_HIGH, FILTER_FLAG_ENCODE_LOW, FILTER_FLAG_ENCODE_HIGH, FILTER_FLAG_ENCODE_AMP 自定义过滤器

标志位

ID 可用的过滤器 描述
FILTER_FLAG_STRIP_LOW FILTER_SANITIZE_ENCODED, FILTER_SANITIZE_SPECIAL_CHARS, FILTER_SANITIZE_STRING, FILTER_UNSAFE_RAW 去除ASCII小于32的字符。
FILTER_FLAG_STRIP_HIGH FILTER_SANITIZE_ENCODED, FILTER_SANITIZE_SPECIAL_CHARS, FILTER_SANITIZE_STRING, FILTER_UNSAFE_RAW 去除ASCII在于127的字符。
FILTER_FLAG_ALLOW_FRACTION FILTER_SANITIZE_NUMBER_FLOAT 允许小数点分隔符(.)
FILTER_FLAG_ALLOW_THOUSAND FILTER_SANITIZE_NUMBER_FLOAT, FILTER_VALIDATE_FLOAT 允许千位分隔符(,)
FILTER_FLAG_ALLOW_SCIENTIFIC FILTER_SANITIZE_NUMBER_FLOAT 允许科学计数法(e或E)。
FILTER_FLAG_NO_ENCODE_QUOTES FILTER_SANITIZE_STRING 不编码引号(单引号和双引号)。
FILTER_FLAG_ENCODE_LOW FILTER_SANITIZE_ENCODED, FILTER_SANITIZE_STRING, FILTER_SANITIZE_RAW 编码ASCII小于32的字符。
FILTER_FLAG_ENCODE_HIGH FILTER_SANITIZE_ENCODED, FILTER_SANITIZE_SPECIAL_CHARS, FILTER_SANITIZE_STRING, FILTER_SANITIZE_RAW 编码ASCII大于127的字母。
FILTER_FLAG_ENCODE_AMP FILTER_SANITIZE_STRING, FILTER_SANITIZE_RAW 编码&符号。
FILTER_NULL_ON_FAILURE FILTER_VALIDATE_BOOLEAN 返回null当验证数据不是以下字符串时(yes,no,1,0,true,false,on,off)。
FILTER_FLAG_ALLOW_OCTAL FILTER_VALIDATE_INT 允许八进制数值(0开头)。
FILTER_FLAG_ALLOW_HEX FILTER_VALIDATE_INT 允许16进制数值。(0X或是0x开头)。
FILTER_FLAG_IPV4 FILTER_VALIDATE_IP IP4格式字符串。
FILTER_FLAG_IPV6 FILTER_VALIDATE_IP IP6格式字符串。
FILTER_FLAG_NO_PRIV_RANGE FILTER_VALIDATE_IP RFC指定的私域IP。IP4如下范围10.0.0.0/8, 172.16.0.0/12, 192.168.0.0/16。或是IP6以下开头的域: FD或FC
FILTER_FLAG_NO_RES_RANGE FILTER_VALIDATE_IP 要求值不在保留的 IP 范围内。IPv4 ranges:0.0.0.0/8, 169.254.0.0/16,192.0.2.0/24 and 224.0.0.0/4。不能应用于IP6。
FILTER_FLAG_PATH_REQUIRED FILTER_VALIDATE_URL 要求URL包含路径部分。
FILTER_FLAG_QUERY_REQUIRED FILTER_VALIDATE_URL 要求URL查询字符串。
PHP 相关文章推荐
PHP调用三种数据库的方法(1)
Oct 09 PHP
php文件服务实现虚拟挂载其他目录示例
Apr 17 PHP
简单谈谈php中ob_flush和flush的区别
Nov 27 PHP
php删除左端与右端空格的方法
Nov 29 PHP
php使用PDO操作MySQL数据库实例
Dec 30 PHP
PHP上传文件时自动分配路径的方法
Jan 09 PHP
php+mysqli批量查询多张表数据的方法
Jan 29 PHP
初识laravel5
Mar 02 PHP
php的socket编程详解
Nov 20 PHP
PHP后台微信支付和支付宝支付开发
Apr 28 PHP
laravel-admin 实现在指定的相册下添加照片
Oct 21 PHP
yii 框架实现按天,月,年,自定义时间段统计数据的方法分析
Apr 04 PHP
PHP对字符串的递增运算分析
Aug 08 #PHP
PHP原理之异常机制深入分析
Aug 08 #PHP
php include加载文件两种方式效率比较
Aug 08 #PHP
将一维或多维的数组连接成一个字符串的php代码
Aug 08 #PHP
php简单提示框alert封装函数
Aug 08 #PHP
php递归实现无限分类生成下拉列表的函数
Aug 08 #PHP
php用数组返回无限分类的列表数据的代码
Aug 08 #PHP
You might like
PHP 获取客户端真实IP地址多种方法小结
2010/05/15 PHP
CI(CodeIgniter)框架实现图片上传的方法
2017/03/24 PHP
PHP依赖注入(DI)和控制反转(IoC)详解
2017/06/12 PHP
ajax+php实现无刷新验证手机号的实例
2017/12/22 PHP
PHP 实现 JSON 数据的编码和解码操作详解
2020/04/22 PHP
PHP如何通过date() 函数格式化显示时间
2020/11/13 PHP
jQuery 位置函数offset,innerWidth,innerHeight,outerWidth,outerHeight,scrollTop,scrollLeft
2010/03/23 Javascript
jQuery之浮动窗口实现代码(两种方法)
2010/09/08 Javascript
实测jquery data()如何存值
2013/08/18 Javascript
JavaScript转换二进制编码为ASCII码的方法
2015/04/16 Javascript
jQuery获取字符串中出现最多的数
2016/02/22 Javascript
jQuery可见性过滤选择器用法示例
2016/09/09 Javascript
canvas学习之API整理笔记(二)
2016/12/29 Javascript
jQuery事件详解
2017/02/23 Javascript
利用Angular.js编写公共提示模块的方法教程
2017/05/28 Javascript
Angular 通过注入 $location 获取与修改当前页面URL的实例
2017/05/31 Javascript
JS封装的模仿qq右下角消息弹窗功能示例
2018/08/22 Javascript
laydate时间日历插件使用方法详解
2018/11/14 Javascript
javascript实现简易计算器功能
2020/09/23 Javascript
[10:39]DOTA2上海特级锦标赛音乐会纪录片
2016/03/21 DOTA
python切换hosts文件代码示例
2013/12/31 Python
Python Web框架Flask下网站开发入门实例
2015/02/08 Python
python爱心表白 每天都是浪漫七夕!
2018/08/18 Python
Python为何不能用可变对象作为默认参数的值
2019/07/01 Python
python sorted函数的小练习及解答
2019/09/18 Python
超级实用的8个Python列表技巧
2020/08/24 Python
python中封包建立过程实例
2021/02/18 Python
高中生学习生活的自我评价
2013/10/09 职场文书
水务局局长岗位职责
2013/11/28 职场文书
酒店员工培训方案
2014/06/02 职场文书
应届生自荐信
2014/06/30 职场文书
个人总结与自我评价2015
2015/03/11 职场文书
2015年推广普通话演讲稿
2015/03/20 职场文书
一个独生女的故事观后感
2015/06/04 职场文书
借钱欠条怎么写
2015/07/03 职场文书
python游戏开发Pygame框架
2022/04/22 Python