PHP 正则判断中文UTF-8或GBK的思路及具体实现


Posted in PHP onNovember 26, 2013

UTF-8匹配: 在javascript中,要判断字符串是中文是很简单的。比如:

var str = "php编程"; 
if (/^[\u4e00-\u9fa5]+$/.test(str)) { 
alert("该字符串全部是中文"); 
}else{ 
alert("该字符串不全部是中文"); 
} 
//php中,是用\x表示十六进制数据的。于是,变换成如下的代码: 
$str = "php编程"; 
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) { 
print("该字符串全部是中文"); 
} else { 
print("该字符串不全部是中文"); 
}

貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。重要:查阅了<精通正则表达式>发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释 php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号, 同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错
网上只能找到匹配全角字符的正则: ^[\x80-\xff]*^/ ,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程"; 
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) { 
print("该字符串全部是中文"); 
} else { 
print("该字符串不全部是中文"); 
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[\x{4e00}-\x{9fa5}]+$/u,

参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

<?php 
$action = trim($_GET['action']); 
if($action == "sub") 
{ 
$str = $_POST['dir']; 
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式 
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 
{ 
echo "<font color=red>您输入的[".$str."]含有违法字符</font>"; 
} 
else 
{ 
echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>"; 
} 
} 
?>

<form. method="POST" action="?action=sub"> 
输入字符(数字,字母,汉字,下划线): 
<input type="text" name="dir" value=""> 
<input type="submit" value="提交"> 
</form>

GBK: preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式。
PHP 相关文章推荐
PHP5.3的垃圾回收机制(动态存储分配方案)深入理解
Dec 10 PHP
PHP之APC缓存详细介绍 apc模块安装
Jan 13 PHP
学习php中的正则表达式
Aug 17 PHP
ThinkPHP公共配置文件与各自项目中配置文件组合的方法
Nov 24 PHP
php实现Linux服务器木马排查及加固功能
Dec 29 PHP
PHP封装的HttpClient类用法实例
Jun 17 PHP
解决更换PHP5.4以上版本后Dedecms后台登录空白问题的方法
Oct 23 PHP
THINKPHP在添加数据的时候获取主键id的值方法
Apr 03 PHP
php实现基于pdo的事务处理方法示例
Jul 21 PHP
Laravel中Facade的加载过程与原理详解
Sep 22 PHP
php对象工厂类完整示例
Aug 09 PHP
PHP 对接美团大众点评团购券(门票)的开发步骤
Apr 03 PHP
php对二维数组按指定键值key排序示例代码
Nov 26 #PHP
PHP上传文件时文件过大$_FILES为空的解决方法
Nov 26 #PHP
PHP获取当前url的具体方法全面解析
Nov 26 #PHP
php 批量替换html标签的实例代码
Nov 26 #PHP
利用phpExcel实现Excel数据的导入导出(全步骤详细解析)
Nov 26 #PHP
php数组去重实例及分析
Nov 26 #PHP
php三维数组去重(示例代码)
Nov 26 #PHP
You might like
如何写php程序?
2006/12/08 PHP
php中的注释、变量、数组、常量、函数应用介绍
2012/11/16 PHP
利用PHP实现图片等比例放大和缩小的方法详解
2013/06/06 PHP
PHP 实现类似js中alert() 提示框
2015/03/18 PHP
php计算整个mysql数据库大小的方法
2015/06/19 PHP
android上传图片到PHP的过程详解
2015/08/03 PHP
PHP微信分享开发详解
2017/01/14 PHP
通过源码解析Laravel的依赖注入
2018/01/22 PHP
js 屏蔽鼠标右键脚本附破解方法
2009/12/03 Javascript
Javascript下IE与Firefox下的差异兼容写法总结
2010/06/18 Javascript
非主流的textarea自增长实现js代码
2011/12/20 Javascript
用js实现小球的自由移动代码
2013/04/22 Javascript
JavaScript使用Range调色及透明度实例
2016/09/25 Javascript
利用vue实现模态框组件
2016/12/19 Javascript
基于bootstrap页面渲染的问题解决方法
2018/08/09 Javascript
用Python输出一个杨辉三角的例子
2014/06/13 Python
Python与Redis的连接教程
2015/04/22 Python
Python中字典创建、遍历、添加等实用操作技巧合集
2015/06/02 Python
Python获取当前页面内所有链接的四种方法对比分析
2017/08/19 Python
matplotlib简介,安装和简单实例代码
2017/12/26 Python
python 中if else 语句的作用及示例代码
2018/03/05 Python
对Tensorflow中的变量初始化函数详解
2018/07/27 Python
python批量修改文件夹及其子文件夹下的文件内容
2019/03/15 Python
解决webdriver.Chrome()报错:Message:'chromedriver' executable needs to be in Path
2019/06/12 Python
Python实现剪刀石头布小游戏(与电脑对战)
2019/12/31 Python
python实现拼接图片
2020/03/23 Python
python filecmp.dircmp实现递归比对两个目录的方法
2020/05/22 Python
基于Python编写一个计算器程序,实现简单的加减乘除和取余二元运算
2020/08/05 Python
python 爬取免费简历模板网站的示例
2020/09/27 Python
Html5页面中的返回实现的方法
2018/02/26 HTML / CSS
奥地利网上现代灯具和灯饰店:Lampenwelt.at
2018/01/29 全球购物
介绍下Java的输入输出流
2014/01/22 面试题
高中毕业生自我鉴定
2013/11/03 职场文书
谁动了我的奶酪读书笔记
2015/06/30 职场文书
军训后的感想
2015/08/07 职场文书
网络研修心得体会
2016/01/08 职场文书