PHP下编码转换函数mb_convert_encoding与iconv的使用说明


Posted in PHP onDecember 16, 2009

不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

<?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
<?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>
不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, “UCS-2LE”, “JIS, eucjp-win, sjis-win”);
/* “auto” is expanded to “ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, “EUC-JP”, “auto”);

例子:

$content = iconv("GBK", "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8","GBK");

PHP中使用mb_convert_encoding转码的小陷阱
在php程序中使用mb_convert_encoding()方法进行字符编码转换大家都很熟悉了,平时也在大量的使用。而且在一般情况下该方法也表现的足够好,值得表扬。但在一个项目中我们需要使用它进行UTF8到GBK的转换,在转换一些特殊字符时发现了一个不大不小的问题。具体表现为mb把在utf8可编码的字符而在gbk中不可编码的字符都转成了\0x00\0x80,这样就导致转换后的gbk字符是有问题的。
在我们的意识中,在进行字符编码转换的过程中,如果遇到目标编码不可表现的字符,转码程序应该做的是舍弃这种字符,这样虽然丢失了部分数据,但不会导致转码的字符序列不可用。不清楚mb为什么要使用上述方式而不是舍弃方式。
临时的解决方式是对转码后的字符串序列进行过滤,过滤掉所有\x00\80的字符;又或者在转义之前对utf8的字符串进行过滤,过滤掉ut8可表示而gbk不可表示的所有字符,从实现难度上来讲,第一种过滤方式比较容易做到。
PHP 相关文章推荐
关于PHP中的Class的几点个人看法
Oct 09 PHP
利用文件属性结合Session实现在线人数统计
Oct 09 PHP
php出现Cannot modify header information问题的解决方法大全
Apr 09 PHP
PHP 遍历XP文件夹下所有文件
Nov 27 PHP
php设计模式  Command(命令模式)
Jun 17 PHP
php代码书写习惯优化小结
Jun 20 PHP
php简单定时执行任务的实现方法
Feb 23 PHP
php遍历删除整个目录及文件的方法
Mar 13 PHP
YII CLinkPager分页类扩展增加显示共多少页
Jan 29 PHP
php 读取输出其他文件的实现方法
Jul 26 PHP
PHP htmlspecialchars()函数用法与实例讲解
Mar 08 PHP
thinkphp5框架调用其它控制器方法 实现自定义跳转界面功能示例
Jul 03 PHP
php生成xml简单实例代码
Dec 16 #PHP
PHP 基本语法格式
Dec 15 #PHP
php遍历目录viewDir函数
Dec 15 #PHP
php csv操作类代码
Dec 14 #PHP
PHP开发过程中常用函数收藏
Dec 14 #PHP
将文件夹压缩成zip文件的php代码
Dec 14 #PHP
php入门教程 精简版
Dec 13 #PHP
You might like
用PHP写的基于Memcache的Queue实现代码
2011/11/27 PHP
PHP COOKIE及时生效的方法介绍
2014/02/14 PHP
8个必备的PHP功能开发
2015/10/02 PHP
PHP 7的一些引人注目的新特性简单介绍
2015/11/08 PHP
php 修改上传文件大小限制实例详解
2016/10/23 PHP
鼠标图片振动代码
2006/07/06 Javascript
js 回车提交表单两种实现方法
2012/12/31 Javascript
jquery 无限级联菜单案例分享
2013/03/26 Javascript
仿新浪微博登陆邮箱提示效果的js代码
2013/08/02 Javascript
js创建表单元素并使用submit进行提交
2014/08/14 Javascript
NodeJS学习笔记之Connect中间件模块(二)
2015/01/27 NodeJs
JavaScript中的方法重载实例
2015/03/16 Javascript
JavaScript基于setTimeout实现计数的方法
2015/05/08 Javascript
JS+CSS实现的日本门户网站经典选项卡导航效果
2015/09/27 Javascript
javascript实现密码验证
2015/11/10 Javascript
javascript的理解及经典案例分析
2016/05/20 Javascript
原生js实现倒计时--2018
2017/02/21 Javascript
关于页面刷新vuex数据消失问题解决方案
2017/07/03 Javascript
webstorm添加vue.js支持的方法教程
2017/07/05 Javascript
[原创]js实现保存文本框内容为本地文件兼容IE,chrome,火狐浏览器
2018/02/14 Javascript
webpack源码之loader机制详解
2018/04/06 Javascript
Vue.js实现的表格增加删除demo示例
2018/05/22 Javascript
基于JS实现快速读取TXT文件
2020/08/25 Javascript
[02:34]DOTA2亚洲邀请赛 BG战队出场宣传片
2015/03/09 DOTA
python基于windows平台锁定键盘输入的方法
2015/03/05 Python
探究Python的Tornado框架对子域名和泛域名的支持
2015/05/02 Python
使用Python求解最大公约数的实现方法
2015/08/20 Python
pyinstaller打包多个py文件和去除cmd黑框的方法
2019/06/21 Python
python实现的批量分析xml标签中各个类别个数功能示例
2019/12/30 Python
解决python 在for循环并且pop数组的时候会跳过某些元素的问题
2020/12/11 Python
html5 外链式实现加减乘除的代码
2019/09/04 HTML / CSS
最畅销的视频游戏享受高达90%的折扣:CDKeys
2020/02/10 全球购物
应届大学生求职信
2013/12/01 职场文书
专业幼师实习生自我鉴定范文
2013/12/08 职场文书
绩效考核实施方案
2014/03/18 职场文书
新教师个人总结
2015/02/06 职场文书