linux系统上支持php的 iconv()函数的方法


Posted in PHP onOctober 01, 2011

1、下载libiconv函数库http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.9.2.tar.gz;
2、解压缩tar -zxvf libiconv-1.9.2.tar.gz;
3、安装libiconv

#configure --prefix=/usr/local/iconv 
#make 
#make install

4、重新编译php 增加编译参数--with-iconv=/usr/local/iconv
windows下
最近在做一个小偷程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些。 让我郁闷了好一会儿,去网上一查资料才知道这是iconv函数的一个bug。iconv在转换字符"—"到gb2312时会出错
解决方法很简单,就是在需要转成的编码后加 "//IGNORE" 也就是iconv函数第二个参数后.如下:
以下为引用的内容:
iconv("UTF-8","GB2312//IGNORE",$data)
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。

iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。
如果是windows2000+php,你可以修改php.ini文件,将extension=php_iconv.dll前的";"去掉,同时你要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)
在linux环境下,用静态安装的方式,在configure时加多一项 --with-iconv就可以了,phpinfo看得到iconv的项。(Linux7.3+Apache4.06+php4.3.2),

下载:ftp://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.8.tar.gz
安装:

#cp libiconv-1.8.tar.gz /usr/local/src 
#tar zxvf lib* 
#./configure --prefix=/usr/local/libiconv 
#make 
#make install 
编译php 
#./configure --prefix=/usr/local/php4.3.2 --with-iconv=/usr/local/libiconv/

使用的简单例子:

<?php
echo iconv("gb2312","ISO-8859-1","我们");

PHP中的mb_convert_encoding与iconv函数介绍

mb_convert_encoding这个函数是用来转换编码的。原来一直对程序编码这一概念不理解,不过现在好像有点开窍了。
不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。

mb_convert_encoding的用法见官方:
http://cn.php.net/manual/zh/function.mb-convert-encoding.php

做一个GBK To UTF-8

< ?php 
header("content-Type: text/html; charset=Utf-8"); 
echo mb_convert_encoding("???S我的友仔", "UTF-8", "GBK"); 
?>

再来个GB2312 To Big5
< ?php 
header("content-Type: text/html; charset=big5"); 
echo mb_convert_encoding("你是我的朋友", "big5", "GB2312"); 
?>

不过要使用上面的函数需要安装但是需要先enable mbstring 扩展库。

PHP中的另外一个函数iconv也是用来转换字符串编码的,与上函数功能相似。

下面还有一些详细的例子:
iconv — Convert string to requested character encoding
(PHP 4 >= 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 >= 4.0.6, PHP 5)

用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 扩展库,在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多种输入编码,它会根据内容自动识别,但是执行效率比iconv差太多;

string iconv ( string in_charset, string out_charset, string str )
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
Returns the converted string or FALSE on failure.

使用:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.

一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

from_encoding is specified by character code name before conversion. it can be array or string - comma separated enumerated list. If it is not specified, the internal encoding will be used.
/* Auto detect encoding from JIS, eucjp-win, sjis-win, then convert str to UCS-2LE */
$str = mb_convert_encoding($str, "UCS-2LE”, "JIS, eucjp-win, sjis-win”);
/* "auto” is expanded to "ASCII,JIS,UTF-8,EUC-JP,SJIS” */
$str = mb_convert_encoding($str, "EUC-JP”, "auto”);

例子:

$content = iconv(”GBK”, "UTF-8", $content); 
$content = mb_convert_encoding($content, "UTF-8", "GBK”);
PHP 相关文章推荐
二十行语句实现从Excel到mysql的转化
Oct 09 PHP
php url路由入门实例
Apr 23 PHP
PHP实现数组递归转义的方法
Aug 28 PHP
深入分析PHP引用(&amp;)
Sep 04 PHP
百度实时推送api接口应用示例
Oct 21 PHP
PHP CURL 多线程操作代码实例
May 13 PHP
php文件操作之小型留言本实例
Jun 20 PHP
CI分页类首页、尾页不显示的解决方法
Mar 28 PHP
PHP排序算法之堆排序(Heap Sort)实例详解
Apr 21 PHP
PHP实现的只保留字符串首尾字符功能示例【隐藏部分字符串】
Mar 11 PHP
PHP项目多语言配置平台实现过程解析
May 18 PHP
PHP实现考试倒计时功能代码
Apr 16 PHP
php中mysql模块部分功能的简单封装
Sep 30 #PHP
php XMLWriter类的简单示例代码(RSS输出)
Sep 30 #PHP
简单的PHP缓存设计实现代码
Sep 30 #PHP
php利用iframe实现无刷新文件上传功能的代码
Sep 29 #PHP
php json_encode奇怪问题说明
Sep 27 #PHP
PHP安全配置详细说明
Sep 26 #PHP
使用PHP遍历文件夹与子目录的函数代码
Sep 26 #PHP
You might like
PHPWind与Discuz截取字符函数substrs与cutstr性能比较
2011/12/05 PHP
php使用gzip压缩传输js和css文件的方法
2015/07/29 PHP
Yii2框架使用计划任务的方法
2016/05/25 PHP
php判断是否为ajax请求的方法
2016/11/29 PHP
PHP自定义函数实现数组比较功能示例
2017/10/19 PHP
jQuery 表单验证扩展代码(二)
2010/10/20 Javascript
jQuery 拖动层(在可视区域范围内)
2012/05/24 Javascript
基于JQuery的类似新浪微博展示信息效果的代码
2012/07/23 Javascript
自己写的兼容ie和ff的在线文本编辑器类似ewebeditor
2012/12/12 Javascript
javascript操作table(insertRow,deleteRow,insertCell,deleteCell方法详解)
2013/12/16 Javascript
js去除浏览器默认底图的方法
2015/06/08 Javascript
利用node.js本地搭建HTTP服务器
2017/04/19 Javascript
解决JS外部文件中文注释出现乱码问题
2017/07/09 Javascript
Vue中使用clipboard实现复制功能
2018/09/05 Javascript
js实现验证码功能
2020/07/24 Javascript
python的常见命令注入威胁
2013/02/18 Python
Python基于回溯法子集树模板解决找零问题示例
2017/09/11 Python
Python使用googletrans报错的解决方法
2018/09/25 Python
python 检查文件mime类型的方法
2018/12/08 Python
详解如何管理多个Python版本和虚拟环境
2019/05/10 Python
使用selenium模拟登录解决滑块验证问题的实现
2019/05/10 Python
python os模块简单应用示例
2019/05/23 Python
python实现电子词典
2020/03/03 Python
PyCharm中Matplotlib绘图不能显示UI效果的问题解决
2020/03/12 Python
采购类个人求职的自我评价
2014/02/18 职场文书
环境保护与污染治理求职信
2014/07/16 职场文书
2014年小学重阳节活动策划方案
2014/09/16 职场文书
社区服务活动报告
2015/02/05 职场文书
幼儿园食品安全责任书
2015/05/08 职场文书
拉贝日记观后感
2015/06/05 职场文书
招商银行收入证明
2015/06/17 职场文书
人民的好儿女观后感
2015/06/18 职场文书
2015年庆祝国庆节66周年演讲稿
2015/07/30 职场文书
班主任寄语2016
2015/12/04 职场文书
教师正风肃纪心得体会
2016/01/15 职场文书
《巨人的花园》教学反思
2016/02/19 职场文书