在任意字符集下正常显示网页的方法二(续)


Posted in PHP onApril 01, 2007

转:coolcode.cn
前几天写了一篇在任意字符集下正常显示网页的方法,里面介绍的很简单,就是把前128个字符以外的字符集都用 NCR 来表示,但是具体怎么转化我没有介绍,因为当时我觉得太简单了。但是后来发现有人问这个问题,这里就详细说明一下。
首先第一步是要把源字符集的字符串转化为 UTF-16 字符集,做这一步是因为 UTF-16 字符集中的每个字符都是两个字节,后面处理起来很容易,而如果在源字符集上直接做处理则很复杂。源字符集可以从原网页中的 meta 标签中获得,也可以单独指定,我的程序是让用户在表单中指定源字符集,因为我不能保证用户提交的文件就一定是 HTML 文件(其他文件也是可以的,比如这个 WordPress 的汉化包源文件是个 po 文件,它里面的内容也可以这样处理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 标签,所以通过表单单独指定字符集比较保险。你可能会觉得将一种字符集转化为另一种字符集很复杂,确实如此,如果自己来实现的话,确实非常麻烦,但是用 PHP 来做却很容易,因为它里面已经包含这样的函数了,你可以通过 iconv 函数很容易的来实现各种字符集之间的转化,如果你的机器上没有安装 iconv 扩展,你也可以使用 mb_convert_encoding 函数,如果 Multibyte String 扩展也没有安装,那就没办法了,因为你要自己实现那么多种编码的转化基本上是不可能的,除非你是顶级大牛!推荐使用 iconv,因为这个效率高,支持的字符集也更多。
做完上面那一步之后,接下来是以每两个字节为单位对字符串进行处理。这两个字节直接转化为数字就是 &#xxxxx; 中的 xxxxx,如果这个数字小于 128 就直接使用这个字符(注意这里就变成单字节了),否则就使用 &#xxxxx; 的形式。这里有一点要注意,就是当这个数字是 65279(16 进制的 0xFEFF)时,请把它忽略掉,因为这个是 Unicode 编码中的传输控制字符,而我们现在的字符串已经只有 iso-8859-1 编码中的前 128 个字符了,所以我们不需要它了。
好了,基本思路就是这样,下面是实现的程序:
下载: nochaoscode.php

<?php 

function nochaoscode($encode, $str) { 

    $str = iconv($encode, "UTF-16BE", $str); 

    for ($i = 0; $i < strlen($str); $i++,$i++) { 

        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 

        if ($code < 128) { 

            $output .= chr($code); 

        } else if ($code != 65279) { 

            $output .= "&#".$code.";"; 

        } 

    } 

    return $output; 

} 

?>

函数的参数中,$encode 是源字符集,$str 是需要进行转化的字符串。返回结果是转化以后字符串。
补充:今天 Legend 告诉我一种更简单的方法,就是直接利用 mb_convert_encoding 函数。因为 mb_convert_encoding 支持一种叫做 HTML-ENTITIES 的编码格式,也就是 NCR 编码。用它就更简单了。
PHP 相关文章推荐
浅谈PHP语法(1)
Oct 09 PHP
隐性调用php程序的方法
Mar 09 PHP
php SQL之where语句生成器
Mar 24 PHP
在WAMP环境下搭建ZendDebugger php调试工具的方法
Jul 18 PHP
解析php中mysql_connect与mysql_pconncet的区别详解
May 15 PHP
php读取excel文件示例分享(更新修改excel)
Feb 27 PHP
php实现图片转换成ASCII码的方法
Apr 03 PHP
PHP判断文件是否被引入的方法get_included_files用法示例
Nov 29 PHP
实例讲解YII2中多表关联的使用方法
Jul 21 PHP
PHP通过curl获取接口URL的数据方法
May 31 PHP
PHP htmlentities()函数用法讲解
Feb 25 PHP
PHP中类与对象功能、用法实例解读
Mar 27 PHP
在任意字符集下正常显示网页的方法一
Apr 01 #PHP
用PHP实现的生成静态HTML速度快类库
Mar 31 #PHP
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
Mar 29 #PHP
实现dedecms全站URL静态化改造的代码
Mar 29 #PHP
PHP中动态显示签名和ip原理
Mar 28 #PHP
收集的PHP中与数组相关的函数
Mar 22 #PHP
用PHP写的MySQL数据库用户认证系统代码
Mar 22 #PHP
You might like
php5.2以下版本无json_decode函数的解决方法
2014/05/25 PHP
基于thinkPHP实现的微信自定义分享功能示例
2016/09/23 PHP
关于php支持的协议与封装协议总结(推荐)
2017/11/17 PHP
js 新浪的一个图片播放图片轮换效果代码
2008/07/15 Javascript
JQuery实现倒计时按钮的实现代码
2012/03/23 Javascript
js实现星星打分效果的方法
2020/07/05 Javascript
JavaScript动态添加style节点的方法
2015/06/09 Javascript
浅析JavaScript动画
2015/06/10 Javascript
JS选中checkbox后获取table内一行TD所有数据的方法
2015/07/01 Javascript
JS、jQuery中select的用法详解
2016/04/21 Javascript
js实现省份下拉菜单效果
2017/02/15 Javascript
深入理解Webpack 中路径的配置
2017/06/17 Javascript
Angular2生命周期钩子函数的详细介绍
2017/07/10 Javascript
纯js实现页面返回顶部的动画(超简单)
2017/08/10 Javascript
React学习笔记之列表渲染示例详解
2017/08/22 Javascript
vue-router实现组件间的跳转(参数传递)
2017/11/07 Javascript
vue实现a标签点击高亮方法
2018/03/17 Javascript
使用vue打包时vendor文件过大或者是app.js文件很大的问题
2018/06/29 Javascript
laravel-admin 与 vue 结合使用实例代码详解
2019/06/04 Javascript
Vue3 中的数据侦测的实现
2019/10/09 Javascript
vue 实现移动端键盘搜索事件监听
2019/11/06 Javascript
vue-drawer-layout实现手势滑出菜单栏
2020/11/19 Vue.js
[45:14]Optic vs VP 2018国际邀请赛淘汰赛BO3 第二场 8.24
2018/08/25 DOTA
python实现八大排序算法(1)
2017/09/14 Python
python打包生成的exe文件运行时提示缺少模块的解决方法
2018/10/31 Python
使用python serial 获取所有的串口名称的实例
2019/07/02 Python
python数据库编程 Mysql实现通讯录
2020/03/27 Python
Calzedonia美国官网:意大利风格袜子、打底裤和沙滩装
2018/07/19 全球购物
英国在线滑雪板和冲浪商店:The Board Basement
2020/01/11 全球购物
英国自行车商店:AW Cycles
2021/02/24 全球购物
优秀大学生推荐信范文
2013/11/28 职场文书
财务工作者先进事迹材料
2014/01/17 职场文书
特教教师先进事迹
2014/05/21 职场文书
工作会议通知
2015/04/15 职场文书
清明祭英烈活动总结
2015/05/11 职场文书
PyCharm 配置SSH和SFTP连接远程服务器
2022/05/11 Python