php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法


Posted in PHP onAugust 10, 2013

date.csv:
"ID" "NAME" "EMAIL"
"1" "小明" "xm@163.com"
"2" "小东" "xd@sina.com"
"3" "小少" "shaozi@hotmai.com"

读取这个csv文件

<?php
$handle=fopen('date.csv','r');
while($data=fgetcsv($handle,10000,"/t"))   
{   
  echo "$data[0]"."$data[1]"."$data[2]";   
}
?>

读取后在页面上显示时,成了这样:
"ID" NAME EMAIL
 1 小明 xm@163.com
 2 小东 xd@sina.com
 3 小少 shaozi@hotmai.com
fgetcsv函数的字段环绕符默认是双引号,
为什么我读取出来时,其它字段都好好的,可是ID还有双引号包着?

上网查了下,原来是utf8编码的bom在php下无法识别.
下面是查来的资料:
Unicode规范中有一个BOM的概念。BOM——Byte Order Mark,就是字节序标记。在
这里
找到一段关于BOM的说明:
在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。

另外unicode网站的
FAQ-BOM
详细介绍了BOM。官方的自然权威,不过是英文的,看起来比较费劲。
UTF-8编码的文件中,BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话,用UE打开这个文件,切换到十六进制编辑状态就可以看到开头的FFFE了。这是个标识UTF-8编码文件的好办法,软件通过BOM来识别这个文件是否是UTF-8编码,很多软件还要求读入的文件必须带BOM。可是,还是有很多软件不能识别BOM。我在研究Firefox的时候就知道,在Firefox早期的版本里,扩展是不能有BOM的,不过Firefox 1.5以后的版本已经开始支持BOM了。现在又发现,PHP也不支持BOM。

PHP在设计时就没有考虑BOM的问题,也就是说他不会忽略UTF-8编码的文件开头BOM的那三个字符。由于必须在转换->UTF-8转ASCII,或者在另存为里选择ASCII编码。如果是DOS格式的行尾符,可以用记事本打开,点另存为,选ASCII编码。如果包含中文字符的话,可以用UE的另存为功能,选择“UTF-8 无 BOM”即可。请参考下面的图片:
php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法

根据Bo-Blog的wiki的说明:Editplus需要先另存为gb,再另存为UTF-8。不过这样做要小心,所有GBK编码中不包含的字符就会都丢了。如果有一些非中文的字符在文件里的话还是不要用这种办法了。(从这一个小方面来看,UE——UltraEdite-32确实比Editplus好很多,Editplus太轻量级了)

另外我发现了一个办法,就是利用Wordpress提供的文件编辑器。这个办法不受限制,不需要去下载专门的编辑器,毕竟大家都在用Wordpress嘛。先在ftp里把要编辑的文件的写入权限打开,然后进入Wordpress后台->管理->文件编辑器,输入要编辑文件的路径,点编辑文件。在显示出来的编辑界面中,你是看不到开头的那三个字符的,不过没关系,把光标定位在整个文件的第一个字符前,按一下Backspace键。OK了,点更新文件吧,在ftp里刷新一下,可以看到文件小了3字节,大功告成。

最后说一下,这是个大问题,所有要自己写插件的,编辑别人的插件自己用的,需要修改模版的(这条估计每个人都需要吧),最好了解一下上面的知识,免得出现问题时不知所措。

PHP 相关文章推荐
PHP数据库操作面向对象的优点
Oct 09 PHP
简单易用的计数器(数据库)
Oct 09 PHP
PHP安装攻略:常见问题解答(三)
Oct 09 PHP
PHP中的CMS的涵义
Mar 11 PHP
PHP中查询SQL Server或Sybase时TEXT字段被截断的解决方法
Mar 10 PHP
PHP 错误之引号中使用变量
May 04 PHP
php获取mysql数据库中的所有表名的代码
Apr 23 PHP
PHP中使用Imagick读取pdf并生成png缩略图实例
Jan 21 PHP
codeigniter实现get分页的方法
Jul 10 PHP
初识通用数据库操作类――前端easyui-datagrid,form(php)
Jul 31 PHP
PHP5.5安装PHPRedis扩展及连接测试方法
Jan 22 PHP
PHP依赖注入原理与用法分析
Aug 21 PHP
浅析php中常量,变量的作用域和生存周期
Aug 10 #PHP
浅析linux下apache服务器的配置和管理
Aug 10 #PHP
本地机apache配置基于域名的虚拟主机详解
Aug 10 #PHP
php 删除目录下N分钟前创建的所有文件的实现代码
Aug 10 #PHP
php中如何判断一个网页请求是ajax请求还是普通请求
Aug 10 #PHP
php一些错误处理的方法与技巧总结
Aug 10 #PHP
Zend Studio 实用快捷键一览表(精心整理)
Aug 10 #PHP
You might like
上海牌131型七灯四波段四喇叭一级收音机
2021/03/02 无线电
整合了前面的PHP数据库连接类~~做成一个分页类!
2006/11/25 PHP
PHP 数据库树的遍历方法
2009/02/06 PHP
PHP实现的增强性mhash函数
2015/05/27 PHP
Laravel框架实现多个视图共享相同数据的方法详解
2019/07/09 PHP
PHP7 字符串处理机制修改
2021/03/09 PHP
深入分析Cookie的安全性问题
2015/03/01 Javascript
png在IE6 下无法透明的解决方法汇总
2015/05/21 Javascript
JCrop+ajaxUpload 图像切割上传的实例代码
2016/07/20 Javascript
值得分享的bootstrap table实例
2016/09/22 Javascript
详解Node.js:events事件模块
2016/11/24 Javascript
BootStrap表单验证实例代码
2017/01/13 Javascript
详解Vue2中组件间通信的解决全方案
2017/07/28 Javascript
微信小程序仿朋友圈发布动态功能
2018/07/15 Javascript
解决vue数组中对象属性变化页面不渲染问题
2018/08/09 Javascript
jQuery实现的简单歌词滚动功能示例
2019/01/07 jQuery
解决layui的input独占一行的问题
2019/09/10 Javascript
js模拟F11页面全屏显示
2019/09/17 Javascript
对Layer UI 模块化的用法详解
2019/09/26 Javascript
微信小程序返回箭头跳转到指定页面实例解析
2019/10/08 Javascript
原生JavaScript实现五子棋游戏
2020/11/09 Javascript
Python paramiko模块的使用示例
2018/04/11 Python
python基于itchat模块实现微信防撤回
2019/04/29 Python
Python Pandas数据中对时间的操作
2019/07/30 Python
世界最大的海报和艺术印刷商店:AllPosters.com
2017/02/01 全球购物
世界上最悠久的自行车制造商:Ribble Cycles
2017/03/18 全球购物
John Hardy官方网站:手工设计首饰的奢侈品牌
2017/07/05 全球购物
客户代表实习人员自我鉴定
2013/09/27 职场文书
标准化管理实施方案
2014/02/25 职场文书
英语辞职信范文
2015/02/28 职场文书
社区文明创建工作总结2015
2015/04/21 职场文书
公司晚宴祝酒词
2015/08/11 职场文书
学校教师培训工作总结
2015/10/14 职场文书
详解Django的MVT设计模式
2021/04/29 Python
教你怎么用Python实现多路径迷宫
2021/04/29 Python
python源码剖析之PyObject详解
2021/05/18 Python