Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
简单文件操作python 修改文件指定行的方法
May 15 Python
Python抓取电影天堂电影信息的代码
Apr 07 Python
利用 Monkey 命令操作屏幕快速滑动
Dec 07 Python
一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
Apr 17 Python
Python 实现删除某路径下文件及文件夹的实例讲解
Apr 24 Python
django 多对多表的创建和插入代码实现
Sep 09 Python
YUV转为jpg图像的实现
Dec 09 Python
Django实现将一个字典传到前端显示出来
Apr 03 Python
Python Django中间件使用原理及流程分析
Jun 13 Python
Python爬虫爬取ts碎片视频+验证码登录功能
Feb 22 Python
Python爬虫网络请求之代理服务器和动态Cookies
Apr 12 Python
python数据分析之单因素分析线性拟合及地理编码
Jun 25 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
QQ互联一键登录审核不通过的解决方案
2014/09/10 PHP
跟我学Laravel之视图 & Response
2014/10/15 PHP
yii框架搜索分页modle写法
2016/12/19 PHP
thinkPHP5框架导出Excel文件简单操作示例
2018/08/03 PHP
再说AutoComplete自动补全之实现原理
2011/11/05 Javascript
jquery制作搜狐快站页面效果示例分享
2014/02/21 Javascript
localResizeIMG先压缩后使用ajax无刷新上传(移动端)
2015/08/11 Javascript
JS实现JSON.stringify的实例代码讲解
2017/02/07 Javascript
三种方式实现瀑布流布局
2017/02/10 Javascript
JavaScript实现类似淘宝的购物车效果
2017/03/16 Javascript
jquery实现倒计时小应用
2017/09/19 jQuery
layer弹出层倒计时关闭的实现方法
2019/09/27 Javascript
Vue中使用better-scroll实现轮播图组件
2020/03/07 Javascript
JS自定义滚动条效果
2020/03/13 Javascript
Python实现Mysql数据库连接池实例详解
2017/04/11 Python
使用Python写一个贪吃蛇游戏实例代码
2017/08/21 Python
Request的中断和ErrorHandler实例解析
2018/02/12 Python
浅析Python3中的对象垃圾收集机制
2019/06/06 Python
python中update的基本使用方法详解
2019/07/17 Python
python实现屏保程序(适用于背单词)
2019/07/30 Python
对django的User模型和四种扩展/重写方法小结
2019/08/17 Python
python多线程实现同时执行两个while循环的操作
2020/05/02 Python
Python自动巡检H3C交换机实现过程解析
2020/08/14 Python
简单的命令查看安装的python版本号
2020/08/28 Python
美国零售商店:Blue&Cream
2017/04/07 全球购物
世界领先的高品质定制产品平台:Zazzle
2017/07/23 全球购物
意大利制造的男鞋和女鞋:SCAROSSO
2018/03/07 全球购物
Room Mate Hotels美国:西班牙酒店品牌
2018/04/10 全球购物
医学毕业生自我鉴定
2013/10/30 职场文书
2014年社区学雷锋活动总结
2014/03/09 职场文书
试用期自我鉴定范文
2014/03/20 职场文书
校园广播稿精选
2014/10/01 职场文书
办公用房租赁协议书
2014/11/29 职场文书
2014年平安夜寄语
2014/12/08 职场文书
建议书范文
2015/02/05 职场文书
python plt.plot bar 如何设置绘图尺寸大小
2021/06/01 Python