python3实现全角和半角字符转换的方法示例


Posted in Python onSeptember 21, 2017

前言

本文主要给大家介绍了关于python3中全角和半角字符转换的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。

一、背景介绍

解决什么问题:快速方便的对文本进行全角半角自动转换

适用什么场景:学生答题数据中全角字符替换为半角字符

二、全角半角原理

全角即:Double Byte Character,简称DBC

半角即:Single Byte Character,简称SBC

在 windows 中,中文和全角字符都占两个字节,并且使用了 ascii chart 2 (codes 128?255);
全角字符的第一个字节总是被置为 163,而第二个字节则是相同半角字符码加上128(不包括空格,全角空格和半角空格也要考虑进去);

对于中文来说,它的第一个字节被置为大于163,如'阿'为:176 162,检测到中文时不进行转换。

例如:半角 a 为 65,则全角 a 是 163(第一个字节)、193(第二个字节,128+65)。

全角半角示例:(文本 test.txt 包含全角和半角字符)

F:\test>type test.txt
123456
123456
abcdefg
abcdefg
中国你好

三、使用 Python3 实现全角半角转换

# -*- coding:utf-8 -*-
# i@mail.chenpeng.info

”'
全角即:Double Byte Character,简称:DBC
半角即:Single Byte Character,简称:SBC
”'

def DBC2SBC(ustring):
 ”' 全角转半角 ”'
 rstring = “”
 for uchar in ustring:
  inside_code = ord(uchar)
  if inside_code == 0x3000:
  inside_code = 0x0020
  else:
  inside_code -= 0xfee0
  if not (0x0021 <= inside_code and inside_code <= 0x7e):
   rstring += uchar
   continue
  rstring += chr(inside_code)
 return rstring

def SBC2DBC(ustring):
 ”' 半角转全角 ”'
 rstring = “”
 for uchar in ustring:
  inside_code = ord(uchar)
  if inside_code == 0x0020:
  inside_code = 0x3000
  else:
  if not (0x0021 <= inside_code and inside_code <= 0x7e):
   rstring += uchar
   continue
  inside_code += 0xfee0
  rstring += chr(inside_code)
 return rstring

s = ”'
array(‘0' => ‘0', ‘1' => ‘1', ‘2' => ‘2', ‘3' => ‘3', ‘4' => ‘4',
  ‘5' => ‘5', ‘6' => ‘6', ‘7' => ‘7', ‘8' => ‘8', ‘9' => ‘9',
  ‘A' => ‘A', ‘B' => ‘B', ‘C' => ‘C', ‘D' => ‘D', ‘E' => ‘E',
  ‘F' => ‘F', ‘G' => ‘G', ‘H' => ‘H', ‘I' => ‘I', ‘J' => ‘J',
  ‘K' => ‘K', ‘L' => ‘L', ‘M' => ‘M', ‘N' => ‘N', ‘O' => ‘O',
  ‘P' => ‘P', ‘Q' => ‘Q', ‘R' => ‘R', ‘S' => ‘S', ‘T' => ‘T',
  ‘U' => ‘U', ‘V' => ‘V', ‘W' => ‘W', ‘X' => ‘X', ‘Y' => ‘Y',
  ‘Z' => ‘Z', ‘a' => ‘a', ‘b' => ‘b', ‘c' => ‘c', ‘d' => ‘d',
  ‘e' => ‘e', ‘f' => ‘f', ‘g' => ‘g', ‘h' => ‘h', ‘i' => ‘i',
  ‘j' => ‘j', ‘k' => ‘k', ‘l' => ‘l', ‘m' => ‘m', ‘n' => ‘n',
  ‘o' => ‘o', ‘p' => ‘p', ‘q' => ‘q', ‘r' => ‘r', ‘s' => ‘s',
  ‘t' => ‘t', ‘u' => ‘u', ‘v' => ‘v', ‘w' => ‘w', ‘x' => ‘x',
  ‘y' => ‘y', ‘z' => ‘z',
  ‘(' => ‘(‘, ‘)' => ‘)', ‘〔' => ‘[‘, ‘〕' => ‘]', ‘【' => ‘[‘,
  ‘】' => ‘]', ‘〖' => ‘[‘, ‘〗' => ‘]', ‘”‘ => ‘[‘, ‘”‘ => ‘]',
  ‘\” => ‘[‘, ‘\” => ‘]', ‘{' => ‘{‘, ‘}' => ‘}', ‘《' => ‘<‘,
  ‘》' => ‘>',
  ‘%' => ‘%', ‘+' => ‘+', ‘—' => ‘-‘, ‘-' => ‘-‘, ‘~' => ‘-‘,
  ‘:' => ‘:', ‘。' => ‘.', ‘、' => ‘,', ‘,' => ‘.', ‘、' => ‘.',
  ‘;' => ‘,', ‘?' => ‘?', ‘!' => ‘!', ‘…' => ‘-‘, ‘‖' => ‘|',
  ‘”‘ => ‘”‘, ‘\” => ‘`', ‘\” => ‘`', ‘|' => ‘|', ‘〃' => ‘”‘,
  ‘ ' => ‘ ‘);
  ”'

# 全角转半角
print(DBC2SBC(s))

# 半角转全角
print(SBC2DBC(s))

s = ”'中文测试”'

# 全角转半角
print(DBC2SBC(s))

# 半角转全角
print(SBC2DBC(s))

四、总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

五、参考资料

http://thinkerou.com/2015-06/covert-dbc-sbc/

Python 相关文章推荐
python实现的简单猜数字游戏
Apr 04 Python
Python中random模块用法实例分析
May 19 Python
Python通过DOM和SAX方式解析XML的应用实例分享
Nov 16 Python
python下调用pytesseract识别某网站验证码的实现方法
Jun 06 Python
python Celery定时任务的示例
Mar 13 Python
在cmd中运行.py文件: python的操作步骤
May 12 Python
python实现停车管理系统
Nov 30 Python
Python二叉树的遍历操作示例【前序遍历,中序遍历,后序遍历,层序遍历】
Dec 24 Python
python使用suds调用webservice接口的方法
Jan 03 Python
python使用selenium登录QQ邮箱(附带滑动解锁)
Jan 23 Python
Python之修改图片像素值的方法
Jul 03 Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 Python
python实现二分查找算法
Sep 21 #Python
分享给Python新手们的几道简单练习题
Sep 21 #Python
python验证码识别的示例代码
Sep 21 #Python
Python优先队列实现方法示例
Sep 21 #Python
python虚拟环境virtualenv的安装与使用
Sep 21 #Python
基于python socketserver框架全面解析
Sep 21 #Python
基于python select.select模块通信的实例讲解
Sep 21 #Python
You might like
PHP读取ACCESS数据到MYSQL的代码
2011/05/11 PHP
CodeIgniter输出中文乱码的两种解决办法
2014/06/12 PHP
PHP+Ajax异步带进度条上传文件实例
2016/11/01 PHP
PHP实现的观察者模式实例
2017/06/21 PHP
PHP利用Cookie设置用户30分钟未操作自动退出功能
2017/07/03 PHP
Laravel框架中缓存的使用方法分析
2019/09/06 PHP
TP5框架实现上传多张图片的方法分析
2020/03/29 PHP
图片自动缩小的js代码,用以防止图片撑破页面
2007/03/12 Javascript
cookie丢失问题(认证失效) Authentication (用户验证信息)也会丢失
2009/06/04 Javascript
prototype与jquery下Ajax实现的差别
2009/09/13 Javascript
windows8.1+iis8.5下安装node.js开发环境
2014/12/12 Javascript
jquery复选框多选赋值给文本框的方法
2015/01/27 Javascript
解决WordPress使用CDN后博文无法评论的错误
2015/12/15 Javascript
Vue.js开发环境搭建
2016/11/10 Javascript
Nodejs下DNS缓存问题浅析
2016/11/16 NodeJs
jquery实现提示语淡入效果
2017/05/05 jQuery
Angularjs Promise实例详解
2018/03/15 Javascript
vue图片加载失败时用默认图片替换的方法
2019/08/29 Javascript
jQuery实现可以计算进制转换的计算器
2020/10/19 jQuery
在Vue中使用Select选择器拼接label的操作
2020/10/22 Javascript
在MAC上搭建python数据分析开发环境
2016/01/26 Python
python flask 多对多表查询功能
2017/06/25 Python
python pandas 对series和dataframe的重置索引reindex方法
2018/06/07 Python
python制作简单五子棋游戏
2019/06/18 Python
如何在python中判断变量的类型
2020/07/29 Python
iRobot官网:改变生活的家用机器人品牌
2016/09/20 全球购物
JD Sports法国:英国篮球和运动时尚的领导者
2017/09/28 全球购物
Lookfantastic葡萄牙官方网站:欧洲第一大化妆品零售商
2018/03/17 全球购物
会计专业自荐信
2013/12/02 职场文书
军训心得体会
2013/12/31 职场文书
《数星星的孩子》教学反思
2014/04/11 职场文书
教师个人师德工作总结2015
2015/05/12 职场文书
火烧圆明园观后感
2015/06/03 职场文书
解析在浏览器地址栏输入一个URL后发生了什么
2021/06/21 Servers
微软Win11什么功能最惊艳? Windows11新功能特性汇总
2021/11/21 数码科技
Java Spring Boot 正确读取配置文件中的属性的值
2022/04/20 Java/Android