python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
python局域网ip扫描示例分享
Apr 03 Python
Python找出文件中使用率最高的汉字实例详解
Jun 03 Python
python实现给数组按片赋值的方法
Jul 28 Python
python安装oracle扩展及数据库连接方法
Feb 21 Python
Python实现的读取/更改/写入xml文件操作示例
Aug 30 Python
Python中的十大图像处理工具(小结)
Jun 10 Python
Django实现微信小程序的登录验证功能并维护登录态
Jul 04 Python
python多线程与多进程及其区别详解
Aug 08 Python
Python 异常的捕获、异常的传递与主动抛出异常操作示例
Sep 23 Python
python代码区分大小写吗
Jun 17 Python
python使用建议技巧分享(三)
Aug 18 Python
深入理解python协程
Jun 15 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
PHP如何搭建百度Ueditor富文本编辑器
2018/09/21 PHP
laravel 实现登陆后返回登陆前的页面方法
2019/10/03 PHP
firebug的一个有趣现象介绍
2011/11/30 Javascript
纯js实现瀑布流展现照片(自动适应窗口大小)
2013/04/08 Javascript
让angularjs支持浏览器自动填表
2014/11/10 Javascript
Bootstrap零基础入门教程(三)
2016/07/18 Javascript
js变量提升深入理解
2016/09/16 Javascript
jQuery元素选择器实例代码
2017/02/06 Javascript
详解用webpack2.0构建vue2.0超详细精简版
2017/04/05 Javascript
requirejs按需加载angularjs文件实例
2017/06/08 Javascript
JS设计模式之单例模式(一)
2017/09/29 Javascript
js中的 || 与 &amp;&amp; 运算符详解
2018/05/24 Javascript
jQuery实现网页拼图游戏
2020/04/22 jQuery
JavaScript ES6箭头函数使用指南
2018/12/30 Javascript
如何使用pm2快速将项目部署到远程服务器
2019/03/12 Javascript
详解使用React.memo()来优化函数组件的性能
2019/03/19 Javascript
Jquery 动态添加元素并添加点击事件实现过程解析
2019/10/12 jQuery
基于vue-draggable 实现三级拖动排序效果
2020/01/10 Javascript
js实现翻牌小游戏
2020/07/31 Javascript
使用Python编写一个模仿CPU工作的程序
2015/04/16 Python
安装Python和pygame及相应的环境变量配置(图文教程)
2017/06/04 Python
CentOS下使用yum安装python-pip失败的完美解决方法
2017/08/16 Python
Python进程间通信Queue实例解析
2018/01/25 Python
pandas数据分组和聚合操作方法
2018/04/11 Python
Python实现求解括号匹配问题的方法
2018/04/17 Python
Python Cookie 读取和保存方法
2018/12/28 Python
简单了解python filter、map、reduce的区别
2020/01/14 Python
pycharm2020.1.2永久破解激活教程,实测有效
2020/10/29 Python
用Python制作音乐海报
2021/01/26 Python
Python3使用tesserocr识别字母数字验证码的实现
2021/01/29 Python
html5实现多文件的上传示例代码
2014/02/13 HTML / CSS
汽车服务工程专业自荐信
2014/09/02 职场文书
党员先进性教育整改措施
2014/09/18 职场文书
趵突泉导游词
2015/02/03 职场文书
三方合作意向书范本
2015/05/09 职场文书
校运会广播稿
2015/08/19 职场文书