python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
用python实现的可以拷贝或剪切一个文件列表中的所有文件
Apr 30 Python
使用Python判断IP地址合法性的方法实例
Mar 13 Python
深入学习Python中的上下文管理器与else块
Aug 27 Python
Python 列表理解及使用方法
Oct 27 Python
Python中查看变量的类型内存地址所占字节的大小
Jun 26 Python
python2 中 unicode 和 str 之间的转换及与python3 str 的区别
Jul 25 Python
Python调用C语言的实现
Jul 26 Python
django model的update时auto_now不被更新的原因及解决方式
Apr 01 Python
jupyter notebook实现显示行号
Apr 13 Python
python中执行smtplib失败的处理方法
Jul 01 Python
Python join()函数原理及使用方法
Nov 14 Python
Python pygame实现中国象棋单机版源码
Jun 20 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
PHP Cookei记录用户历史浏览信息的代码
2016/02/03 PHP
php文件缓存方法总结
2016/03/16 PHP
php 三元运算符实例详细介绍
2016/12/15 PHP
PHP基于phpqrcode类生成二维码的方法详解
2018/03/14 PHP
jQuery滚动加载图片效果的实现
2013/03/06 Javascript
用JavaScript实现一个代码简洁、逻辑不复杂的多级树
2014/05/23 Javascript
使用cluster 将自己的Node服务器扩展为多线程服务器
2014/11/10 Javascript
jquery插件格式实例分析
2016/06/16 Javascript
基于Turn.js 实现翻书效果实例解析
2016/06/20 Javascript
JavaScript——DOM操作——Window.document对象详解
2016/07/14 Javascript
vue loadmore组件上拉加载更多功能示例代码
2017/07/19 Javascript
详解ES6通过WeakMap解决内存泄漏问题
2018/03/09 Javascript
使用vue-cli(vue脚手架)快速搭建项目的方法
2018/05/21 Javascript
jquery.onoff实现简单的开关按钮功能(推荐)
2018/05/24 jQuery
JS实现获取毫秒值及转换成年月日时分秒的方法
2018/08/15 Javascript
vue组件间的参数传递实例详解
2019/04/26 Javascript
微信小程序实现元素渐入渐出动画效果封装方法
2019/05/18 Javascript
jquery实现手风琴案例
2020/05/04 jQuery
基于react项目打包css引用路径错误解决方案
2020/10/28 Javascript
分析Python的Django框架的运行方式及处理流程
2015/04/08 Python
Python使用pyodbc访问数据库操作方法详解
2018/07/05 Python
python opencv旋转图像(保持图像不被裁减)
2018/07/26 Python
Django中如何使用sass的方法步骤
2019/07/09 Python
Python imread、newaxis用法详解
2019/11/04 Python
python GUI库图形界面开发之PyQt5菜单栏控件QMenuBar的详细使用方法与实例
2020/02/28 Python
Python 开发工具通过 agent 代理使用的方法
2020/09/27 Python
加拿大高尔夫超市:Golf Town
2018/01/12 全球购物
N.Peal官网:来自伦敦的高档羊绒品牌
2018/10/29 全球购物
《最后的姿势》教学反思
2014/02/27 职场文书
道德之星事迹材料
2014/05/03 职场文书
人力资源管理专业自荐书
2014/07/07 职场文书
一般党员对照检查材料
2014/09/24 职场文书
护林员个人总结
2015/03/04 职场文书
2015年计划生育责任书
2015/05/08 职场文书
2019暑期安全倡议书!
2019/06/27 职场文书
Python中Permission denied的解决方案
2021/04/02 Python