python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
python列表操作实例
Jan 14 Python
Python常见格式化字符串方法小结【百分号与format方法】
Sep 18 Python
解决Python 使用h5py加载文件,看不到keys()的问题
Feb 08 Python
python使用Plotly绘图工具绘制散点图、线形图
Apr 02 Python
python opencv鼠标事件实现画框圈定目标获取坐标信息
Apr 18 Python
浅析pandas 数据结构中的DataFrame
Oct 12 Python
DJANGO-URL反向解析REVERSE实例讲解
Oct 25 Python
python如何实现单链表的反转
Feb 10 Python
python模拟点击网页按钮实现方法
Feb 25 Python
jupyter notebook 使用过程中python莫名崩溃的原因及解决方式
Apr 10 Python
查看jupyter notebook每个单元格运行时间实例
Apr 22 Python
python把一个字符串切开的实例方法
Sep 27 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
20个PHP常用类库小结
2011/09/11 PHP
PHP查询快递信息的方法
2015/03/07 PHP
input+select(multiple) 实现下拉框输入值
2009/05/21 Javascript
百度Popup.js弹出框进化版 拖拽小框架发布 兼容IE6/7/8,Firefox,Chrome
2010/04/13 Javascript
js对象与打印对象分析比较
2013/04/23 Javascript
JS案例分享之金额小写转大写
2014/05/15 Javascript
node.js中的events.EventEmitter.listenerCount方法使用说明
2014/12/08 Javascript
理解AngularJs指令
2015/12/10 Javascript
Node.js 8 中的重要新特性
2017/06/28 Javascript
Vue2.0系列之过滤器的使用
2018/03/01 Javascript
深入解析Vue源码实例挂载与编译流程实现思路详解
2019/05/05 Javascript
为nuxt项目写一个面包屑cli工具实现自动生成页面与面包屑配置
2019/09/29 Javascript
vue-cli3.X快速创建项目的方法步骤
2019/11/14 Javascript
javascript实现简易数码时钟
2020/03/30 Javascript
JavaScript冒泡算法原理与实现方法深入理解
2020/06/04 Javascript
[01:02:30]Mineski vs Secret 2019国际邀请赛淘汰赛 败者组 BO3 第三场 8.22
2019/09/05 DOTA
Python中Django发送带图片和附件的邮件
2017/03/31 Python
Django objects.all()、objects.get()与objects.filter()之间的区别介绍
2017/06/12 Python
python利用rsa库做公钥解密的方法教程
2017/12/10 Python
关于Python正则表达式 findall函数问题详解
2018/03/22 Python
Python递归函数实例讲解
2019/02/27 Python
深入了解和应用Python 装饰器 @decorator
2019/04/02 Python
解决pyecharts在jupyter notebook中使用报错问题
2020/04/23 Python
Python脚本利用adb进行手机控制的方法
2019/07/08 Python
python 字符串追加实例
2019/07/20 Python
Python 列表的清空方式
2020/01/13 Python
python GUI库图形界面开发之PyQt5控件QTableWidget详细使用方法与属性
2020/02/25 Python
python多线程爬取西刺代理的示例代码
2021/01/30 Python
html5文本内容_动力节点Java学院整理
2017/07/11 HTML / CSS
JAKO-O德国野酷台湾站:德国首屈一指的婴幼童用品品牌
2019/01/14 全球购物
演讲稿格式范文
2014/05/19 职场文书
学雷锋标兵事迹材料
2014/08/18 职场文书
物价局领导班子四风问题整改措施
2014/10/26 职场文书
2014年体育教师工作总结
2014/12/03 职场文书
会议室使用管理制度
2015/08/06 职场文书
朋友聚会祝酒词
2015/08/10 职场文书