python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
Python 解析XML文件
Apr 15 Python
详解Python验证码识别
Jan 25 Python
Python编程实现的图片识别功能示例
Aug 03 Python
python开启摄像头以及深度学习实现目标检测方法
Aug 03 Python
对python创建及引用动态变量名的示例讲解
Nov 10 Python
python实现三次样条插值
Dec 17 Python
python读取图片的方式,以及将图片以三维数组的形式输出方法
Jul 03 Python
简单了解python中的与或非运算
Sep 18 Python
Python爬虫实现vip电影下载的示例代码
Apr 20 Python
pytorch读取图像数据转成opencv格式实例
Jun 02 Python
Django form表单与请求的生命周期步骤详解
Jun 07 Python
python运行脚本文件的三种方法实例
Jun 25 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
将文件夹压缩成zip文件的php代码
2009/12/14 PHP
php中关于codeigniter的xmlrpc的类在进行数据交换时的类型问题
2011/07/03 PHP
PHP不用第三变量交换2个变量的值的解决方法
2013/06/02 PHP
Codeigniter发送邮件的方法
2015/03/19 PHP
session 加入redis的实现代码
2016/07/15 PHP
Swoole 5将移除自动添加Event::wait()特性详解
2019/07/10 PHP
php常用的工具开发整理
2019/09/26 PHP
javascript YUI 读码日记之 YAHOO.util.Dom - Part.4
2008/03/22 Javascript
Prototype使用指南之selector.js说明
2008/10/26 Javascript
jquery中输入验证中一个不错的效果
2010/08/21 Javascript
javascript函数声明和函数表达式区别分析
2014/12/02 Javascript
使用window.prompt()实现弹出用户输入的对话框
2015/04/13 Javascript
jQuery插件kinMaxShow扩展效果用法实例
2015/05/04 Javascript
BOM系列第二篇之定时器requestAnimationFrame
2016/08/17 Javascript
基于Bootstrap 3 JQuery及RegExp的表单验证功能
2017/02/16 Javascript
利用Vue v-model实现一个自定义的表单组件
2017/04/27 Javascript
JS中this的指向以及call、apply的作用
2018/05/06 Javascript
详解vue组件开发脚手架
2018/06/15 Javascript
[02:10]探秘浦东源深体育馆 DOTA2 Supermajor不见不散
2018/05/17 DOTA
python dict.get()和dict['key']的区别详解
2016/06/30 Python
全面了解python中的类,对象,方法,属性
2016/09/11 Python
浅谈django model的get和filter方法的区别(必看篇)
2017/05/23 Python
Django框架创建mysql连接与使用示例
2019/07/29 Python
CSS3中动画属性transform、transition和animation属性的区别
2016/09/25 HTML / CSS
Artist Guitars新西兰:乐器在线商店
2017/09/17 全球购物
土耳其风格手工珠宝:Ottoman Hands
2019/07/26 全球购物
请介绍一下Ant
2016/07/22 面试题
大一学生假期实习的自我评价
2013/10/12 职场文书
关于读书的演讲稿600字
2014/08/27 职场文书
2014年党支部工作总结
2014/11/13 职场文书
学生检讨书怎么写
2015/05/07 职场文书
初中班主任心得体会
2016/01/07 职场文书
详解Laravel服务容器的优势
2021/05/29 PHP
Feign调用传输文件异常的解决
2021/06/24 Java/Android
Python将CSV文件转化为HTML文件的操作方法
2021/06/30 Python
mysql定时自动备份数据库的方法步骤
2021/07/07 MySQL