python 域名分析工具实现代码


Posted in Python onJuly 15, 2009

代码如下:

import sys, urllib 
import datetime,time 
def getDate(): 
strday=datetime.datetime.now().__str__() 
strday=strday.split()[0] 
return strday 
#url = "http://www.kingnic.com/list/2009-06-16.txt" 
def getUrl(dateStr=None): 
baseUrl ="http://www.kingnic.com/list/" 
if dateStr: 
return baseUrl+dateStr+".txt" 
thisDate = getDate(); 
if not thisDate: 
print "Error Date!" 
return None; 
url = baseUrl+thisDate+".txt" 
return url 
def getSource(url): 
source = urllib.urlopen(url).read() 
return source def save(source,filename="domains.txt"): 
fp = open(filename,"w") 
fp.write(source) 
fp.close() 
return True; 
def loadList(fileName="domains.txt"): 
fp = open("domains.txt","r") 
source = fp.readlines() 
fp.close() 
return source; 
def getPrefix(domain): 
return domain.split('.')[0] 
def getPostfix(domain): 
return domain.split('.')[1] 
def hasMidLine(domain): 
if '-' in domain: 
return True 
else: 
return False 
def parser(domains): 
max =4 
min =0 
keyword =('sky','see','job') 
result=[] 
len_num =0; 
mid_line_num =0; 
for domain in domains: 
prefix = getPrefix(domain) 
postfix = getPostfix(domain) 
domainlen = len(prefix) 
if (domainlen < min) or (domainlen > max): 
len_num +=1 
continue 
if hasMidLine(prefix): 
mid_line_num +=1 
continue 
result.append(domain) 
print " log : \n" 
print "all: \t",len(domains) 
print "len not in [%s,%s] \t: %s"%(max,min,len_num) 
print "contain '-' :\t",mid_line_num 
print "remain:\t",len(result) 
return result; 
if __name__ == "__main__": 
url = getUrl() 
source = getSource(url) 
save(source) 
domains =loadList() 
result = parser(domains) 
save("".join(result),"result.txt") 
print("\n\n\nfinished!!")

输出文件:
domains.txt : kingnic.com 据当天释放的 域名;
result.txt    : 符合过滤条件的域名;
log输出:
all: 55500 
len not in [4,0] : 55019 
contain '-' : 32 
remain: 449 
finished!!

对 后缀、长度和有无“-”过滤,过滤条件有点少,其它以后如有需要再加。
Python 相关文章推荐
Python多线程结合队列下载百度音乐的方法
Jul 27 Python
Python二叉树的定义及常用遍历算法分析
Nov 24 Python
教你用Python写安卓游戏外挂
Jan 11 Python
单链表反转python实现代码示例
Feb 08 Python
Python SQL查询并生成json文件操作示例
Aug 17 Python
python ftp 按目录结构上传下载的实现代码
Sep 12 Python
python实现多层感知器MLP(基于双月数据集)
Jan 18 Python
python调用虹软2.0第三版的具体使用
Feb 22 Python
pymongo中聚合查询的使用方法
Mar 22 Python
Python django搭建layui提交表单,表格,图标的实例
Nov 18 Python
python实现定时发送邮件到指定邮箱
Dec 23 Python
解决import tensorflow导致jupyter内核死亡的问题
Feb 06 Python
python 自动提交和抓取网页
Jul 13 #Python
python self,cls,decorator的理解
Jul 13 #Python
python 解析html之BeautifulSoup
Jul 07 #Python
打印出python 当前全局变量和入口参数的所有属性
Jul 01 #Python
python 查找文件夹下所有文件 实现代码
Jul 01 #Python
python 运算符 供重载参考
Jun 11 #Python
python getopt 参数处理小示例
Jun 09 #Python
You might like
php数组一对一替换实现代码
2012/08/31 PHP
php中过滤非法字符的具体实现
2013/10/29 PHP
php截取字符串函数分享
2015/02/02 PHP
详解PHP错误日志的获取方法
2015/07/20 PHP
PHP实现的分页类定义与用法示例
2017/07/05 PHP
Laravel 简单实现Ajax滚动加载示例
2019/10/22 PHP
jQuery 表格工具集
2010/04/25 Javascript
使用jQuery实现dropdownlist的联动效果(sharepoint 2007)
2011/03/30 Javascript
ExtJS4 组件化编程,动态加载,面向对象,Direct
2011/05/12 Javascript
一个不错的字符串转码解码函数(自写)
2014/07/31 Javascript
javascript实现3D切换焦点图
2015/10/16 Javascript
AngularJs基本特性解析(一)
2016/07/21 Javascript
利用node.js+mongodb如何搭建一个简单登录注册的功能详解
2017/07/30 Javascript
JavaScript实现的浏览器下载文件的方法
2017/08/09 Javascript
SVG动画vivus.js库使用小结(实例代码)
2017/09/14 Javascript
jQuery进阶实践之利用最优雅的方式如何写ajax请求
2017/12/20 jQuery
ExtJs整合Echarts的示例代码
2018/02/27 Javascript
解决vue 打包发布去#和页面空白的问题
2018/09/04 Javascript
[01:05:40]2014 DOTA2国际邀请赛中国区预选赛 5 23 CIS VS DT第三场
2014/05/24 DOTA
Python Socket编程入门教程
2014/07/11 Python
Python中的字典遍历备忘
2015/01/17 Python
Windows下为Python安装Matplotlib模块
2015/11/06 Python
Python中的几种矩阵乘法(小结)
2019/07/10 Python
python调用webservice接口的实现
2019/07/12 Python
python实现秒杀商品的微信自动提醒功能(代码详解)
2020/04/27 Python
django Layui界面点击弹出对话框并请求逻辑生成分页的动态表格实例
2020/05/12 Python
Python虚拟环境库virtualenvwrapper安装及使用
2020/06/17 Python
pycharm Tab键设置成4个空格的操作
2021/02/26 Python
雅诗兰黛旗下走天然植物路线的彩妆品牌:Prescriptives
2016/08/14 全球购物
英国异国风情旅游网站:Travel Talk Tours(团体旅游、探险旅游、帆船假期)
2018/07/26 全球购物
造价工程师个人求职信
2013/09/21 职场文书
视光学专业毕业生推荐信
2013/10/28 职场文书
竞聘书格式及范文
2014/03/31 职场文书
股东出资证明书(正规版)
2014/09/24 职场文书
教师党员学习十八届四中全会思想汇报
2014/11/03 职场文书
《法国号》教学反思
2016/02/22 职场文书