python 域名分析工具实现代码


Posted in Python onJuly 15, 2009

代码如下:

import sys, urllib 
import datetime,time 
def getDate(): 
strday=datetime.datetime.now().__str__() 
strday=strday.split()[0] 
return strday 
#url = "http://www.kingnic.com/list/2009-06-16.txt" 
def getUrl(dateStr=None): 
baseUrl ="http://www.kingnic.com/list/" 
if dateStr: 
return baseUrl+dateStr+".txt" 
thisDate = getDate(); 
if not thisDate: 
print "Error Date!" 
return None; 
url = baseUrl+thisDate+".txt" 
return url 
def getSource(url): 
source = urllib.urlopen(url).read() 
return source def save(source,filename="domains.txt"): 
fp = open(filename,"w") 
fp.write(source) 
fp.close() 
return True; 
def loadList(fileName="domains.txt"): 
fp = open("domains.txt","r") 
source = fp.readlines() 
fp.close() 
return source; 
def getPrefix(domain): 
return domain.split('.')[0] 
def getPostfix(domain): 
return domain.split('.')[1] 
def hasMidLine(domain): 
if '-' in domain: 
return True 
else: 
return False 
def parser(domains): 
max =4 
min =0 
keyword =('sky','see','job') 
result=[] 
len_num =0; 
mid_line_num =0; 
for domain in domains: 
prefix = getPrefix(domain) 
postfix = getPostfix(domain) 
domainlen = len(prefix) 
if (domainlen < min) or (domainlen > max): 
len_num +=1 
continue 
if hasMidLine(prefix): 
mid_line_num +=1 
continue 
result.append(domain) 
print " log : \n" 
print "all: \t",len(domains) 
print "len not in [%s,%s] \t: %s"%(max,min,len_num) 
print "contain '-' :\t",mid_line_num 
print "remain:\t",len(result) 
return result; 
if __name__ == "__main__": 
url = getUrl() 
source = getSource(url) 
save(source) 
domains =loadList() 
result = parser(domains) 
save("".join(result),"result.txt") 
print("\n\n\nfinished!!")

输出文件:
domains.txt : kingnic.com 据当天释放的 域名;
result.txt    : 符合过滤条件的域名;
log输出:
all: 55500 
len not in [4,0] : 55019 
contain '-' : 32 
remain: 449 
finished!!

对 后缀、长度和有无“-”过滤,过滤条件有点少,其它以后如有需要再加。
Python 相关文章推荐
python调用cmd复制文件代码分享
Dec 27 Python
Python函数中定义参数的四种方式
Nov 30 Python
python安装以及IDE的配置教程
Apr 29 Python
深入学习Python中的装饰器使用
Jun 20 Python
Python 实现数据库(SQL)更新脚本的生成方法
Jul 09 Python
Python列表切片操作实例总结
Feb 19 Python
python区块及区块链的开发详解
Jul 03 Python
matplotlib实现显示伪彩色图像及色度条
Dec 07 Python
python数据分析工具之 matplotlib详解
Apr 09 Python
Python爬虫获取豆瓣电影并写入excel
Jul 31 Python
基于python tkinter的点名小程序功能的实例代码
Aug 22 Python
Selenium结合BeautifulSoup4编写简单的python爬虫
Nov 06 Python
python 自动提交和抓取网页
Jul 13 #Python
python self,cls,decorator的理解
Jul 13 #Python
python 解析html之BeautifulSoup
Jul 07 #Python
打印出python 当前全局变量和入口参数的所有属性
Jul 01 #Python
python 查找文件夹下所有文件 实现代码
Jul 01 #Python
python 运算符 供重载参考
Jun 11 #Python
python getopt 参数处理小示例
Jun 09 #Python
You might like
动态生成gif格式的图像要注意?
2006/10/09 PHP
php数据入库前清理 注意php intval与mysql的int取值范围不同
2010/12/12 PHP
PHP中根据IP地址判断城市实现城市切换或跳转代码
2012/09/04 PHP
PHP中怎样保持SESSION不过期 原理及方案介绍
2013/08/08 PHP
ThinkPHP表单数据智能写入create方法实例分析
2015/09/27 PHP
学习php设计模式 php实现享元模式(flyweight)
2015/12/07 PHP
PHP页面输出搜索后跳转下一页的处理方法
2016/09/30 PHP
PHP中常见的密码处理方式和建议总结
2018/10/14 PHP
Yii使用DbTarget实现日志功能的示例代码
2020/07/21 PHP
Open and Print a Word Document
2007/06/15 Javascript
Google Map Api和GOOGLE Search Api整合实现代码
2009/07/18 Javascript
JS 控制非法字符的输入代码
2009/12/04 Javascript
精选的10款用于构建良好易用性网站的jQuery插件
2011/01/23 Javascript
jquery DIV撑大让滚动条滚到最底部代码
2013/06/06 Javascript
JavaScript禁止页面操作的示例代码
2013/12/17 Javascript
JavaScript使用二分查找算法在数组中查找数据的方法
2015/04/07 Javascript
简介JavaScript中setUTCSeconds()方法的使用
2015/06/12 Javascript
基于JQuery实现仿网易邮箱全屏动感滚动插件fullPage
2015/09/20 Javascript
基于jQuery实现拖拽图标到回收站并删除功能
2015/11/25 Javascript
js实现登录与注册界面
2017/11/01 Javascript
浅谈Postman解决token传参的问题
2018/03/31 Javascript
vue+php实现的微博留言功能示例
2019/03/16 Javascript
nodejs微信开发之授权登录+获取用户信息
2019/03/17 NodeJs
layui表格数据复选框回显设置方法
2019/09/13 Javascript
vue仿ios列表左划删除
2019/09/26 Javascript
vue 遮罩层阻止默认滚动事件操作
2020/07/28 Javascript
uniapp微信小程序实现一个页面多个倒计时
2020/11/01 Javascript
[02:42]2014DOTA2国际邀请赛 三冰专访:我会打到Ti20
2014/07/13 DOTA
python3调用windows dos命令的例子
2019/08/14 Python
使用Python和百度语音识别生成视频字幕的实现
2020/04/09 Python
python 爬虫如何正确的使用cookie
2020/10/27 Python
ASICS印度官方网站:日本专业运动品牌
2020/06/20 全球购物
写一个函数返回1+2+3+…+n的值(假定结果不会超过长整型变量的范围)
2014/09/05 面试题
小学感恩教育活动总结
2014/07/07 职场文书
妇女工作先进事迹
2014/08/17 职场文书
医疗专业毕业生求职信
2014/08/28 职场文书