python 域名分析工具实现代码


Posted in Python onJuly 15, 2009

代码如下:

import sys, urllib 
import datetime,time 
def getDate(): 
strday=datetime.datetime.now().__str__() 
strday=strday.split()[0] 
return strday 
#url = "http://www.kingnic.com/list/2009-06-16.txt" 
def getUrl(dateStr=None): 
baseUrl ="http://www.kingnic.com/list/" 
if dateStr: 
return baseUrl+dateStr+".txt" 
thisDate = getDate(); 
if not thisDate: 
print "Error Date!" 
return None; 
url = baseUrl+thisDate+".txt" 
return url 
def getSource(url): 
source = urllib.urlopen(url).read() 
return source def save(source,filename="domains.txt"): 
fp = open(filename,"w") 
fp.write(source) 
fp.close() 
return True; 
def loadList(fileName="domains.txt"): 
fp = open("domains.txt","r") 
source = fp.readlines() 
fp.close() 
return source; 
def getPrefix(domain): 
return domain.split('.')[0] 
def getPostfix(domain): 
return domain.split('.')[1] 
def hasMidLine(domain): 
if '-' in domain: 
return True 
else: 
return False 
def parser(domains): 
max =4 
min =0 
keyword =('sky','see','job') 
result=[] 
len_num =0; 
mid_line_num =0; 
for domain in domains: 
prefix = getPrefix(domain) 
postfix = getPostfix(domain) 
domainlen = len(prefix) 
if (domainlen < min) or (domainlen > max): 
len_num +=1 
continue 
if hasMidLine(prefix): 
mid_line_num +=1 
continue 
result.append(domain) 
print " log : \n" 
print "all: \t",len(domains) 
print "len not in [%s,%s] \t: %s"%(max,min,len_num) 
print "contain '-' :\t",mid_line_num 
print "remain:\t",len(result) 
return result; 
if __name__ == "__main__": 
url = getUrl() 
source = getSource(url) 
save(source) 
domains =loadList() 
result = parser(domains) 
save("".join(result),"result.txt") 
print("\n\n\nfinished!!")

输出文件:
domains.txt : kingnic.com 据当天释放的 域名;
result.txt    : 符合过滤条件的域名;
log输出:
all: 55500 
len not in [4,0] : 55019 
contain '-' : 32 
remain: 449 
finished!!

对 后缀、长度和有无“-”过滤,过滤条件有点少,其它以后如有需要再加。
Python 相关文章推荐
Python使用CMD模块更优雅的运行脚本
May 11 Python
详解python实现线程安全的单例模式
Mar 05 Python
Python实现的json文件读取及中文乱码显示问题解决方法
Aug 06 Python
500行Python代码打造刷脸考勤系统
Jun 03 Python
Django使用 Bootstrap 样式修改书籍列表过程解析
Aug 09 Python
解决python明明pip安装成功却找不到包的问题
Aug 28 Python
django列表筛选功能的实现代码
Mar 27 Python
Python HTTP下载文件并显示下载进度条功能的实现
Apr 02 Python
DataFrame.groupby()所见的各种用法详解
Jun 14 Python
python中的测试框架
Nov 13 Python
使用python+pygame开发消消乐游戏附完整源码
Jun 10 Python
python区块链实现简版工作量证明
May 25 Python
python 自动提交和抓取网页
Jul 13 #Python
python self,cls,decorator的理解
Jul 13 #Python
python 解析html之BeautifulSoup
Jul 07 #Python
打印出python 当前全局变量和入口参数的所有属性
Jul 01 #Python
python 查找文件夹下所有文件 实现代码
Jul 01 #Python
python 运算符 供重载参考
Jun 11 #Python
python getopt 参数处理小示例
Jun 09 #Python
You might like
PHP在不同页面间传递Json数据示例代码
2013/06/08 PHP
php实现aes加密类分享
2014/02/16 PHP
php实现微信公众平台账号自定义菜单类
2015/10/11 PHP
PHP+Redis 消息队列 实现高并发下注册人数统计的实例
2018/01/29 PHP
javascript firefox 自动加载iframe 自动调整高宽示例
2013/08/27 Javascript
简单常用的幻灯片播放实现代码
2013/09/25 Javascript
jQuery插件 selectToSelect使用方法
2013/10/02 Javascript
JavaScript简单判断复选框是否选中及取出值的方法
2015/08/13 Javascript
jQuery实现ajax调用WCF服务的方法(附带demo下载)
2015/12/04 Javascript
BootStrap fileinput.js文件上传组件实例代码
2017/02/20 Javascript
js模拟支付宝密码输入框
2017/04/11 Javascript
Vue.extend构造器的详解
2017/07/17 Javascript
seajs中最常用的7个功能、配置示例
2017/10/10 Javascript
在 Angular中 使用 Lodash 的方法
2018/02/11 Javascript
Angularjs中的$apply及优化使用详解
2018/07/02 Javascript
对angularJs中controller控制器scope父子集作用域的实例讲解
2018/10/08 Javascript
node学习笔记之读写文件与开启第一个web服务器操作示例
2019/05/29 Javascript
Node.js实现简单的爬取的示例代码
2019/06/25 Javascript
对vuex中getters计算过滤操作详解
2019/11/06 Javascript
[02:27]2018DOTA2亚洲邀请赛赛前采访-OpTic
2018/04/03 DOTA
[00:14]护身甲盾
2019/03/06 DOTA
pycharm下打开、执行并调试scrapy爬虫程序的方法
2017/11/29 Python
Python实现的redis分布式锁功能示例
2018/05/29 Python
django-rest-swagger对API接口注释的方法
2019/08/29 Python
浅谈keras中自定义二分类任务评价指标metrics的方法以及代码
2020/06/11 Python
Python3爬虫中识别图形验证码的实例讲解
2020/07/30 Python
python+requests接口自动化框架的实现
2020/08/31 Python
美国专业级皮肤病和spa品质护肤品的高级零售网站:SkinCareRx
2017/02/06 全球购物
加拿大服装和鞋类零售商:Mark’s
2021/01/04 全球购物
Linux中如何用命令创建目录
2015/01/12 面试题
自我评价范文分享
2014/01/04 职场文书
商场促销活动方案
2014/02/08 职场文书
文明城市标语
2014/06/16 职场文书
党风廉正建设责任书
2015/01/29 职场文书
2015年大学宣传部工作总结
2015/05/26 职场文书
Python实现学生管理系统(面向对象版)
2021/06/24 Python