基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
玩转python selenium鼠标键盘操作(ActionChains)
Apr 12 Python
windows下安装Python和pip终极图文教程
Mar 05 Python
pyqt5的QWebEngineView 使用模板的方法
Aug 18 Python
Python3网络爬虫中的requests高级用法详解
Jun 18 Python
Python Multiprocessing多进程 使用tqdm显示进度条的实现
Aug 13 Python
Django中提示消息messages的设置方式
Nov 15 Python
python实现大战外星人小游戏实例代码
Dec 26 Python
python 下载文件的几种方法汇总
Jan 06 Python
Python实现简繁体转换
Jun 07 Python
Python pygame实现中国象棋单机版源码
Jun 20 Python
python scrapy简单模拟登录的代码分析
Jul 21 Python
python神经网络学习 使用Keras进行回归运算
May 04 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
php使用socket调用http和smtp协议实例小结
2019/07/26 PHP
微信小程序发送订阅消息的方法(php 为例)
2019/10/30 PHP
Array, Array Constructor, for in loop, typeof, instanceOf
2011/09/13 Javascript
2014最热门的JavaScript代码高亮插件推荐
2014/11/25 Javascript
20个实用的JavaScript技巧分享
2014/11/28 Javascript
js实现div拖动动画运行轨迹效果代码分享
2015/08/27 Javascript
Jquery 全选反选实例代码
2015/11/19 Javascript
JS实现页面数据无限加载
2016/09/13 Javascript
jQuery实现别踩白块儿网页版小游戏
2017/01/18 Javascript
js的三种继承方式详解
2017/01/21 Javascript
Linux系统中利用node.js提取Word(doc/docx)及PDF文本的内容
2017/06/17 Javascript
vue使用监听实现全选反选功能
2018/07/06 Javascript
小程序实现左滑删除功能
2018/10/30 Javascript
详解在Node.js中发起HTTP请求的5种方法
2019/01/10 Javascript
PHPStorm中如何对nodejs项目进行单元测试详解
2019/02/28 NodeJs
vue+Element实现搜索关键字高亮功能
2019/05/28 Javascript
微信小程序绘制图片发送朋友圈
2019/07/25 Javascript
vue实现多个echarts根据屏幕大小变化而变化实例
2020/07/19 Javascript
Python实现豆瓣图片下载的方法
2015/05/25 Python
python生成式的send()方法(详解)
2017/05/08 Python
Python中使用Counter进行字典创建以及key数量统计的方法
2018/07/06 Python
Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】
2019/04/05 Python
一步步教你用python的scrapy编写一个爬虫
2019/04/17 Python
Python 进程操作之进程间通过队列共享数据,队列Queue简单示例
2019/10/11 Python
利用Python实现朋友圈中的九宫格图片效果
2020/09/03 Python
Html5新增标签有哪些
2017/04/13 HTML / CSS
Capitol Lighting的1800lighting.com:住宅和商业照明
2019/04/10 全球购物
党校培训思想汇报
2014/01/03 职场文书
临床护士自荐信
2014/01/31 职场文书
竞选卫生委员演讲稿
2014/04/28 职场文书
小学生植树节活动总结
2014/07/04 职场文书
2014年党的群众路线活动个人整改措施
2014/10/28 职场文书
毕业设计论文评语
2014/12/31 职场文书
企业爱心捐款倡议书
2015/04/27 职场文书
员工手册董事长致辞
2015/07/29 职场文书
JS高级程序设计之class继承重点详解
2022/07/07 Javascript