基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中操作字符串之rstrip()方法的使用
May 19 Python
详解在Python中处理异常的教程
May 24 Python
12步教你理解Python装饰器
Feb 25 Python
Django的信号机制详解
May 05 Python
使用python实现knn算法
Dec 20 Python
Python 实现两个服务器之间文件的上传方法
Feb 13 Python
python实现根据文件格式分类
Oct 31 Python
Python 面向对象之封装、继承、多态操作实例分析
Nov 21 Python
win10下python2和python3共存问题解决方法
Dec 23 Python
Python实现仿射密码的思路详解
Apr 23 Python
python 日志模块logging的使用场景及示例
Jan 04 Python
python库Tsmoothie模块数据平滑化异常点抓取
Jun 10 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
Content-type 的说明
2006/10/09 PHP
解决PHP4.0 和 PHP5.0类构造函数的兼容问题
2013/08/01 PHP
Yii 快速,安全,专业的PHP框架
2014/09/03 PHP
javascript 可以拖动的DIV(二)
2009/06/26 Javascript
js实现点击按钮后给Div图层设置随机背景颜色的方法
2015/05/06 Javascript
BootStrap智能表单demo示例详解
2016/06/13 Javascript
jQuery与JavaScript节点创建方法的对比
2016/11/18 Javascript
Nodejs 发送Post请求功能(发短信验证码例子)
2017/02/09 NodeJs
微信小程序 检查接口状态实例详解
2017/06/23 Javascript
Vue ElementUI之Form表单验证遇到的问题
2017/08/21 Javascript
jquery在启动页面时,自动加载数据的实例
2018/01/22 jQuery
JavaScript基于数组实现的栈与队列操作示例
2018/12/22 Javascript
layui内置模块layim发送图片添加加载动画的方法
2019/09/23 Javascript
Vue3 源码导读(推荐)
2019/10/14 Javascript
jQuery实现轮播图效果
2019/11/26 jQuery
Vue组件通信$attrs、$listeners实现原理解析
2020/09/03 Javascript
利用python的socket发送http(s)请求方法示例
2018/05/07 Python
对Python中class和instance以及self的用法详解
2019/06/26 Python
python爬虫的一个常见简单js反爬详解
2019/07/09 Python
详解python3中用HTMLTestRunner.py报ImportError: No module named 'StringIO'如何解决
2019/08/27 Python
python+jinja2实现接口数据批量生成工具
2019/08/28 Python
pygame实现五子棋游戏
2019/10/29 Python
Python元组 tuple的概念与基本操作详解【定义、创建、访问、计数、推导式等】
2019/10/30 Python
新秀丽拉杆箱美国官方网站:Samsonite美国
2016/07/25 全球购物
Crocs卡骆驰洞洞鞋日本官方网站:Crocs日本
2016/08/25 全球购物
Big Green Smile德国网上商店:提供各种天然产品
2018/05/23 全球购物
德国在线订购鲜花:Fleurop
2018/08/25 全球购物
俄罗斯园林植物网上商店:Garshinka
2020/07/16 全球购物
定义一结构体数组表示分数,并求两个分数相加之和
2013/06/11 面试题
初中生学习的自我评价
2013/11/14 职场文书
英文简历中的自我评价用语
2013/12/09 职场文书
物流管理专业毕业生自荐信
2014/03/04 职场文书
年终奖发放方案
2014/06/02 职场文书
学习朴航瑛老师爱岗敬业先进事迹思想汇报
2014/09/17 职场文书
查摆问题整改措施
2014/10/24 职场文书
2015年个人自我剖析材料
2014/12/29 职场文书