利用node.js写一个爬取知乎妹纸图的小爬虫


Posted in Javascript onMay 03, 2017

前言

说起写node爬虫的原因,真是羞羞呀。一天,和往常一样,晚上吃过饭便刷起知乎来,首页便是推荐的你见过最漂亮的女生长什么样?,点进去各种漂亮的妹纸爆照啊!!!,看的我好想把这些好看的妹纸照片都存下来啊!一张张点击保存,就在第18张得时候,突然想起。我特么不是程序员么,这种手动草做的事,怎么能做,不行我不能丢程序员的脸了,于是便开始这次爬虫之旅。

原理

初入爬虫的坑,没有太多深奥的理论知识,要获取知乎上帖子中的一张图片,我把它归结为以下几步。

  • 准备一个url(当然是诸如你见过最漂亮的女生长什么样??)
  • 获取这个url的html内容,并分析其中的dom结构,遍历找到这些漂亮的妹纸图片url
  • 获取图片内容
  • 将图片内容写入本地文件

开始动手

大概知道原理之后我们就可以开干了

准备一个url

这个最简单了,去知乎随便一搜就是一大把,我们以

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者使用node.js能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
jquery.cookie.js 操作cookie实现记住密码功能的实现代码
Apr 27 Javascript
如何通过javascript操作web控件的自定义属性
Nov 25 Javascript
JS 在指定数组中随机取出N个不重复的数据
Jun 10 Javascript
jQuery 1.9.1源码分析系列(十五)之动画处理
Dec 03 Javascript
Winform客户端向web地址传参接收参数的方法
May 17 Javascript
URL的参数中有加号传值变为空格的问题(URL特殊字符)
Nov 04 Javascript
AngularJS实现用户登录状态判断的方法(Model添加拦截过滤器,路由增加限制)
Dec 12 Javascript
Express框架之connect-flash详解
May 31 Javascript
深究AngularJS如何获取input的焦点(自定义指令)
Jun 12 Javascript
vue-cli2.0转3.0之项目搭建的详细步骤
Dec 11 Javascript
iview form清除校验状态的实现
Sep 19 Javascript
Element Input输入框的使用方法
Jul 26 Javascript
Vue实现双向数据绑定
May 03 #Javascript
Angular 4.x 路由快速入门学习
May 03 #Javascript
javaScript 逻辑运算符使用技巧整理
May 03 #Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
May 03 #Javascript
vue的Virtual Dom实现snabbdom解密
May 03 #Javascript
JavaScript中undefined和null的区别
May 03 #Javascript
Node.js对MongoDB数据库实现模糊查询的方法
May 03 #Javascript
You might like
PHP中将数组转成XML格式的实现代码
2011/08/08 PHP
无刷新动态加载数据 滚动条加载适合评论等页面
2013/10/16 PHP
PDO防注入原理分析以及使用PDO的注意事项总结
2014/10/23 PHP
PHP安全上传图片的方法
2015/03/21 PHP
Mootools 1.2教程 同时进行多个形变动画
2009/09/15 Javascript
jquery checkbox全选、取消全选实现代码
2010/03/05 Javascript
JQuery 动态扩展对象之另类视角
2010/05/25 Javascript
js中substr,substring,indexOf,lastIndexOf的用法小结
2013/12/27 Javascript
js在输入框屏蔽按键,只能键入数字的示例代码
2014/01/03 Javascript
jQuery设置与获取HTML,文本和值的简单实例
2014/02/26 Javascript
原生js的弹出层且其内的窗口居中
2014/05/14 Javascript
使用AngularJS创建单页应用的编程指引
2015/06/19 Javascript
JS实现兼容性好,自动置顶的淘宝悬浮工具栏效果
2015/09/18 Javascript
JS实现IE状态栏文字缩放效果代码
2015/10/24 Javascript
图片上传之FileAPI与NodeJs
2017/01/24 NodeJs
js实现日历与定时器
2017/02/22 Javascript
jQuery基于Ajax实现读取XML数据功能示例
2018/05/31 jQuery
微信小程序自定义底部弹出框
2020/11/16 Javascript
Vue 用Vant实现时间选择器的示例代码
2019/10/25 Javascript
JavaScript文档加载模式以及元素获取
2020/07/28 Javascript
如何用Python做一个微信机器人自动拉群
2019/07/03 Python
Python实现串口通信(pyserial)过程解析
2019/09/25 Python
Keras使用tensorboard显示训练过程的实例
2020/02/15 Python
详解python命令提示符窗口下如何运行python脚本
2020/09/11 Python
python中操作文件的模块的方法总结
2021/02/04 Python
玖熙女鞋美国官网:Nine West
2016/10/06 全球购物
美国网上眼镜供应商:LEOTONY(眼镜、RX太阳镜和太阳镜)
2017/10/31 全球购物
C语言如何决定使用那种整数类型
2016/11/26 面试题
自荐信格式的六要素
2013/09/21 职场文书
拉丁舞学习者的自我评价
2013/10/27 职场文书
办公室主任主任岗位责任制
2014/02/11 职场文书
手机银行营销方案
2014/03/14 职场文书
车间核算员岗位职责
2014/07/01 职场文书
2014年工商所工作总结
2014/12/09 职场文书
公司清洁工岗位职责
2015/04/15 职场文书
python 实现定时任务的四种方式
2021/04/01 Python