Python网络爬虫信息提取mooc代码实例


Posted in Python onMarch 06, 2020

实例一--爬取页面

import requests
url="https//itemjd.com/2646846.html"
try:
 r=requests.get(url)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[:1000])
except:
 print("爬取失败")

正常页面爬取

实例二--爬取页面

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
 kv={'user-agent':'Mozilla/5.0'}
 r=requests.get(url,headers=kv)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[1000:2000])
except:
 print("爬取失败")

对访问用户名有限制,模拟浏览器对网站请求

实例三--爬取搜索引擎

#百度的关键词接口:http://www.baidu.com/s?wd=keyword
#360的关键词接口:http://www.so.com/s?q=keyword
import requests
keyword="python"
try:
 kv={'wd':keyword}
 r=requests.get("http://www.baidu.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失败")
--------------------------------------------------
import requests
keyword="python"
try:
 kv={'q':keyword}
 r=requests.get("http://www.so.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失败")

实例四--:爬取图片

import requests
import os
url="http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg"
root="F://pics//"
path=root+url.split('/')[-1]
try:
 if not os.path.exists(root):
  os.mkdir(root)
 if not os.path.exists(path):
  r=requests.get(url)
  with open(path,'wb') as f:
   f.write(r.content)
   f.close()
   print("文件保存成功")
 else:
  print("文件已经存在")
except:
 print("爬取失败")

爬取并保存图片

实例五--IP地址归属地查询:

http://m.ip138.com/ip.asp?ip=ipaddress

url="http://www.ip138.com/iplookup.asp?ip="
try:
 r=requests.get(url+'202.204.80.112'+'&action=2')
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[-500:])
except:
 print("爬取失败")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 异常处理实例详解
Mar 12 Python
Python 转义字符详细介绍
Mar 21 Python
python编写分类决策树的代码
Dec 21 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 Python
pandas 实现将重复表格去重,并重新转换为表格的方法
Apr 18 Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 Python
Python字符串对象实现原理详解
Jul 01 Python
django 实现将本地图片存入数据库,并能显示在web上的示例
Aug 07 Python
python 3.7.4 安装 opencv的教程
Oct 10 Python
Python3 集合set入门基础
Feb 10 Python
Python OpenCV读取显示视频的方法示例
Feb 20 Python
浅谈Python里面None True False之间的区别
Jul 09 Python
appium+python adb常用命令分享
Mar 06 #Python
Python+appium框架原生代码实现App自动化测试详解
Mar 06 #Python
python使用paramiko实现ssh的功能详解
Mar 06 #Python
python GUI库图形界面开发之PyQt5滚动条控件QScrollBar详细使用方法与实例
Mar 06 #Python
Python object类中的特殊方法代码讲解
Mar 06 #Python
python+Selenium自动化测试——输入,点击操作
Mar 06 #Python
使用 Python ssh 远程登陆服务器的最佳方案
Mar 06 #Python
You might like
PHPEXCEL 使用小记
2013/01/06 PHP
PHP书写格式详解(必看)
2016/05/23 PHP
PHP检查网站是否宕机的方法示例
2017/07/24 PHP
jquery 倒计时效果实现秒杀思路
2013/09/11 Javascript
jquery parent和parents的区别分析
2013/10/02 Javascript
兼容FF和IE的动态table示例自写
2013/10/21 Javascript
JS关闭窗口或JS关闭页面的几种代码分享
2013/10/25 Javascript
js获取当前月的第一天和最后一天的小例子
2013/11/18 Javascript
js自定义鼠标右键的实现原理及源码
2014/06/23 Javascript
javascript定时器完整实例
2015/02/10 Javascript
基于insertBefore制作简单的循环插空效果
2015/09/21 Javascript
js面向对象之常见创建对象的几种方式(工厂模式、构造函数模式、原型模式)
2015/11/09 Javascript
详解javascript函数的参数
2015/11/10 Javascript
js判断手机浏览器操作系统和微信浏览器的方法
2016/04/30 Javascript
jquery拖动改变div大小
2017/07/04 jQuery
Koa项目搭建过程详细记录
2018/04/12 Javascript
深入理解Vue nextTick 机制
2018/04/28 Javascript
js核心基础之闭包的应用实例分析
2019/05/11 Javascript
微信小程序自定义可滑动顶部TabBar选项卡实现页面切换功能示例
2019/05/14 Javascript
微信小程序实现搜索历史功能
2020/03/26 Javascript
vue 地区选择器v-distpicker的常用功能
2019/07/23 Javascript
纯js实现无缝滚动功能代码实例
2020/02/21 Javascript
[04:49]期待西雅图之战 2016国际邀请赛中国区预选赛WINGS战队赛后采访
2016/06/29 DOTA
Python yield 小结和实例
2014/04/25 Python
python的random模块及加权随机算法的python实现方法
2017/01/04 Python
python定时关机小脚本
2018/06/20 Python
Pandas 按索引合并数据集的方法
2018/11/15 Python
Python3.7 dataclass使用指南小结
2019/02/22 Python
python操作小程序云数据库实现简单的增删改查功能
2019/06/06 Python
PyTorch的深度学习入门教程之构建神经网络
2019/06/27 Python
使用Pycharm分段执行代码
2020/04/15 Python
涂鸦板简单实现 Html5编写属于自己的画画板
2016/07/05 HTML / CSS
舒适的豪华鞋:Taryn Rose
2018/05/03 全球购物
美国在线鞋类零售商:LifeStride
2019/06/09 全球购物
青年文明号申报材料
2014/12/23 职场文书
自主招生专家推荐信
2015/03/26 职场文书