python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
关于你不想知道的所有Python3 unicode特性
Nov 28 Python
python中字符串前面加r的作用
Jun 04 Python
利用PyInstaller将python程序.py转为.exe的方法详解
May 03 Python
python同时遍历数组的索引和值的实例
Nov 15 Python
神经网络相关之基础概念的讲解
Dec 29 Python
Centos部署django服务nginx+uwsgi的方法
Jan 02 Python
Python转换时间的图文方法
Jul 01 Python
python调用接口的4种方式代码实例
Nov 19 Python
使用python实现数组、链表、队列、栈的方法
Dec 20 Python
pandas-resample按时间聚合实例
Dec 27 Python
python数据分析工具之 matplotlib详解
Apr 09 Python
python 如何快速复制序列
Sep 07 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
Php中文件下载功能实现超详细流程分析
2012/06/13 PHP
php数组添加与删除单元的常用函数实例分析
2015/02/16 PHP
php验证码实现代码(3种)
2015/09/07 PHP
PHP的PDO常用类库实例分析
2016/04/07 PHP
Yii2处理密码加密及验证的方法
2019/05/12 PHP
用js实现的仿sohu博客更换页面风格(简单版)
2007/03/22 Javascript
Jquery幻灯片特效代码分享--打开页面随机选择切换方式(3)
2015/08/15 Javascript
js仿黑客帝国字母掉落效果代码分享
2020/11/08 Javascript
jQuery弹簧插件编写基础之“又见弹窗”
2015/12/11 Javascript
Chrome不支持showModalDialog模态对话框和无法返回returnValue问题的解决方法
2016/10/30 Javascript
jQuery插件WebUploader实现文件上传
2016/11/07 Javascript
jquery日历插件e-calendar升级版
2016/11/10 Javascript
RequireJS 依赖关系的实例(推荐)
2017/01/21 Javascript
JavaScript实现的鼠标响应颜色渐变效果完整实例
2017/02/18 Javascript
详解Angular2 关于*ngFor 嵌套循环
2017/05/22 Javascript
原生JS封装animate运动框架的实例
2017/10/12 Javascript
浅谈JS 数字和字符串之间相互转化的纠纷
2017/10/20 Javascript
JS实现倒序输出的几种常用方法示例
2019/04/13 Javascript
js函数和this用法实例分析
2020/03/13 Javascript
Vue路由的模块自动化与统一加载实现
2020/06/05 Javascript
echarts浮动显示单位的实现方法示例
2020/12/04 Javascript
python通过zlib实现压缩与解压字符串的方法
2014/11/19 Python
Python实现读取文件最后n行的方法
2017/02/23 Python
实例讲解python中的协程
2018/10/08 Python
解决sublime+python3无法输出中文的问题
2018/12/12 Python
Python基于爬虫实现全网搜索并下载音乐
2021/02/14 Python
美术专业学生个人自我评价
2013/09/19 职场文书
运动会通讯稿50字
2014/01/30 职场文书
会计求职信
2014/05/29 职场文书
商务英语专业大学生职业生涯规划书
2014/09/14 职场文书
大学生入党积极分子自我评价
2014/09/20 职场文书
个人向公司借款协议书
2014/10/09 职场文书
党性分析材料格式
2014/12/19 职场文书
工艺技术员岗位职责
2015/02/04 职场文书
IDEA使用SpringAssistant插件创建SpringCloud项目
2021/06/23 Java/Android
JavaScript设计模式之原型模式详情
2022/06/21 Javascript