python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
wxPython事件驱动实例详解
Sep 28 Python
用Python的pandas框架操作Excel文件中的数据教程
Mar 31 Python
Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例
Aug 18 Python
人生苦短我用python python如何快速入门?
Mar 12 Python
​如何愉快地迁移到 Python 3
Apr 28 Python
Python虚拟环境的原理及使用详解
Jul 02 Python
django 微信网页授权认证api的步骤详解
Jul 30 Python
Pytorch中的variable, tensor与numpy相互转化的方法
Oct 10 Python
完美解决python针对hdfs上传和下载的问题
Jun 05 Python
python matplotlib绘制三维图的示例
Sep 24 Python
总结python 三种常见的内存泄漏场景
Nov 20 Python
详解Python模块化编程与装饰器
Jan 16 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
社区(php&&mysql)一
2006/10/09 PHP
PHP输出XML到页面的3种方法详解
2013/06/06 PHP
如何使用Gitblog和Markdown建自己的博客
2015/07/31 PHP
Yii安装与使用Excel扩展的方法
2016/07/13 PHP
Yii2针对指定url的生成及图片等的引入方法小结
2016/07/18 PHP
php实现带读写分离功能的MySQL类完整实例
2016/07/28 PHP
php实现文章置顶功能的方法
2016/10/20 PHP
IE8 chrome中table隔行换色解决办法
2010/07/09 Javascript
JS中prototype关键字的功能介绍及使用示例
2013/07/21 Javascript
div模拟选择框示例代码
2013/11/03 Javascript
基于编写jQuery的无缝滚动插件
2014/08/02 Javascript
js获取UserControl内容为拼html时提供方便
2014/11/02 Javascript
js实现非常简单的焦点图切换特效实例
2015/05/07 Javascript
node.js中express-session配置项详解
2017/05/31 Javascript
Avalonjs双向数据绑定与监听的实例代码
2017/06/23 Javascript
react实现菜单权限控制的方法
2017/12/11 Javascript
jQuery动态添加元素无法触发绑定事件的解决方法分析
2018/01/02 jQuery
vue项目如何刷新当前页面的方法
2018/05/18 Javascript
灵活使用console让js调试更简单的方法步骤
2019/04/23 Javascript
BootstrapValidator验证用户名已存在(ajax)
2019/11/08 Javascript
[02:37]TI8勇士令状不朽珍藏II视频展示
2018/06/23 DOTA
Ruby使用eventmachine为HTTP服务器添加文件下载功能
2016/04/20 Python
python3 与python2 异常处理的区别与联系
2016/06/19 Python
Numpy array数据的增、删、改、查实例
2018/06/04 Python
使用python画个小猪佩奇的示例代码
2018/06/06 Python
通过python实现windows桌面截图代码实例
2020/01/17 Python
Django 解决开发自定义抛出异常的问题
2020/05/21 Python
如何使用Python调整图像大小
2020/09/26 Python
英国家庭家具、照明和花园家具购物网站:Furniture123
2018/12/31 全球购物
Steiff台湾官网:德国金耳釦泰迪熊
2019/12/26 全球购物
亿阳信通股份有限公司C#笔试题
2016/12/06 面试题
电工工作职责范本
2014/02/22 职场文书
应急管理培训方案
2014/06/12 职场文书
领导班子四风查摆对照检查材料思想汇报
2014/10/05 职场文书
小公司融资,商业计划书的8切记
2019/07/15 职场文书
导游词之南京中山陵
2019/11/27 职场文书