python爬虫爬取淘宝商品信息


Posted in Python onFebruary 23, 2018

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图:

python爬虫爬取淘宝商品信息

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python安装Imaging报错:The _imaging C module is not installed问题解决方法
Aug 22 Python
python实现根据主机名字获得所有ip地址的方法
Jun 28 Python
详解python之配置日志的几种方式
May 22 Python
Python 判断 有向图 是否有环的实例讲解
Feb 01 Python
python os用法总结
Jun 08 Python
python3爬取数据至mysql的方法
Jun 26 Python
Python requests模块实例用法
Feb 11 Python
Python实现简单层次聚类算法以及可视化
Mar 18 Python
PYTHON如何读取和写入EXCEL里面的数据
Oct 28 Python
python使用docx模块读写docx文件的方法与docx模块常用方法详解
Feb 17 Python
Python切片列表字符串如何实现切换
Aug 06 Python
Python装饰器的练习题
Nov 23 Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
You might like
php.ini修改php上传文件大小限制的方法详解
2013/06/17 PHP
WordPress中邮件的一些修改和自定义技巧
2015/12/15 PHP
PHP+redis实现的购物车单例类示例
2019/02/02 PHP
js同时按下两个方向键
2007/12/01 Javascript
Jquery中使用setInterval和setTimeout的方法
2013/04/08 Javascript
jquery foreach使用示例
2013/09/12 Javascript
javascript判断css3动画结束 css3动画结束的回调函数
2015/03/10 Javascript
JS动态修改iframe高度和宽度的方法
2015/04/01 Javascript
AngularJS上拉加载问题解决方法
2016/05/23 Javascript
javascript汉字拼音互转的简单实例
2016/10/09 Javascript
利用原生JS与jQuery实现数字线性变化的动画
2017/02/24 Javascript
jquery 获取索引值在一定范围的列表方法
2018/01/25 jQuery
jQuery中将json数据显示到页面表格的方法
2018/05/27 jQuery
video.js 实现视频只能后退不能快进的思路详解
2018/08/09 Javascript
JS前端模块化原理与实现方法详解
2020/03/17 Javascript
vue 实现超长文本截取,悬浮框提示
2020/07/29 Javascript
从零开始用webpack构建一个vue3.0项目工程的实现
2020/09/24 Javascript
[14:56]教你分分钟做大人:巫医
2014/10/30 DOTA
Python设计模式之单例模式实例
2014/04/26 Python
Python cookbook(数据结构与算法)保存最后N个元素的方法
2018/02/13 Python
对Python字符串中的换行符和制表符介绍
2018/05/03 Python
利用Anaconda简单安装scrapy框架的方法
2018/06/13 Python
Python中浅拷贝copy与深拷贝deepcopy的简单理解
2018/10/26 Python
pycharm使用matplotlib.pyplot不显示图形的解决方法
2018/10/28 Python
Python使用get_text()方法从大段html中提取文本的实例
2019/08/27 Python
HTML5实现表单自动验证功能实例代码
2017/01/11 HTML / CSS
canvas如何绘制钟表的方法
2017/12/13 HTML / CSS
HTML5在微信内置浏览器下右上角菜单的调整字体导致页面显示错乱的问题
2021/01/19 HTML / CSS
中国高端家电购物商城:顺电
2018/03/04 全球购物
德国滑雪和户外用品网上商店:XSPO
2019/10/30 全球购物
YSL圣罗兰美妆俄罗斯官网:Yves Saint Lauret RU
2020/09/23 全球购物
法学个人求职信范文
2014/01/27 职场文书
代办委托书怎样写
2014/04/08 职场文书
2015幼儿园新学期寄语
2015/02/27 职场文书
2015年外联部工作总结
2015/04/03 职场文书
Go语言怎么使用变长参数函数
2022/07/15 Golang