python 爬虫爬取京东ps4售卖情况


Posted in Python onDecember 18, 2020

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : HtmlParser.py
# @Author: 赵路仓
# @Date : 2020/3/17
# @Desc :
# @Contact : 398333404@qq.com
import json

from lxml import etree
import requests
from bs4 import BeautifulSoup


url="https://search.jd.com/Search?keyword=ps4&enc=utf-8&wq=ps4&pvid=cf0158c8664442799c1146a461478c9c"
head={
 'authority': 'search.jd.com',
 'method': 'GET',
 'path': '/s_new.php?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=4&s=84&scrolling=y&log_id=1529828108.22071&tpl=3_M&show_items=7651927,7367120,7056868,7419252,6001239,5934182,4554969,3893501,7421462,6577495,26480543553,7345757,4483120,6176077,6932795,7336429,5963066,5283387,25722468892,7425622,4768461',
 'scheme': 'https',
 'referer': 'https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&cid2=653&cid3=655&page=3&s=58&click=0',
 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
 'x-requested-with': 'XMLHttpRequest',
}

def page(page):
 print("开始")
 url = "https://search.jd.com/Search?keyword=ps4&enc=utf-8&qrst=1&rt=1&stop=1&vt=1&wq=ps4&page="+page+"&s=181&click=0"
 r=requests.get(url,timeout=3,headers=head)
 r.encoding=r.apparent_encoding
 # print(r.text)
 b=BeautifulSoup(r.text,"html.parser")
 #print(b.prettify())
 _element = etree.HTML(r.text)
 datas = _element.xpath('//li[contains(@class,"gl-item")]')
 print(datas)
 for data in datas:
  p_price = data.xpath('div/div[@class="p-price"]/strong/i/text()')
  p_comment = data.xpath('div/div[5]/strong/a/text()')
  p_name = data.xpath('div/div[@class="p-name p-name-type-2"]/a/em/text()')
  p_href = data.xpath('div/div[@class="p-name p-name-type-2"]/a/@href')
  comment=' '.join(p_comment)
  name = ' '.join(p_name)
  price = ' '.join(p_price)
  href = ' '.join(p_href)
  print(name,price,p_comment,href)

if __name__=="__main__":
 page("5")

爬取结果

python 爬虫爬取京东ps4售卖情况

以上就是python 爬虫爬取某东ps4售卖情况的详细内容,更多关于python 爬虫的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python2.5/2.6实用教程 入门基础篇
Nov 29 Python
Python中的多行注释文档编写风格汇总
Jun 16 Python
Python使用sftp实现上传和下载功能(实例代码)
Mar 14 Python
Django实战之用户认证(初始配置)
Jul 16 Python
python如何求解两数的最大公约数
Sep 27 Python
Python 批量刷博客园访问量脚本过程解析
Aug 30 Python
Python对接 xray 和微信实现自动告警
Sep 17 Python
给你一面国旗 教你用python画中国国旗
Sep 24 Python
python中有关时间日期格式转换问题
Dec 25 Python
tensorflow之变量初始化(tf.Variable)使用详解
Feb 06 Python
Python logging模块原理解析及应用
Aug 13 Python
python 解决Windows平台上路径有空格的问题
Nov 10 Python
python实现视频压缩功能
Dec 18 #Python
MoviePy常用剪辑类及Python视频剪辑自动化
Dec 18 #Python
python 实现全球IP归属地查询工具
Dec 18 #Python
MoviePy简介及Python视频剪辑自动化
Dec 18 #Python
Python非单向递归函数如何返回全部结果
Dec 18 #Python
python复合条件下的字典排序
Dec 18 #Python
python 监控服务器是否有人远程登录(详细思路+代码)
Dec 18 #Python
You might like
php采用curl访问域名返回405 method not allowed提示的解决方法
2014/06/26 PHP
PHP实现的DES加密解密类定义与用法示例
2020/11/02 PHP
初识javascript 文档碎片
2010/07/13 Javascript
JQuery开发的数独游戏代码
2010/10/29 Javascript
如何用ajax来创建一个XMLHttpRequest对象
2012/12/10 Javascript
javascript实现继承的简单实例
2015/07/26 Javascript
jquery实现加载进度条提示效果
2015/11/23 Javascript
三种Node.js写文件的方式
2016/03/08 Javascript
jQuery为动态生成的select元素添加事件的方法
2016/08/29 Javascript
nodejs body-parser 解析post数据实例
2017/07/26 NodeJs
vscode中vue-cli项目es-lint的配置方法
2018/07/30 Javascript
Canvas实现微信红包照片效果
2018/08/21 Javascript
浅谈webpack4 图片处理汇总
2018/09/12 Javascript
Vuex 使用 v-model 配合 state的方法
2018/11/13 Javascript
JQuery获取元素尺寸、位置及页面滚动事件应用示例
2019/05/14 jQuery
解决vue更新路由router-view复用组件内容不刷新的问题
2019/11/04 Javascript
Python语言的面相对象编程方式初步学习
2016/03/12 Python
Python实现二维有序数组查找的方法
2016/04/27 Python
Python中的pygal安装和绘制直方图代码分享
2017/12/08 Python
django js实现部分页面刷新的示例代码
2018/05/28 Python
对python3中pathlib库的Path类的使用详解
2018/10/14 Python
python中时间模块的基本使用教程
2019/05/14 Python
解决pycharm运行程序出现卡住scanning files to index索引的问题
2019/06/27 Python
python SVM 线性分类模型的实现
2019/07/19 Python
python 并发编程 阻塞IO模型原理解析
2019/08/20 Python
Pycharm及python安装详细步骤及PyCharm配置整理(推荐)
2020/07/31 Python
Python pysnmp使用方法及代码实例
2020/08/24 Python
Python通过format函数格式化显示值
2020/10/17 Python
Python的logging模块基本用法
2020/12/24 Python
财务人员个人自荐信范文
2013/09/26 职场文书
实习单位接收函
2014/01/11 职场文书
某某同志考察材料
2014/05/28 职场文书
劳动保障个人工作总结
2015/03/04 职场文书
党员志愿者服务倡议书
2015/04/29 职场文书
祝福语集锦:给百岁老人祝寿贺词
2019/11/19 职场文书
解决WINDOWS电脑开机后桌面没有任何图标
2022/04/09 数码科技