python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
全面了解Python环境配置及项目建立
Jun 30 Python
python脚本爬取字体文件的实现方法
Apr 29 Python
Python 文件操作的详解及实例
Sep 18 Python
浅谈numpy数组的几种排序方式
Dec 15 Python
Python3 requests文件下载 期间显示文件信息和下载进度代码实例
Aug 16 Python
Python with关键字,上下文管理器,@contextmanager文件操作示例
Oct 17 Python
PyTorch和Keras计算模型参数的例子
Jan 02 Python
使用Tensorboard工具查看Loss损失率
Feb 15 Python
Keras设置以及获取权重的实现
Jun 19 Python
python爬取抖音视频的实例分析
Jan 19 Python
Python环境搭建过程从安装到Hello World
Feb 05 Python
python 通过使用Yolact训练数据集
Apr 06 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
php算开始时间到过期时间的相隔的天数
2011/01/12 PHP
ThinkPHP3.1基础知识快速入门
2014/06/19 PHP
调试WordPress中定时任务的相关PHP脚本示例
2015/12/10 PHP
js最简单的拖拽效果实现代码
2010/09/24 Javascript
jQuery版仿Path菜单效果
2011/12/15 Javascript
如何在Linux上安装Node.js
2016/04/01 Javascript
详谈commonjs模块与es6模块的区别
2017/10/18 Javascript
基于 D3.js 绘制动态进度条的实例详解
2018/02/26 Javascript
Vue单页及多页应用全局配置404页面实践记录
2018/05/22 Javascript
Vue的watch和computed方法的使用及区别介绍
2018/09/06 Javascript
JS使用new操作符创建对象的方法分析
2019/05/30 Javascript
Js数组扁平化实现方法代码总汇
2020/11/11 Javascript
jquery实现淡入淡出轮播图效果
2020/12/13 jQuery
[01:57]2018年度DOTA2最具潜力解说-完美盛典
2018/12/16 DOTA
python实现复制整个目录的方法
2015/05/12 Python
浅谈Python 列表字典赋值的陷阱
2019/01/20 Python
对Pytorch中nn.ModuleList 和 nn.Sequential详解
2019/08/18 Python
python线程安全及多进程多线程实现方法详解
2019/09/27 Python
Python 转换RGB颜色值的示例代码
2019/10/13 Python
tensorflow多维张量计算实例
2020/02/11 Python
Python在终端通过pip安装好包以后在Pycharm中依然无法使用的问题(三种解决方案)
2020/03/10 Python
基于PyQT实现区分左键双击和单击
2020/05/19 Python
Python判断远程服务器上Excel文件是否被人打开的方法
2020/07/13 Python
Pycharm连接gitlab实现过程图解
2020/09/01 Python
使用纯 CSS 创作一个脉动 loader效果的源码
2018/09/28 HTML / CSS
欧洲高端品牌直销店:Fashionesta
2016/08/31 全球购物
新加坡航空官方网站:Singapore Airlines
2016/10/13 全球购物
沙特阿拉伯家用电器和电子产品购物网站:Sheta and Saif
2020/04/03 全球购物
ktv好的活动方案
2014/08/15 职场文书
我与祖国共奋进演讲稿
2014/09/13 职场文书
房屋财产继承协议书范本
2014/11/03 职场文书
使用golang编写一个并发工作队列
2021/05/08 Golang
python-for x in range的用法(注意要点、细节)
2021/05/10 Python
对PyTorch中inplace字段的全面理解
2021/05/22 Python
详解Redis基本命令与使用场景
2021/06/01 Redis
Python内置的数据类型及使用方法
2022/04/13 Python