python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python字典数据对象拆分的简单实现方法
Dec 05 Python
python实现二叉树的遍历
Dec 11 Python
Python2.7+pytesser实现简单验证码的识别方法
Dec 29 Python
Python入门之后再看点什么好?
Mar 05 Python
Django中url的反向查询的方法
Mar 14 Python
Python开发网站目录扫描器的实现
Feb 21 Python
Python爬虫beautifulsoup4常用的解析方法总结
Feb 25 Python
查看python安装路径及pip安装的包列表及路径
Apr 03 Python
python:按行读入,排序然后输出的方法
Jul 20 Python
python函数的作用域及关键字详解
Aug 20 Python
python在不同条件下的输入与输出
Feb 13 Python
容易被忽略的Python内置类型
Sep 03 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
php实现微信扫码自动登陆与注册功能
2016/09/22 PHP
php无限级分类实现方法分析
2016/10/19 PHP
PHP读取word文档的方法分析【基于COM组件】
2017/08/01 PHP
关于Laravel参数验证的一些疑与惑
2019/11/19 PHP
utf8的编码算法 转载
2006/12/27 Javascript
jQuery 打造动态渐变按钮 详细图文教程
2010/04/25 Javascript
javascript模拟地球旋转效果代码实例
2013/12/02 Javascript
jquery正则表达式验证(手机号、身份证号、中文名称)
2015/12/31 Javascript
详解vue渲染从后台获取的json数据
2017/07/06 Javascript
vue 封装自定义组件之tabal列表编辑单元格组件实例代码
2017/09/07 Javascript
Node.js学习教程之HTTP/2服务器推送【译】
2017/10/31 Javascript
JS如何把字符串转换成json
2020/02/21 Javascript
使用Typescript开发微信小程序的步骤详解
2021/01/12 Javascript
[01:45]绝对公平!DOTA2队长征召模式详解
2014/04/25 DOTA
基于scrapy实现的简单蜘蛛采集程序
2015/04/17 Python
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
2017/02/14 Python
教大家玩转Python字符串处理的七种技巧
2017/03/31 Python
Python实现PS图像明亮度调整效果示例
2018/01/23 Python
tensorflow训练中出现nan问题的解决
2018/02/10 Python
用python实现k近邻算法的示例代码
2018/09/06 Python
python中元组的用法整理
2020/06/15 Python
整理HTML5移动端开发的常用触摸事件
2016/04/15 HTML / CSS
SportsDirect.com新加坡:英国第一体育零售商
2019/03/30 全球购物
英国自行车商店:AW Cycles
2021/02/24 全球购物
Ajax的优点和缺点
2014/11/21 面试题
Delphi工程师笔试题
2013/09/21 面试题
初婚初育证明
2014/01/14 职场文书
求职信需要的五点内容
2014/02/01 职场文书
荷叶圆圆教学反思
2014/02/01 职场文书
一份教室追逐打闹的检讨书
2014/09/27 职场文书
群众路线教育实践活动民主生活会个人检查对照思想汇报
2014/10/04 职场文书
2014年社区综治工作总结
2014/11/17 职场文书
优秀共产党员事迹材料2016
2016/02/29 职场文书
MySQL 8.0 Online DDL快速加列的相关总结
2021/06/02 MySQL
python实现A*寻路算法
2021/06/13 Python
windows server2012 R2下安装PaddleOCR服务的的详细步骤
2022/09/23 Servers