python抓取京东小米8手机配置信息


Posted in Python onNovember 13, 2018

本文代码是使用python抓取京东小米8手机的配置信息

首先找到小米8商品的链接:https://item.jd.com/7437788.html

然后找到其配置信息的标签,我们找到其配置信息的标签为 <div  class="Ptable"> 

python抓取京东小米8手机配置信息

然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值

python抓取京东小米8手机配置信息

下面是源代码

import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
 
 
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
 
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
 
data=DataFrame(columns=["参数","值"])   #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
 
for dl in dls:
  dts=dl.find_all("dt")
  dds=dl.find_all("dd")
  if len(dts)==len(dds):
    for i in range(len(dts)):
      f=dts[i].getText();
      p=dds[i].getText();
      data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)

这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了 

python抓取京东小米8手机配置信息

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中使用异步Socket编程性能测试
Jun 25 Python
Python闭包实现计数器的方法
May 05 Python
速记Python布尔值
Nov 09 Python
基于并发服务器几种实现方法(总结)
Dec 29 Python
python实现聚类算法原理
Feb 12 Python
对python中raw_input()和input()的用法详解
Apr 22 Python
Pandas 按索引合并数据集的方法
Nov 15 Python
详解Python字典的操作
Mar 04 Python
使用python自动追踪你的快递(物流推送邮箱)
Mar 17 Python
python实现贪吃蛇游戏源码
Mar 21 Python
python3中的logging记录日志实现过程及封装成类的操作
May 12 Python
python 下载文件的几种方法汇总
Jan 06 Python
python输入整条数据分割存入数组的方法
Nov 13 #Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 #Python
python 输入一个数n,求n个数求乘或求和的实例
Nov 13 #Python
python判断完全平方数的方法
Nov 13 #Python
python实现n个数中选出m个数的方法
Nov 13 #Python
Python使用combinations实现排列组合的方法
Nov 13 #Python
python生成n个元素的全组合方法
Nov 13 #Python
You might like
一个php生成16位随机数的代码(两种方法)
2014/09/16 PHP
jquery 简单图片导航插件jquery.imgNav.js
2010/03/17 Javascript
JS setCapture 区域外事件捕捉
2010/03/18 Javascript
扩展javascript的Date方法实现代码(prototype)
2010/11/20 Javascript
通过一段代码简单说js中的this的使用
2013/07/23 Javascript
javascript与css3动画结合使用小结
2015/03/11 Javascript
javascript实现Table间隔色以及选择高亮(和动态切换数据)的方法
2015/05/14 Javascript
JS实现网页标题随机显示名人名言的方法
2015/11/03 Javascript
学习javascript文件加载优化
2016/02/19 Javascript
jquery 判断div show的状态实例
2016/12/03 Javascript
javascript中递归的两种写法
2017/01/17 Javascript
jquery实现手机端单店铺购物车结算删除功能
2017/02/22 Javascript
详解vue服务端渲染(SSR)初探
2017/06/19 Javascript
基于easyui checkbox 的一些操作处理方法
2017/07/10 Javascript
webpack打包node.js后端项目的方法
2018/03/10 Javascript
浅谈angularJs函数的使用方法(大小写转换,拷贝,扩充对象)
2018/10/08 Javascript
JQuery Ajax跨域调用和非跨域调用问题实例分析
2019/04/16 jQuery
layUI实现三级导航菜单效果
2019/07/26 Javascript
vue keep-alive列表页缓存 详情页返回上一页不刷新,定位到之前位置
2019/11/26 Javascript
vue+element-ui JYAdmin后台管理系统模板解析
2020/07/28 Javascript
[06:04]DOTA2英雄梦之声Vol19卓尔游侠
2014/06/20 DOTA
在Linux下调试Python代码的各种方法
2015/04/17 Python
Python入门_浅谈逻辑判断与运算符
2017/05/16 Python
浅谈python中列表、字符串、字典的常用操作
2017/09/19 Python
使用Python监控文件内容变化代码实例
2018/06/04 Python
完美解决在oj中Python的循环输入问题
2018/06/25 Python
python实现复制大量文件功能
2019/08/31 Python
3种python调用其他脚本的方法
2020/01/06 Python
OpenCV读取与写入图片的实现
2020/10/13 Python
基础的CSS3弹性盒Flexbox布局使用实例
2016/04/08 HTML / CSS
html5+css3之制作header实例与更新
2020/12/21 HTML / CSS
英国最大的女士服装零售商:Bonmarché
2017/08/17 全球购物
应届生财务会计求职信
2013/11/05 职场文书
创建服务型党组织实施方案
2014/02/25 职场文书
房屋产权共有协议书范本
2014/11/03 职场文书
php访问对象中的成员的实例方法
2021/11/17 PHP