Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python基础教程之缩进介绍
Aug 29 Python
Python中使用Boolean操作符做真值测试实例
Jan 30 Python
python机器学习库常用汇总
Nov 15 Python
python3+mysql查询数据并通过邮件群发excel附件
Feb 24 Python
详解利用OpenCV提取图像中的矩形区域(PPT屏幕等)
Jul 01 Python
python 检查数据中是否有缺失值,删除缺失值的方式
Dec 02 Python
Python编写一个验证码图片数据标注GUI程序附源码
Dec 09 Python
Django ModelForm操作及验证方式
Mar 30 Python
使用PyQt5实现图片查看器的示例代码
Apr 21 Python
Python使用文件操作实现一个XX信息管理系统的示例
Jul 02 Python
python编写实现抽奖器
Sep 10 Python
Python collections.deque双边队列原理详解
Oct 05 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
用函数读出数据表内容放入二维数组
2006/10/09 PHP
php格式化日期实例分析
2014/11/12 PHP
php树型类实例
2014/12/05 PHP
PHP机器学习库php-ml的简单测试和使用方法
2017/07/14 PHP
php根据命令行参数生成配置文件详解
2019/03/15 PHP
jQuery 使用手册(五)
2009/09/23 Javascript
基于jQuery的简单的列表导航菜单
2011/03/02 Javascript
Javascript 面向对象编程(一) 封装
2011/08/28 Javascript
javascript 函数声明与函数表达式的区别介绍
2013/10/05 Javascript
用正则表达式替换图片地址img标签
2013/11/22 Javascript
Bootstrap popover用法详解
2016/12/22 Javascript
jQuery与js实现颜色渐变的方法
2016/12/30 Javascript
JS 60秒后重新发送验证码的实例讲解
2017/07/26 Javascript
JS一个简单的注册页面实例
2017/09/05 Javascript
深入理解React高阶组件
2017/09/28 Javascript
详解elementui之el-image-viewer(图片查看器)
2019/08/30 Javascript
详解JS预解析原理
2020/06/16 Javascript
Python之数据序列化(json、pickle、shelve)详解
2019/08/30 Python
Pytorch中的VGG实现修改最后一层FC
2020/01/15 Python
python 计算概率密度、累计分布、逆函数的例子
2020/02/25 Python
python实现Pyecharts实现动态地图(Map、Geo)
2020/03/25 Python
python解包用法详解
2021/02/17 Python
recorder.js 基于Html5录音功能的实现
2020/05/26 HTML / CSS
eDreams德国:南欧领先的在线旅游公司
2020/12/07 全球购物
简述synchronized和java.util.concurrent.locks.Lock的异同
2014/12/08 面试题
大学生涯自我鉴定
2014/01/16 职场文书
《孔子游春》教学反思
2014/02/25 职场文书
高校教师岗位职责
2014/03/18 职场文书
目标责任书范文
2014/04/14 职场文书
绿色家庭事迹材料
2014/05/01 职场文书
施工安全责任书范本
2014/07/24 职场文书
Python实现信息轰炸工具(再也不怕说不过别人了)
2021/06/11 Python
mysql的Buffer Pool存储及原理
2022/04/02 MySQL
如何优化vue打包文件过大
2022/04/13 Vue.js
openstack云计算keystone组件工作介绍
2022/04/20 Servers
JS实现页面炫酷的时钟特效示例
2022/08/14 Javascript