Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现web方式logview的方法
Aug 10 Python
Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程
Jun 14 Python
Python正则表达式完全指南
May 25 Python
python机器学习之决策树分类详解
Dec 20 Python
解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题
Oct 17 Python
Python 利用切片从列表中取出一部分使用的方法
Feb 01 Python
详解python的argpare和click模块小结
Mar 31 Python
Python3.5基础之变量、数据结构、条件和循环语句、break与continue语句实例详解
Apr 26 Python
Python 实现一个手机号码获取妹子名字的功能
Sep 25 Python
Python基础进阶之海量表情包多线程爬虫功能的实现
Dec 17 Python
使用pipenv管理python虚拟环境的全过程
Sep 25 Python
python​格式化字符串
Apr 20 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
印尼林东PWN黄金曼特宁咖啡豆:怎么冲世界上最醇厚的咖啡冲煮教程
2021/03/03 冲泡冲煮
PHP模板引擎Smarty的缓存使用总结
2014/04/24 PHP
PHP防止注入攻击实例分析
2014/11/03 PHP
JavaScript的面向对象(一)
2006/11/09 Javascript
JavaScript实现禁止后退的方法
2006/12/27 Javascript
jQuery 位置插件
2008/12/25 Javascript
function foo的原型与prototype属性解惑
2010/11/19 Javascript
JQuery插件Style定制化方法的分析与比较
2012/05/03 Javascript
如何使用jQUery获取选中radio对应的值(一句代码)
2013/06/03 Javascript
jquery获取div距离窗口和父级dv的距离示例
2013/10/10 Javascript
Javascript 按位取反运算符 (~)
2014/02/04 Javascript
JavaScript实现选择框按比例拖拉缩放的方法
2015/08/04 Javascript
详解js界面跳转与值传递
2016/11/22 Javascript
js 文字超出长度用省略号代替,鼠标悬停并以悬浮框显示实例
2016/12/06 Javascript
漂亮实用的页面loading(加载)封装代码
2017/02/03 Javascript
nodejs个人博客开发第三步 载入页面
2017/04/12 NodeJs
Vuex简单入门
2017/04/19 Javascript
Angular 2父子组件数据传递之@ViewChild获取子组件详解
2017/07/04 Javascript
基于jQuery实现手风琴菜单、层级菜单、置顶菜单、无缝滚动效果
2017/07/20 jQuery
JavaScript, select标签元素左右移动功能实现
2020/05/14 Javascript
一篇文章带你搞懂Vue虚拟Dom与diff算法
2020/08/25 Javascript
Python字符串处理之count()方法的使用
2015/05/18 Python
python中子类继承父类的__init__方法实例
2016/12/15 Python
对Python 两大环境管理神器 pyenv 和 virtualenv详解
2018/12/31 Python
利用css3-animation实现逐帧动画效果
2016/03/10 HTML / CSS
微信浏览器左上角返回按钮拦截功能
2017/11/21 HTML / CSS
英国汽车座椅和婴儿车购物网站:Uber Kids
2017/04/19 全球购物
美国顶级品牌男士大码服装店:DXL
2017/08/30 全球购物
俄罗斯化妆品和香水网上商店:Iledebeaute
2019/01/03 全球购物
橄榄树药房:OLIVEDA
2019/09/01 全球购物
J2EE是技术还是平台还是框架
2016/08/14 面试题
酒店总经理欢迎词
2014/01/08 职场文书
村长贪污检举信
2014/04/04 职场文书
Go语言并发编程 sync.Once
2021/10/16 Golang
通过Python把学姐照片做成拼图游戏
2022/02/15 Python
win10清理dns缓存
2022/04/19 数码科技