Python爬虫分析微博热搜关键词的实现代码


Posted in Python onFebruary 22, 2021

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果

Python爬虫分析微博热搜关键词的实现代码
Python爬虫分析微博热搜关键词的实现代码

到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现html转ubb代码(html2ubb)
Jul 03 Python
Python中__call__用法实例
Aug 29 Python
Python发送email的3种方法
Apr 28 Python
自动化Nginx服务器的反向代理的配置方法
Jun 28 Python
在Linux系统上通过uWSGI配置Nginx+Python环境的教程
Dec 25 Python
恢复百度云盘本地误删的文件脚本(简单方法)
Oct 21 Python
numpy排序与集合运算用法示例
Dec 15 Python
Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)
Jun 28 Python
基于Tensorflow:CPU性能分析
Feb 10 Python
利用Python脚本批量生成SQL语句
Mar 04 Python
去除python中的字符串空格的简单方法
Dec 22 Python
PyQt QMainWindow的使用示例
Mar 24 Python
anaconda升级sklearn版本的实现方法
Feb 22 #Python
详解Python 中的 defaultdict 数据类型
Feb 22 #Python
python快速安装OpenCV的步骤记录
Feb 22 #Python
Python中生成ndarray实例讲解
Feb 22 #Python
python爬虫利用代理池更换IP的方法步骤
Feb 21 #Python
Python用requests库爬取返回为空的解决办法
Feb 21 #Python
python利用proxybroker构建爬虫免费IP代理池的实现
Feb 21 #Python
You might like
CentOS 6.3下安装PHP xcache扩展模块笔记
2014/09/10 PHP
浅析Yii2中GridView常见操作
2016/04/22 PHP
PHP简单遍历对象示例
2016/09/28 PHP
短信提示使用 特效
2007/01/19 Javascript
JavaScript 学习笔记(四)
2009/12/31 Javascript
jQuery中.live()方法的用法深入解析
2013/12/30 Javascript
js 获取、清空input type=&quot;file&quot;的值示例代码
2014/02/19 Javascript
jquery插件qrcode在线生成二维码
2015/04/26 Javascript
JavaScript jQuery 中定义数组与操作及jquery数组操作
2015/12/18 Javascript
一些实用性较高的js方法
2016/04/19 Javascript
asp.net+jquery.form实现图片异步上传的方法(附jquery.form.js下载)
2016/05/05 Javascript
使用javascript做在线算法编程
2018/05/25 Javascript
原生JS实现列表内容自动向上滚动效果
2019/05/22 Javascript
在Python中使用M2Crypto模块实现AES加密的教程
2015/04/08 Python
python简单猜数游戏实例
2015/07/09 Python
使用Mixin设计模式进行Python编程的方法讲解
2016/06/21 Python
TensorFlow实现创建分类器
2018/02/06 Python
解决python报错MemoryError的问题
2018/06/26 Python
Django框架会话技术实例分析【Cookie与Session】
2019/05/24 Python
pytorch 更改预训练模型网络结构的方法
2019/08/19 Python
Django+zTree构建组织架构树的方法
2019/08/21 Python
TensorFlow加载模型时出错的解决方式
2020/02/06 Python
Python使用configparser库读取配置文件
2020/02/22 Python
Pycharm Plugins加载失败问题解决方案
2020/11/28 Python
如何在Canvas中添加事件的方法示例
2019/05/21 HTML / CSS
N:Philanthropy官网:美国洛杉矶基础款服装
2020/06/09 全球购物
高中运动会广播稿
2014/01/21 职场文书
小学三年级数学教学反思
2014/01/31 职场文书
社区母亲节活动方案
2014/03/05 职场文书
售后客服个人自我评价
2014/09/14 职场文书
后备干部推荐材料
2014/12/24 职场文书
家长给老师的感谢信
2015/01/20 职场文书
离婚纠纷代理词
2015/05/23 职场文书
python spilt()分隔字符串的实现示例
2021/05/21 Python
python开发飞机大战游戏
2021/07/15 Python
TypeScript 内置高级类型编程示例
2022/09/23 Javascript