Python爬虫爬取博客实现可视化过程解析


Posted in Python onJune 29, 2020

源码:

from pyecharts import Bar
import re
import requests
num=0
b=[]
for i in range(1,11):
  link='https://www.cnblogs.com/echoDetected/default.html?page='+str(i)
  headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
  r=requests.get(link,headers=headers)
  html=r.text
  post=re.findall('<span class="post-view-count">(.*?)</span>',html)
for i in post:
    i = i.replace("阅读(", "")
    i = i.replace(")","")
    b.append(i)
    num=num+1
columns=[]
for i in range(1,num+1):
#设置行名
  columns.append('博客'+str(i))
#设置数据
#设置柱状图的主标题与副标题
bar = Bar("柱状图", "每个博客阅读数量")
#添加柱状图的数据及配置项,先行后列
bar.add("阅读量", columns, b, mark_line=["average"], mark_point=["max", "min"])
#生成本地文件(默认为.html文件)
bar.render()

爬虫不是重点,只是拿来爬阅读数量,pyecharts是重点

这次爬的是我自己的博客,一共10页,每页10片文章,正好写了100篇博客

pyecharts安装:

pip install wheelpip install pyecharts==0.1.9.4

直接pip install pyecharts会下载最新版无法调用

注意点:pyecharts调用,貌似无法实现多个py文件一起调用(意思是编写时不能在多个文件里出现import语句)

步骤解释:

1.爬虫爬取阅读数

2.去除非法字符装入新的数组

3.设置横轴数据,生成柱状图

4.在当前目录下生成render.html,打开查看柱状图

结果:

Python爬虫爬取博客实现可视化过程解析

柱状图是动态的,不是静态的

Python爬虫爬取博客实现可视化过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python函数参数*args**kwargs用法实例
Dec 04 Python
python类参数self使用示例
Feb 17 Python
Python使用代理抓取网站图片(多线程)
Mar 14 Python
Python实现在线音乐播放器
Mar 03 Python
Python Web程序部署到Ubuntu服务器上的方法
Feb 22 Python
Python3中的列表生成式、生成器与迭代器实例详解
Jun 11 Python
解决PyCharm import torch包失败的问题
Oct 13 Python
在python中只选取列表中某一纵列的方法
Nov 28 Python
pyinstaller 3.6版本通过pip安装失败的解决办法(推荐)
Jan 18 Python
django中嵌套的try-except实例
May 21 Python
Python如何实现自带HTTP文件传输服务
Jul 08 Python
python批量更改目录名/文件名的方法
Apr 18 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
Jun 29 #Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 #Python
如何使用python记录室友的抖音在线时间
Jun 29 #Python
Python sublime安装及配置过程详解
Jun 29 #Python
keras K.function获取某层的输出操作
Jun 29 #Python
Python pytesseract验证码识别库用法解析
Jun 29 #Python
用Python开发app后端有优势吗
Jun 29 #Python
You might like
15个小时----从修改程序到自己些程序
2006/10/09 PHP
PHP has encountered an Access Violation at 7C94BD02解决方法
2009/08/24 PHP
删除无限分类并同时删除它下面的所有子分类的方法
2010/08/08 PHP
php制作文本式留言板
2015/03/18 PHP
vmware linux系统安装最新的php7图解
2019/04/14 PHP
thinkphp框架实现路由重定义简化url访问地址的方法分析
2020/04/04 PHP
location.search在客户端获取Url参数的方法
2010/06/08 Javascript
基于jquery实现的类似百度搜索的输入框自动完成功能
2011/08/23 Javascript
js 获取屏幕各种宽高的方法(浏览器兼容)
2013/05/15 Javascript
jQuery中的jQuery()方法用法分析
2014/12/27 Javascript
jQuery实现放大镜效果实例代码
2016/03/17 Javascript
基于javascript实现图片滑动效果
2016/05/07 Javascript
JavaScript仿淘宝页面图片滚动加载及刷新回顶部的方法解析
2016/05/24 Javascript
jQuery EasyUI编辑DataGrid用combobox实现多级联动
2016/08/29 Javascript
jquery实现一个全局计时器(商城可用)
2017/06/30 jQuery
[01:05:00]2018国际邀请赛 表演赛 Pain vs OpenAI
2018/08/24 DOTA
利用python实现命令行有道词典的方法示例
2017/01/31 Python
python使用生成器实现可迭代对象
2018/03/20 Python
详解Python 装饰器执行顺序迷思
2018/08/08 Python
对Python 获取类的成员变量及临时变量的方法详解
2019/01/22 Python
Django框架首页和登录页分离操作示例
2019/05/28 Python
Python递归函数 二分查找算法实现解析
2019/08/12 Python
django认证系统实现自定义权限管理的方法
2019/08/28 Python
印度购买眼镜和太阳镜网站:Coolwinks
2018/09/26 全球购物
中药专业毕业自荐书范文
2014/02/08 职场文书
2014年创先争优活动总结
2014/05/04 职场文书
庆七一宣传标语
2014/10/08 职场文书
2014年库房工作总结
2014/11/26 职场文书
元宵节寄语大全
2015/02/27 职场文书
社区法制宣传日活动总结
2015/05/05 职场文书
文艺演出主持词
2015/07/01 职场文书
2019入党申请书格式和范文
2019/06/25 职场文书
CSS3 菱形拼图实现只旋转div 背景图片不旋转功能
2021/03/30 HTML / CSS
Html5同时支持多端sdk的小技巧
2021/11/17 HTML / CSS
Python中的matplotlib绘制百分比堆叠柱状图,并为每一个类别设置不同的填充图案
2022/04/20 Python
Nginx配置之禁止指定IP访问
2022/05/02 Servers