Python爬取YY评级分数并保存数据实现过程解析


Posted in Python onJune 01, 2020

前言

当需要进行大规模查询时(比如目前遇到的情形:查询某个省所有发债企业的YY评级分数),人工查询显然太过费时,那就写个爬虫吧。

由于该爬虫实在过于简单,就只简单概述下。

一、请求端

通过观察YY评级的网页信息,如下图(F12或右击进入检查,点击network—>XHR—>headers)。

红色框表明是个get请求(其实这种网页基本都是Ajax get,需要总结实际url的规律的)。

绿色框即为实际URL,通过分析该URL,其由两部分组成。前半部分为“
https://web.ratingdog.cn/v1/search?”,后半部分为黄色框内内容用“&”符号连接后的结果。黄色框内的内容,只有企业名称为变量,且为已知变量,那URL即可据此确定了。

Python爬取YY评级分数并保存数据实现过程解析

另外需注意,YY评级需要登录才可查询数据,在构建头部信息进行访问时,一定要提前登录,并在头部信息中放入登录信息和登录状态。

二、响应端

通过观察网页的响应信息(F12或右击进入检查,点击network—>XHR—>response),如下图。响应信息及其简单,我们所需要的YY评级分数安详地躺在那里,简单到一个正则表达式就可以提取出该数据。正则如下:

"msg".*?"IssuerName":"(.*?)","YYRating":"(.*?)/10","IntrinsicRating".*?"

Python爬取YY评级分数并保存数据实现过程解析

三、代码

所需数据较少,代码相对简单,就不建立函数了,直接一路到底吧。如下:

Python爬取YY评级分数并保存数据实现过程解析

运行代码后,得到结果如下。安徽省的100多条数据,就到了本地了

Python爬取YY评级分数并保存数据实现过程解析

Python爬取YY评级分数并保存数据实现过程解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现挑选出来100以内的质数
Mar 24 Python
Python中操作符重载用法分析
Apr 29 Python
Python socket套接字实现C/S模式远程命令执行功能案例
Jul 06 Python
Python get获取页面cookie代码实例
Sep 12 Python
Python爬虫常用库的安装及其环境配置
Sep 19 Python
Python 占位符的使用方法详解
Jul 10 Python
ORM Django 终端打印 SQL 语句实现解析
Aug 09 Python
Python 脚本实现淘宝准点秒杀功能
Nov 13 Python
Python configparser模块配置文件过程解析
Mar 03 Python
python pyecharts 实现一个文件绘制多张图
May 13 Python
Python工程师必考的6个经典面试题
Jun 28 Python
python 如何用terminal输入参数
May 25 Python
基于Python绘制个人足迹地图
Jun 01 #Python
python 写函数在一定条件下需要调用自身时的写法说明
Jun 01 #Python
解决python调用自己文件函数/执行函数找不到包问题
Jun 01 #Python
Python如何在循环内使用list.remove()
Jun 01 #Python
IntelliJ 中配置 Anaconda的过程图解
Jun 01 #Python
解决python中import文件夹下面py文件报错问题
Jun 01 #Python
浅谈Python中文件夹和python package包的区别
Jun 01 #Python
You might like
几种有用的变型 PHP中循环语句的用法介绍
2012/01/30 PHP
div li的多行多列 无刷新分页示例代码
2013/10/16 PHP
php采用file_get_contents代替使用curl实例
2014/11/07 PHP
php限制ip地址范围的方法
2015/03/31 PHP
PHP随手笔记整理之PHP脚本和JAVA连接mysql数据库
2015/11/25 PHP
PHP获取二维数组中某一列的值集合
2015/12/25 PHP
PHP 实现浏览记录并按日期分组
2017/05/11 PHP
php多进程模拟并发事务产生的问题小结
2018/12/07 PHP
TP5框架页面跳转样式操作示例
2020/04/05 PHP
对frameset、frame、iframe的js操作示例代码
2013/08/16 Javascript
jQuery控制TR显示隐藏的几种方法
2014/06/18 Javascript
jquery实现先淡出再折叠收起的动画效果
2015/08/07 Javascript
基于JavaScript实现生成名片、链接等二维码
2015/09/20 Javascript
JS实现常见的TAB、弹出层效果(TAB标签,斑马线,遮罩层等)
2015/10/08 Javascript
JavaScript中eval函数的问题
2016/01/31 Javascript
使用jQuery或者原生js实现鼠标滚动加载页面新数据
2016/03/06 Javascript
在JavaScript中对HTML进行反转义详解
2016/05/18 Javascript
解决webpack -p压缩打包react报语法错误的方法
2017/07/03 Javascript
浅谈对Angular中的生命周期钩子的理解
2017/07/31 Javascript
jquery根据name取得select选中的值实例(超简单)
2018/01/25 jQuery
vue实现一个炫酷的日历组件
2018/10/08 Javascript
Vue 表情包输入组件的实现代码
2019/01/21 Javascript
JS几个常用的函数和对象定义与用法示例
2020/01/15 Javascript
JS实现小米轮播图
2020/09/21 Javascript
python处理文本文件实现生成指定格式文件的方法
2014/07/31 Python
opencv与numpy的图像基本操作
2019/03/08 Python
python保存log日志,实现用log日志画图
2019/12/24 Python
Java基础知识面试要点
2016/07/29 面试题
我们在web应用开发过程中经常遇到输出某种编码的字符,如iso8859-1等,如何输出一个某种编码的字符串?
2014/03/30 面试题
《台湾的蝴蝶谷》教学反思
2014/02/20 职场文书
《大自然的语言》教学反思
2014/04/08 职场文书
门卫岗位职责说明书
2014/08/18 职场文书
校车安全责任书
2014/08/25 职场文书
教师“一帮一”结对子活动总结
2015/05/07 职场文书
中学生国庆节演讲稿2015
2015/07/30 职场文书
python 实现两个变量值进行交换的n种操作
2021/06/02 Python