编程 Python

python爬取网易云音乐热歌榜实例代码

Posted in Python onAugust 07, 2020

首先找到要下载的歌曲排行榜的链接，这里用的是：

https://music.163.com/discover/toplist?id=3778678

然后更改你要保存的目录，目录要先建立好文件夹，例如我的是保存在D盘-360下载-网易云热歌榜文件夹内，就可以完成下载。

如果文件夹没有提前建好，会报错[Errno 2] No such file or directory。

代码实现：

from urllib import request
from bs4 import BeautifulSoup
import re
import requests
import time


class Music(object):
  def __init__(self, baseurl, path):
    head = {
      "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36"
      }
    self.baseurl = baseurl
    self.headers = head
    self.path = path


  def main(self):
    html = self.askurl()
    bs4 = self.analysis(html)
    name1 = self.matching(bs4)
    self.save(name1)


  def askurl(self):
    req = request.Request(url=self.baseurl, headers=self.headers)
    response = request.urlopen(req)
    html = response.read().decode("utf-8")
    return html


  def analysis(self, html):
    soup = BeautifulSoup(html, "html.parser")
    bs4 = soup.find_all("textarea")
    bs4 = str(bs4)
    return bs4


  def matching(self, bs4):
  	rule0 = re.compile(r'"name":"(.*?)","tns":[],"alias":[]')
    name0 = re.findall(rule0, bs4)
    str = ""
    for i in name0:
      str = str + "," + i
    str = str.replace("\xa0", " ")
    rule1 = re.compile(r'jpg,(.*?),(.*?)","id":(\d*)')
    name1 = re.findall(rule1, str)
    return name1


  def save(self, name1):
    for j in name1:
      print("正在下载：" + j[1] + " - " + j[0] + "...")
      url = "http://music.163.com/song/media/outer/url?id=" + j[2]
      content = requests.get(url=url, headers=self.headers).content
      with open(self.path + j[1] + " - " + j[0] + ".mp3", "wb") as f:
        f.write(content)
      print(j[1] + " - " + j[0] + "下载完毕。\n")
      time.sleep(0.5)
    return


if __name__ == "__main__":
  baseurl = "https://music.163.com/discover/toplist?id=3778678" # 要爬取的热歌榜链接
  path = "D:/360下载/网易云热歌榜/" # 保存的文件目录
  demo0 = Music(baseurl, path)
  demo0.main()
  print("下载完毕")

内容扩展：

Python3实战之爬虫抓取网易云音乐的热门评论

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re
import urllib.request
import urllib.error
import urllib.parse
import json



def get_all_hotSong(): #获取热歌榜所有歌曲名称和id
 url='http://music.163.com/discover/toplist?id=3778678' #网易云云音乐热歌榜url
 html=urllib.request.urlopen(url).read().decode('utf8') #打开url
 html=str(html) #转换成str
 pat1=r'<ul class="f-hide"><li><a href="/song\?id=\d*?" rel="external nofollow" rel="external nofollow" >.*</a></li></ul>' #进行第一次筛选的正则表达式
 result=re.compile(pat1).findall(html) #用正则表达式进行筛选
 result=result[0] #获取tuple的第一个元素

 pat2=r'<li><a href="/song\?id=\d*?" rel="external nofollow" rel="external nofollow" >(.*?)</a></li>' #进行歌名筛选的正则表达式
 pat3=r'<li><a href="/song\?id=(\d*?)" rel="external nofollow" >.*?</a></li>' #进行歌ID筛选的正则表达式
 hot_song_name=re.compile(pat2).findall(result) #获取所有热门歌曲名称
 hot_song_id=re.compile(pat3).findall(result) #获取所有热门歌曲对应的Id

 return hot_song_name,hot_song_id

def get_hotComments(hot_song_name,hot_song_id):
 url='http://music.163.com/weapi/v1/resource/comments/R_SO_4_' + hot_song_id + '?csrf_token=' #歌评url
 header={ #请求头部
 'User-Agent':'Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}
 #post请求表单数据
 data={'params':'zC7fzWBKxxsm6TZ3PiRjd056g9iGHtbtc8vjTpBXshKIboaPnUyAXKze+KNi9QiEz/IieyRnZfNztp7yvTFyBXOlVQP/JdYNZw2+GRQDg7grOR2ZjroqoOU2z0TNhy+qDHKSV8ZXOnxUF93w3DA51ADDQHB0IngL+v6N8KthdVZeZBe0d3EsUFS8ZJltNRUJ','encSecKey':'4801507e42c326dfc6b50539395a4fe417594f7cf122cf3d061d1447372ba3aa804541a8ae3b3811c081eb0f2b71827850af59af411a10a1795f7a16a5189d163bc9f67b3d1907f5e6fac652f7ef66e5a1f12d6949be851fcf4f39a0c2379580a040dc53b306d5c807bf313cc0e8f39bf7d35de691c497cda1d436b808549acc'}
 postdata=urllib.parse.urlencode(data).encode('utf8') #进行编码
 request=urllib.request.Request(url,headers=header,data=postdata)
 reponse=urllib.request.urlopen(request).read().decode('utf8')
 json_dict=json.loads(reponse) #获取json
 hot_commit=json_dict['hotComments'] #获取json中的热门评论


 num=0
 fhandle=open('./song_comments','a') #写入文件
 fhandle.write(hot_song_name+':'+'\n')

 for item in hot_commit:
 num+=1
 fhandle.write(str(num)+'.'+item['content']+'\n')
 fhandle.write('\n==============================================\n\n')
 fhandle.close()




hot_song_name,hot_song_id=get_all_hotSong() #获取热歌榜所有歌曲名称和id

num=0
while num < len(hot_song_name): #保存所有热歌榜中的热评
 print('正在抓取第%d首歌曲热评...'%(num+1))
 get_hotComments(hot_song_name[num],hot_song_id[num])
 print('第%d首歌曲热评抓取成功'%(num+1))
 num+=1

以上就是python爬取网易云音乐热歌榜实例代码的详细内容，更多关于python爬取网易云音乐热歌榜的资料请关注三水点靠木其它相关文章！

python爬取网易云音乐热歌榜实例代码

- Author -

FXL

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

进一步了解Python中的XML 工具

Apr 13 Python

在Windows服务器下用Apache和mod_wsgi配置Python应用的教程

May 06 Python

浅谈python中scipy.misc.logsumexp函数的运用场景

Jun 23 Python

eclipse创建python项目步骤详解

May 10 Python

Falsk 与 Django 过滤器的使用与区别详解

Jun 04 Python

python如何从文件读取数据及解析

Sep 19 Python

用Python做一个久坐提醒小助手的示例代码

Feb 10 Python

pycharm 中mark directory as exclude的用法详解

Feb 14 Python

Python selenium自动化测试模型图解

Apr 15 Python

python利用文件时间批量重命名照片和视频

Feb 09 Python

Python绘制词云图之可视化神器pyecharts的方法

Feb 23 Python

用Python仅20行代码编写一个简单的端口扫描器

Apr 08 Python

Python变量格式化输出实现原理解析

Aug 06 #Python

Python实现Canny及Hough算法代码实例解析

Aug 06 #Python

vscode调试django项目的方法

Aug 06 #Python

Python如何使用input函数获取输入

Aug 06 #Python

Python map及filter函数使用方法解析

Aug 06 #Python

python学习笔记之多进程

Aug 06 #Python

Selenium alert 弹窗处理的示例代码

Aug 06 #Python

You might like

基于mysql的论坛（1）

2006/10/09 PHP

PHP 模板高级篇总结

2006/12/21 PHP

解决GD中文乱码问题

2007/02/14 PHP

PHP获取文件相对路径的方法

2015/02/26 PHP

PHP与以太坊交互详解

2018/08/24 PHP

PHP PDOStatement::bindValue讲解

2019/01/30 PHP

js两行代码按指定格式输出日期时间

2011/10/21 Javascript

JQuery each()函数如何优化循环DOM结构的性能

2012/12/10 Javascript

浅析JavaScript动画

2015/06/10 Javascript

js拖拽的原型声明和用法总结

2016/04/04 Javascript

用Angular实时获取本地Localstorage数据,实现一个模拟后台数据登入的效果

2016/11/09 Javascript

探讨AngularJs中ui.route的简单应用

2016/11/16 Javascript

微信小程序实战之上拉（分页加载）效果（2）

2017/04/17 Javascript

微信小程序图片轮播组件gallery slider使用方法详解

2018/01/31 Javascript

vue二级路由设置方法

2018/02/09 Javascript

JS中Promise函数then的奥秘探究

2018/07/30 Javascript

浅析js中mvvm模式实现的原理

2018/10/06 Javascript

了解前端理论：rscss和rsjs

2019/05/23 Javascript

[01:36:17]DOTA2-DPC中国联赛正赛 Ehome vs iG BO3 第一场 1月31日

2021/03/11 DOTA

Python实现遍历windows所有窗口并输出窗口标题的方法

2015/03/13 Python

Python 文件处理注意事项总结

2017/04/10 Python

Python 文件操作的详解及实例

2017/09/18 Python

python将list转为matrix的方法

2018/12/12 Python

python实现从尾到头打印单链表操作示例

2020/02/22 Python

红色连衣裙精品店：Red Dress Boutique

2018/08/11 全球购物

介绍一下Make? 为什么使用make

2013/12/08 面试题

库房主管岗位职责

2013/12/31 职场文书

临床护士自荐信

2014/01/31 职场文书

财务部绩效考核方案

2014/05/04 职场文书

2014红色之旅心得体会

2014/10/07 职场文书

医院办公室主任岗位职责

2015/04/01 职场文书

2015年公司国庆放假通知

2015/07/30 职场文书

公文写作：教你写“建议书”

2019/05/07 职场文书

手写实现JS中的new

2021/11/07 Javascript

关于MySQL临时表为什么可以重名的问题

2022/03/22 MySQL

Innodb存储引擎中的后台线程详解

2022/04/03 MySQL