编程 Python

python中使用百度音乐搜索的api下载指定歌曲的lrc歌词

Posted in Python onJuly 18, 2014

这次这个真的是干货哦，昨晚弄了半晚上，，，，从8点吃完饭就开始写，一直到了快12点才弄好，，，新手，伤不起呀。。。。
先简单的说下吧，百度提供了一个音乐搜索的api，你想百度请求类似于

http://box.zhangmen.baidu.com/x?op=12&count=1&title=最佳损友$$陈奕迅$$$$

的地址，百度会给你返回一段xml，如下所示

This XML file does not appear to have any style information associated with it. The document tree is shown below.
<result>
<count>1</count>
<url>
<encode>
<![CDATA[
 
http://zhangmenshiting.baidu.com/data2/music/12762845/YmRqamdua21fn6NndK6ap5WXcJlrmG1xlJhobWibmGpjk5ZtmWiZcWRjZ5lqbGyelGKWlZtubGljZ5lka2uanWSXY1qin5t1YWBmZW5ocGlhaWdnbGtqbzE$
 
]]>
</encode>
<decode>
<![CDATA[
12762845.mp3?xcode=e6b69cf593ea22ac9d2b9314e565fc0caf85125f065ce3e0&mid=0.31929107437537
]]>
</decode>
<type>8</type>
<lrcid>2829</lrcid>
<flag>1</flag>
</url>
<durl>
<encode>
<![CDATA[
 
http://zhangmenshiting2.baidu.com/data2/music/7345405/aGVnaWlmbGaeomZzrZmmnJZvmGqXbHCbl2dsZ5qXaWqSlWpsmmdrb2mXamxpbXCclGNsmW2ba25mYmxtapmZcWqTWaGemnRoX2VkbWdvaGhoZmZramluOA$$
 
]]>
</encode>
<decode>
<![CDATA[
7345405.mp3?xcode=e6b69cf593ea22ac78e1478e78479dc19e8e4650995cb99a&mid=0.31929107437537
]]>
</decode>
<type>8</type>
<lrcid>2829</lrcid>
<flag>1</flag>
</durl>
<p2p>
<hash>f98b6772aa97966550ec80617879becee0233bf4</hash>
<url>
<![CDATA[ ]]>
</url>
<type>mp3</type>
<size>3778335</size>
<bitrate>128</bitrate>
</p2p>
</result>

简单的说明下，由于我们要做的只是获取到歌曲的lrc歌词地址，所以有用的只有2829这个标签。
而encode和decode里面的拼接起来就是mp3的下载地址，如本例的

http://zhangmenshiting.baidu.com/data2/music/12762845/YmRqamdua21fn6NndK6ap5WXcJlrmG1xlJhobWibmGpjk5ZtmWiZcWRjZ5lqbGyelGKWlZtubGljZ5lka2uanWSXY1qin5t1YWBmZW5ocGlhaWdnbGtqbzE$12762845.mp3?xcode=e6b69cf593ea22ac9d2b9314e565fc0caf85125f065ce3e0&mid=0.31929107437537

就是下载地址，不过音质太差，有时间在研究下这个。
继续说歌词，注意lrcid标签里面的2829
http://box.zhangmen.baidu.com/bdlrc/ 这个是百度lrc歌词存放地址,
然后本例的歌词地址是http://box.zhangmen.baidu.com/bdlrc/28/2829.lrc
看到了吧，歌词地址后面的两个数字的计算方法是在lrcid除以100所获得的整数，就是第一个数字，然后第二个数字就是lrcid，然后后面加上后缀.lrc就搞定了
获得lrc地址之后就简单了，只要请求该地址，然后将获取到的内容写入文件就ok了。
好了，大概就是这样，下面是代码：

import os
import os.path
import re
import eyed3
import urllib2
import urllib
from urllib import urlencode
import sys
 
import os
reload(sys)
sys.setdefaultencoding('utf8')
 
music_path = r"E:\music"
lrc_path = r"e:\lrc"
 
os.remove('nolrc.txt')
os.remove('lrcxml.txt')
 
the_file = open('lrcxml.txt','a')
nolrc_file = open('nolrc.txt','a')
 
for root,dirs,files in os.walk(music_path):
 for filepath in files:
 the_path = os.path.join(root,filepath)
 if (the_path.find("mp3") != -1):
  print the_path
  the_music = eyed3.load(the_path)
  the_teg = the_music.tag._getAlbum()
  the_artist = the_music.tag._getArtist()
  the_title = the_music.tag._getTitle()
  # print the_teg
  # print the_title
  # print the_artist
  b = the_title.replace(' ','+')
  # print b
  a = the_artist.replace(' ','+')
  #print urlencode(str(b))
  if isinstance(a,unicode):
  a = a.encode('utf8')
  song_url = "http://box.zhangmen.baidu.com/x?op=12&count=1&title="+b+"$$"+a+"$$$$ "
  
  the_file.write(song_url+'\n')
  page = urllib2.urlopen(song_url).read()
  print page
  theid = 0
  
  lrcid = re.compile('<lrcid>(.*?)</lrcid>',re.S).findall(page)
  have_lrc = True
  if lrcid != []:
  theid = lrcid[0]
   
  else:
  nolrc_file.write(the_title+'\n')
  have_lrc = False
  print theid
  
  
  if have_lrc:
  firstid = int(theid)/100
  lrcurl = "http://box.zhangmen.baidu.com/bdlrc/"+str(firstid)+"/"+theid+".lrc"
  print lrcurl
  lrc = urllib2.urlopen(lrcurl).read()
  if(lrc.find('html')== -1):
   lrcfile = open(lrc_path+"\\"+the_title+".lrc",'w')
   lrcfile.writelines(lrc)
   lrcfile.close()
  else:
   nolrc_file.write(the_title+'\n')
   
the_file.close()
nolrc_file.close()
print "end!"

有用第一步请求所获取到底是xml格式的，所以本来想着解析xml来获取lrcid，但是在实现过程中遇到了各种问题，别的还容易，就在这一块儿浪费的时间最长，纠结未果之后，只能改用正则表达式来获取了。。。只能说明还是学艺不精呢

原文：逝去日子的博客 » 使用python扫描本地音乐并下载歌词

python中使用百度音乐搜索的api下载指定歌曲的lrc歌词

- Author -

junjie

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python在多玩图片上下载妹子图的实现代码

Aug 13 Python

使用C语言扩展Python程序的简单入门指引

Apr 14 Python

剖析Python的Twisted框架的核心特性

May 25 Python

详解 Python中LEGB和闭包及装饰器

Aug 03 Python

python中实现指定时间调用函数示例代码

Sep 08 Python

Python3使用PyQt5制作简单的画板/手写板实例

Oct 19 Python

python嵌套字典比较值与取值的实现示例

Nov 03 Python

利用Opencv中Houghline方法实现直线检测

Feb 11 Python

新手常见6种的python报错及解决方法

Mar 09 Python

Keras—embedding嵌入层的用法详解

Jun 10 Python

Python JSON常用编解码方法代码实例

Sep 05 Python

python中使用.py配置文件的方法详解

Nov 23 Python

python采集博客中上传的QQ截图文件

Jul 18 #Python

Python下singleton模式的实现方法

Jul 16 #Python

python的迭代器与生成器实例详解

Jul 16 #Python

Python的内存泄漏及gc模块的使用分析

Jul 16 #Python

Python的垃圾回收机制深入分析

Jul 16 #Python

python中将字典转换成其json字符串

Jul 16 #Python

记录Django开发心得

Jul 16 #Python

You might like

php park、unpark、ord 函数使用方法（二进制流接口应用实例）

2010/10/19 PHP

mongo Table类文件获取MongoCursor(游标)的实现方法分析

2013/07/01 PHP

Yii2选项卡的简单使用

2017/05/26 PHP

PHP针对伪静态的注入总结【附asp与Python相关代码】

2017/08/01 PHP

PHP实现用户登录的案例代码

2018/05/10 PHP

js 事件小结表格区别

2007/08/13 Javascript

jQuery取得select选择的文本与值的示例

2013/12/09 Javascript

通过$(this)使用jQuery包装后的方法或属性

2014/05/18 Javascript

jQuery+ajax实现鼠标单击修改内容的方法

2014/06/27 Javascript

javascript在IE下trim函数无法使用的解决方法

2014/09/12 Javascript

AngularJS过滤器详解及示例代码

2016/08/16 Javascript

vue-hook-form使用详解

2017/04/07 Javascript

angular4模块中给标签添加背景图的实现方法

2017/09/15 Javascript

浅析从vue源码看观察者模式

2018/01/29 Javascript

Vue的路由动态重定向和导航守卫实例

2018/03/17 Javascript

使用Angular CLI快速创建Angular项目的一些基本概念和写法小结

2018/04/22 Javascript

vue 调用 RESTful风格接口操作

2020/08/11 Javascript

vscode中的vue项目报错Property ‘xxx‘ does not exist on type ‘CombinedVueInstance＜{ readyOnly...Vetur（2339）

2020/09/11 Javascript

JavaScript/TypeScript 实现并发请求控制的示例代码

2021/01/18 Javascript

JavaScript实现点击出现子菜单效果

2021/02/08 Javascript

python线程池的实现实例

2013/11/18 Python

Python通过Django实现用户注册和邮箱验证功能代码

2017/12/11 Python

python调用xlsxwriter创建xlsx的方法

2018/05/03 Python

解决pyinstaller打包exe文件出现命令窗口一闪而过的问题

2018/10/31 Python

python pygame实现2048游戏

2018/11/20 Python

Python对象的属性访问过程详解

2020/03/05 Python

Centos7下源码安装Python3 及shell 脚本自动安装Python3的教程

2020/03/07 Python

英国最大的线上保健品零售商之一：Vitamin Planet

2016/12/01 全球购物

小狗电器官方商城：中国高端吸尘器品牌

2017/03/29 全球购物

思想作风建设心得体会

2014/10/22 职场文书

2014年电厂个人工作总结

2014/11/27 职场文书

2014年挂职干部工作总结

2014/12/06 职场文书

推销搭讪开场白

2015/05/28 职场文书

mybatis调用sqlserver存储过程返回结果集的方法

2021/05/08 SQL Server

微信小程序调用python模型

2022/04/21 Python

MySQL生成千万测试数据以及遇到的问题

2022/08/05 MySQL