python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python splitlines使用技巧
Sep 06 Python
浅谈django model的get和filter方法的区别(必看篇)
May 23 Python
Python实现两个list对应元素相减操作示例
Jun 09 Python
python实现Decorator模式实例代码
Feb 09 Python
pandas DataFrame数据转为list的方法
Apr 11 Python
python字符串与url编码的转换实例
May 10 Python
Python实现统计给定字符串中重复模式最高子串功能示例
May 16 Python
Python绘制KS曲线的实现方法
Aug 13 Python
浅谈SciPy中的optimize.minimize实现受限优化问题
Feb 29 Python
python3+selenium获取页面加载的所有静态资源文件链接操作
May 04 Python
解决Python3.7.0 SSL低版本导致Pip无法使用问题
Sep 03 Python
Python实现微信表情包炸群功能
Jan 28 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
如何在Web页面上直接打开、编辑、创建Office文档
2007/03/12 Javascript
jQuery Ajax 全解析
2009/02/08 Javascript
让 JavaScript 轻松支持函数重载 (Part 2 - 实现)
2009/08/04 Javascript
JavaScript中__proto__与prototype的关系深入理解
2012/12/04 Javascript
js获取元素到文档区域document的(横向、纵向)坐标的两种方法
2013/05/17 Javascript
基于jquery实现的文字淡入淡出效果
2013/11/14 Javascript
js获取光标位置和设置文本框光标位置示例代码
2014/01/09 Javascript
Nodejs Post请求报socket hang up错误的解决办法
2014/09/25 NodeJs
jQuery学习笔记之Ajax用法实例详解
2015/12/01 Javascript
js 判断一组日期是否是连续的简单实例
2016/07/11 Javascript
Omi v1.0.2发布正式支持传递javascript表达式
2017/03/21 Javascript
Nodejs 和Session 原理及实战技巧小结
2017/08/25 NodeJs
vue获取input输入值的问题解决办法
2017/10/17 Javascript
JS使用Date对象实时显示当前系统时间简单示例
2018/08/23 Javascript
基于vue和websocket的多人在线聊天室
2020/02/01 Javascript
vue.js实现h5机器人聊天(测试版)
2020/07/16 Javascript
vue-cli+webpack项目打包到服务器后,ttf字体找不到的解决操作
2020/08/28 Javascript
详细解读Python中解析XML数据的方法
2015/10/15 Python
python3利用Dlib19.7实现人脸68个特征点标定
2018/02/26 Python
Django中反向生成models.py的实例讲解
2018/05/30 Python
Python模拟简单电梯调度算法示例
2018/08/20 Python
Python 函数绘图及函数图像微分与积分
2019/11/20 Python
Python的几种主动结束程序方式
2019/11/22 Python
python实现录屏功能(亲测好用)
2020/03/02 Python
浅谈keras中自定义二分类任务评价指标metrics的方法以及代码
2020/06/11 Python
爱尔兰最大的体育零售商:Life Style Sports
2019/06/12 全球购物
汽车驾驶求职信
2013/10/25 职场文书
社区中秋节活动方案
2014/01/29 职场文书
学校门卫岗位职责
2014/03/16 职场文书
英文演讲稿
2014/05/15 职场文书
学校百日安全生产活动总结
2014/07/05 职场文书
培训督导岗位职责
2015/04/10 职场文书
小学课改工作总结
2015/08/13 职场文书
Jackson 反序列化时实现大小写不敏感设置
2021/06/29 Java/Android
nginx安装以及配置的详细过程记录
2021/09/15 Servers
Java 使用类型为Object的变量指向任意类型的对象
2022/04/13 Java/Android