python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 专题二 条件语句和循环语句的基础知识
Mar 19 Python
python使用RNN实现文本分类
May 24 Python
深入分析python中整型不会溢出问题
Jun 18 Python
Python+OpenCV图片局部区域像素值处理改进版详解
Jan 23 Python
django与小程序实现登录验证功能的示例代码
Feb 19 Python
python实现简单成绩录入系统
Sep 19 Python
python代码打印100-999之间的回文数示例
Nov 24 Python
selenium 多窗口切换的实现(windows)
Jan 18 Python
关于jupyter打开之后不能直接跳转到浏览器的解决方式
Apr 13 Python
Python+unittest+requests+excel实现接口自动化测试框架
Dec 23 Python
Python读取pdf表格写入excel的方法
Jan 22 Python
Python基础之tkinter图形化界面学习
Apr 29 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
全国FM电台频率大全 - 21 海南省
2020/03/11 无线电
php中的一个中文字符串截取函数
2007/02/14 PHP
PHP5中使用DOM控制XML实现代码
2010/05/07 PHP
解析php二分法查找数组是否包含某一元素
2013/05/23 PHP
PHP页面间参数传递的四种方法详解
2013/06/09 PHP
php实现的漂亮分页方法
2014/04/17 PHP
php实现留言板功能
2017/03/05 PHP
jquery中ajax学习笔记3
2011/10/16 Javascript
在jQuery中 常用的选择器介绍
2013/04/16 Javascript
jquery text(),val(),html()方法区别总结
2013/11/04 Javascript
JQuery中Bind()事件用法分析
2015/05/05 Javascript
ThinkPHP+jquery实现“加载更多”功能代码
2017/03/11 Javascript
js实现一个简单的数字时钟效果
2017/03/29 Javascript
详解webpack和webpack-simple中如何引入css文件
2017/06/28 Javascript
小程序自定义单页面、全局导航栏的实现代码
2019/03/15 Javascript
vue+element项目中过滤输入框特殊字符小结
2019/08/07 Javascript
layui使用button按钮 点击出现弹层 弹层中加载表单的实例
2019/09/04 Javascript
bootstrap-closable-tab可实现关闭的tab标签页插件
2020/08/09 Javascript
[02:30]DOTA2放量测试专访海涛:呼吁保护新手玩家
2013/08/26 DOTA
python处理文本文件并生成指定格式的文件
2014/07/31 Python
浅析Python中将单词首字母大写的capitalize()方法
2015/05/18 Python
pymssql数据库操作MSSQL2005实例分析
2015/05/25 Python
Pycharm学习教程(4) Python解释器的相关配置
2017/05/03 Python
flask中的wtforms使用方法
2018/07/21 Python
利用python脚本如何简化jar操作命令
2019/02/24 Python
Python ArgumentParse的subparser用法说明
2020/04/20 Python
Python select及selectors模块概念用法详解
2020/06/22 Python
HTML5拖拽API经典实例详解
2018/04/20 HTML / CSS
医学专业毕业生个人求职信
2013/12/25 职场文书
新三好学生主要事迹
2014/01/23 职场文书
募捐倡议书
2014/04/14 职场文书
商场消防安全责任书
2014/07/29 职场文书
购房公证委托书(2014版)
2014/09/12 职场文书
12.4全国法制宣传日活动总结
2014/11/01 职场文书
2015年机关作风和效能建设工作总结
2015/07/23 职场文书
解决Pytorch dataloader时报错每个tensor维度不一样的问题
2021/05/28 Python