python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
举例讲解Python面向对象编程中类的继承
Jun 17 Python
python出现&quot;IndentationError: unexpected indent&quot;错误解决办法
Oct 15 Python
SVM基本概念及Python实现代码
Dec 27 Python
python自动截取需要区域,进行图像识别的方法
May 17 Python
Python中asyncio与aiohttp入门教程
Oct 16 Python
简单了解django缓存方式及配置
Jul 19 Python
pygame实现俄罗斯方块游戏(基础篇2)
Oct 29 Python
基于opencv的selenium滑动验证码的实现
Jul 24 Python
一文详述 Python 中的 property 语法
Sep 01 Python
python b站视频下载的五种版本
May 27 Python
Python3的进程和线程你了解吗
Mar 16 Python
分享Python获取本机IP地址的几种方法
Mar 17 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
php xfocus防注入资料
2008/04/27 PHP
PHP写的求多项式导数的函数代码
2012/07/04 PHP
PHP中is_dir()函数使用指南
2015/05/08 PHP
yii2框架中使用下拉菜单的自动搜索yii-widget-select2实例分析
2016/01/09 PHP
php+ajax简单实现全选删除的方法
2016/12/06 PHP
文本加密解密
2006/06/23 Javascript
js获取input标签的输入值实现代码
2013/08/05 Javascript
jquery实现checkbox全选全不选的简单实例
2013/12/31 Javascript
jQuery获取iframe的document对象的方法
2014/10/10 Javascript
javascript实现根据身份证号读取相关信息
2014/12/17 Javascript
基于Jquery代码实现支持PC端手机端幻灯片代码
2015/11/17 Javascript
JavaScript深度复制(deep clone)的实现方法
2016/02/19 Javascript
使用canvas进行图像编辑的实例
2017/08/29 Javascript
JS从非数组对象转数组的方法小结
2018/03/26 Javascript
JavaScript 日期时间选择器一些小结
2018/04/02 Javascript
Vue监听事件实现计数点击依次增加的方法
2018/09/26 Javascript
ES6 let和const定义变量与常量的应用实例分析
2019/06/27 Javascript
Python中的类学习笔记
2014/09/23 Python
python使用PyGame模块播放声音的方法
2015/05/20 Python
使用Python编写基于DHT协议的BT资源爬虫
2016/03/19 Python
Python实现读取文件最后n行的方法
2017/02/23 Python
python 调用c语言函数的方法
2017/09/29 Python
python爬虫之BeautifulSoup 使用select方法详解
2017/10/23 Python
python编写朴素贝叶斯用于文本分类
2017/12/21 Python
Python爬虫包BeautifulSoup异常处理(二)
2018/06/17 Python
详解TensorFlow查看ckpt中变量的几种方法
2018/06/19 Python
Python实现提取XML内容并保存到Excel中的方法
2018/09/01 Python
python生成器用法实例详解
2019/11/22 Python
html5基础标签(html5视频标签 html5新标签用法)
2013/12/30 HTML / CSS
世界上最大的家庭自动化公司:Smarthome
2017/12/20 全球购物
介绍一下SQL Server的全文索引
2013/08/15 面试题
学习雷锋月活动总结
2014/07/03 职场文书
领导班子四风对照检查材料范文
2014/09/27 职场文书
酒店优秀员工推荐信
2015/03/24 职场文书
受欢迎的自荐信,就这么写!
2019/04/19 职场文书
php 防护xss,PHP的防御XSS注入的终极解决方案
2021/04/01 PHP