使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python读写文件操作示例程序
Dec 02 Python
python批量生成本地ip地址的方法
Mar 23 Python
Python爬虫辅助利器PyQuery模块的安装使用攻略
Apr 24 Python
浅谈python中的正则表达式(re模块)
Oct 17 Python
对python修改xml文件的节点值方法详解
Dec 24 Python
在django view中给form传入参数的例子
Jul 19 Python
tensorflow如何批量读取图片
Aug 29 Python
python递归下载文件夹下所有文件
Aug 31 Python
Tensorflow进行多维矩阵的拆分与拼接实例
Feb 07 Python
python爬虫开发之使用python爬虫库requests,urllib与今日头条搜索功能爬取搜索内容实例
Mar 10 Python
python中random模块详解
Mar 01 Python
python 实现的截屏工具
May 08 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
php中serialize序列化与json性能测试的示例分析
2013/04/27 PHP
ThinkPHP中调用PHPExcel的实现代码
2017/04/08 PHP
浅析PHP类的反射来实现依赖注入过程
2018/02/06 PHP
纯JAVASCRIPT图表动画插件Highcharts Examples
2011/04/16 Javascript
解决WordPress使用CDN后博文无法评论的错误
2015/12/15 Javascript
javascript中利用柯里化函数实现bind方法【推荐】
2016/04/29 Javascript
JavaScript动态检验密码强度的实现方法
2016/11/09 Javascript
微信小程序实战之登录页面制作(5)
2020/03/30 Javascript
JS触摸事件、手势事件详解
2017/05/04 Javascript
解决Vue2.0 watch对象属性变化监听不到的问题
2018/09/11 Javascript
详解在vue-test-utils中mock全局对象
2018/11/07 Javascript
vue打包通过image-webpack-loader插件对图片压缩优化操作
2020/11/12 Javascript
[00:20]TI9不朽观赛名额抽取
2019/08/05 DOTA
[04:14]从西雅图到上海——玩家自制DOTA2主题歌曲应援TI9
2019/07/11 DOTA
分享几道你可能遇到的python面试题
2017/07/24 Python
Python 私有函数的实例详解
2017/09/11 Python
python机器学习理论与实战(四)逻辑回归
2018/01/19 Python
Windows下的Jupyter Notebook 安装与自定义启动(图文详解)
2018/02/21 Python
Python装饰器简单用法实例小结
2018/12/03 Python
python 检查文件mime类型的方法
2018/12/08 Python
Python爬虫文件下载图文教程
2018/12/23 Python
Python XML转Json之XML2Dict的使用方法
2019/01/15 Python
Python网络爬虫之爬取微博热搜
2019/04/18 Python
Pandas DataFrame数据的更改、插入新增的列和行的方法
2019/06/25 Python
python和js交互调用的方法
2020/06/23 Python
python使用opencv resize图像不进行插值的操作
2020/07/05 Python
用python制作个视频下载器
2021/02/01 Python
销售总监工作职责
2013/11/21 职场文书
便利店的创业计划书
2014/01/15 职场文书
祝福语集锦:给满月宝宝的祝福语
2019/11/20 职场文书
MySQL 可扩展设计的基本原则
2021/05/14 MySQL
自从在 IDEA 中用了热部署神器 JRebel 之后,开发效率提升了 10(真棒)
2021/06/26 Java/Android
用php如何解决大文件分片上传问题
2021/07/07 PHP
聊聊基于pytorch实现Resnet对本地数据集的训练问题
2022/03/25 Python
Nginx隐藏式跳转(浏览器URL跳转后保持不变)
2022/04/07 Servers
ORACLE中dbms_output.put_line输出问题的解决过程
2022/06/28 Oracle