使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python获取各操作系统硬件信息的方法
Jun 03 Python
将Python代码嵌入C++程序进行编写的实例
Jul 31 Python
python抓取文件夹的所有文件
Feb 27 Python
Django模型序列化返回自然主键值示例代码
Jun 12 Python
python GUI库图形界面开发之PyQt5不规则窗口实现与显示GIF动画的详细方法与实例
Mar 09 Python
python开根号实例讲解
Aug 30 Python
Python内置函数property()如何使用
Sep 01 Python
Django xadmin安装及使用详解
Oct 26 Python
Python解析微信dat文件的方法
Nov 30 Python
python生成随机数、随机字符、随机字符串
Apr 06 Python
Python OpenCV实现传统图片格式与base64转换
Jun 13 Python
python中的random模块和相关函数详解
Apr 22 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
使用PHP 5.0创建图形的巧妙方法
2010/10/12 PHP
php性能优化分析工具XDebug 大型网站调试工具
2011/05/22 PHP
phpmailer在服务器上不能正常发送邮件的解决办法
2014/07/08 PHP
Array.slice()与Array.splice()的返回值类型
2006/10/09 Javascript
js实时监听文本框状态的方法
2011/04/26 Javascript
EXTJS记事本 当CompositeField遇上RowEditor
2011/07/31 Javascript
JavaScript Array Flatten 与递归使用介绍
2011/10/30 Javascript
chrome浏览器不支持onmouseleave事件的解决技巧
2013/05/31 Javascript
jQuery设置指定网页元素宽度和高度的方法
2015/03/25 Javascript
深入理解JavaScript的React框架的原理
2015/07/02 Javascript
javascript日期操作详解(脚本之家整理)
2015/09/05 Javascript
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
javascript将json格式数组下载为excel表格的方法
2017/12/22 Javascript
vue计算属性时v-for处理数组时遇到的一个bug问题
2018/01/21 Javascript
深入浅析AngularJs模版与v-bind
2018/07/06 Javascript
vue项目打包部署_nginx代理访问方法详解
2018/09/20 Javascript
[01:13:51]TNC vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
[01:02:55]CHAOS vs Mineski 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/18 DOTA
python各种语言间时间的转化实现代码
2016/03/23 Python
简单了解Django模板的使用
2017/12/20 Python
取numpy数组的某几行某几列方法
2018/04/03 Python
python 多维切片之冒号和三个点的用法介绍
2018/04/19 Python
Python3 用matplotlib绘制sigmoid函数的案例
2020/12/11 Python
酷瑞网络科技面试题
2012/03/30 面试题
what is the difference between ext2 and ext3
2015/08/25 面试题
高职助产应届生自荐信
2013/09/24 职场文书
师生聚会感言
2014/01/26 职场文书
四年级语文教学反思
2014/02/05 职场文书
厉行勤俭节约倡议书
2014/05/16 职场文书
医德医魂心得体会
2014/09/11 职场文书
体育运动会广播稿
2014/10/05 职场文书
综治工作汇报材料
2014/10/27 职场文书
2016年寒假家长评语
2015/10/10 职场文书
2016元旦主持人经典开场白台词
2015/12/03 职场文书
MySql新手入门的基本操作汇总
2021/05/13 MySQL
浅谈PHP7中的一些小技巧
2021/05/29 PHP