使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python httplib,smtplib使用方法
Sep 06 Python
Python求两个list的差集、交集与并集的方法
Nov 01 Python
python中base64加密解密方法实例分析
May 16 Python
django实现用户登陆功能详解
Dec 11 Python
Python爬豆瓣电影实例
Feb 23 Python
Vue的el-scrollbar实现自定义滚动
May 29 Python
Python实现的txt文件去重功能示例
Jul 07 Python
用Anaconda安装本地python包的方法及路径问题(图文)
Jul 16 Python
Python利用神经网络解决非线性回归问题实例详解
Jul 19 Python
利用python在excel中画图的实现方法
Mar 17 Python
Pycharm2020.1安装无法启动问题即设置中文插件的方法
Aug 07 Python
python 获取计算机的网卡信息
Feb 18 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
php桌面中心(四) 数据显示
2007/03/11 PHP
PHP迭代器的内部执行过程详解
2013/11/12 PHP
WordPres对前端页面调试时的两个PHP函数使用小技巧
2015/12/22 PHP
JQuery UI皮肤定制
2009/07/27 Javascript
extjs grid设置某列背景颜色和字体颜色的实现方法
2010/09/06 Javascript
从零开始学习jQuery (八) 插播:jQuery实施方案
2011/02/23 Javascript
只需一行代码,轻松实现一个在线编辑器
2013/11/12 Javascript
代码触发js事件(click、change)示例应用
2013/12/13 Javascript
轻松创建nodejs服务器(8):非阻塞是如何实现的
2014/12/18 NodeJs
js实现同一页面可多次调用的图片幻灯切换效果
2015/02/28 Javascript
JavaScript数组和循环详解
2015/04/27 Javascript
JS实现的颜色实时渐变效果完整实例
2016/03/25 Javascript
浅谈js继承的实现及公有、私有、静态方法的书写
2016/10/28 Javascript
jquery操作select取值赋值与设置选中实例
2017/02/28 Javascript
jquery实现静态搜索功能(可输入搜索文字)
2017/03/28 jQuery
vue两个组件间值的传递或修改方式
2018/07/04 Javascript
js使用swiper实现层叠轮播效果实例代码
2018/12/12 Javascript
vue中注册自定义的全局js方法
2019/11/15 Javascript
vue setInterval 定时器失效的解决方式
2020/07/30 Javascript
[03:41]DOTA2上海特锦赛小组赛第三日recap精彩回顾
2016/02/28 DOTA
对于Python编程中一些重用与缩减的建议
2015/04/14 Python
python生成器generator用法实例分析
2015/06/04 Python
Pythont特殊语法filter,map,reduce,apply使用方法
2016/02/27 Python
Python实现读取邮箱中的邮件功能示例【含文本及附件】
2017/08/05 Python
使用pycharm设置控制台不换行的操作方法
2019/01/19 Python
利用python list完成最简单的DB连接池方法
2019/08/09 Python
python实现微信小程序用户登录、模板推送
2019/08/28 Python
html5 canvas里绘制椭圆并保持线条粗细均匀的技巧
2013/03/25 HTML / CSS
简洁自适应404页面HTML好看的404源码
2020/12/16 HTML / CSS
欧铁通票官方在线销售网站:Eurail.com
2017/10/14 全球购物
小学运动会报道稿
2014/10/04 职场文书
离婚协议书标准格式
2014/10/04 职场文书
大学四年个人总结
2015/03/03 职场文书
党支部对转正的意见
2015/06/02 职场文书
二年级数学教学反思
2016/02/16 职场文书
一文带你探究MySQL中的NULL
2021/11/11 MySQL