python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python基础教程之序列详解
Aug 29 Python
python实现ipsec开权限实例
Nov 11 Python
在Linux上安装Python的Flask框架和创建第一个app实例的教程
Mar 30 Python
python 3.6.2 安装配置方法图文教程
Sep 18 Python
解决安装python库时windows error5 报错的问题
Oct 21 Python
Appium+Python自动化测试之运行App程序示例
Jan 23 Python
python判断单向链表是否包括环,若包含则计算环入口的节点实例分析
Oct 23 Python
python os.path.isfile 的使用误区详解
Nov 29 Python
Python基于requests实现模拟上传文件
Apr 21 Python
django正续或者倒序查库实例
May 19 Python
python自动化调用百度api解决验证码
Apr 13 Python
浅析Django接口版本控制
Jun 26 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
PHP中实现图片的锐化
2006/10/09 PHP
PHP session有效期session.gc_maxlifetime
2011/04/20 PHP
PHP获取网页标题的3种实现方法代码实例
2014/04/11 PHP
PHPExcel内存泄漏问题解决方法
2015/01/23 PHP
php版微信发红包接口用法示例
2016/09/23 PHP
laravel-admin的多级联动方法
2019/09/30 PHP
基于jquery的图片的切换(以数字的形式)
2011/02/14 Javascript
jquery写个checkbox——类似邮箱全选功能
2013/03/19 Javascript
ExtJS DOM元素操作经验分享
2013/08/28 Javascript
js中document.write的那点事
2014/12/12 Javascript
JS+CSS实现美化的下拉列表框效果
2015/08/11 Javascript
AngularJs 动态加载模块和依赖
2016/09/15 Javascript
基于JS实现二维码图片固定在右下角某处并跟随滚动条滚动
2017/02/08 Javascript
详解AngularJS2 Http服务
2017/06/26 Javascript
小程序scroll-view安卓机隐藏横向滚动条的实现详解
2019/05/16 Javascript
js实现计时器秒表功能
2019/12/16 Javascript
JS+Canvas实现五子棋游戏
2020/08/26 Javascript
Vue 401配合Vuex防止多次弹框的案例
2020/11/11 Javascript
原生js 实现表单验证功能
2021/02/08 Javascript
python实现NB-IoT模块远程控制
2018/06/20 Python
python实现京东秒杀功能
2018/07/30 Python
python flask实现分页的示例代码
2018/08/02 Python
解决python写入带有中文的字符到文件错误的问题
2019/01/31 Python
python中pygame安装过程(超级详细)
2019/08/04 Python
如何在python中写hive脚本
2019/11/08 Python
Python模块常用四种安装方式
2020/10/20 Python
巴西电子、家电、智能手机购物网站:Girafa
2019/06/04 全球购物
《油菜花开了》教学反思
2014/02/22 职场文书
2014年五四青年节演讲比赛方案
2014/04/22 职场文书
三月学雷锋月活动总结
2014/04/28 职场文书
生物科学专业自荐书
2014/06/20 职场文书
平面设计专业求职信
2014/08/09 职场文书
证婚人婚礼致辞
2015/07/28 职场文书
python opencv通过4坐标剪裁图片
2021/06/05 Python
开机音效回归! Windows 11重新引入开机铃声
2021/11/21 数码科技
Python 中面向接口编程
2022/05/20 Python