python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python基础入门详解(文件输入/输出 内建类型 字典操作使用方法)
Dec 08 Python
使用python实现正则匹配检索远端FTP目录下的文件
Mar 25 Python
举例详解Python中的split()函数的使用方法
Apr 07 Python
浅谈Python的Django框架中的缓存控制
Jul 24 Python
python正则表达式re之compile函数解析
Oct 25 Python
python 动态生成变量名以及动态获取变量的变量名方法
Jan 20 Python
解决Django加载静态资源失败的问题
Jul 28 Python
使用Python函数进行模块化的实现
Nov 15 Python
在 Python 中接管键盘中断信号的实现方法
Feb 04 Python
python GUI库图形界面开发之PyQt5多线程中信号与槽的详细使用方法与实例
Mar 08 Python
python能做哪方面的工作
Jun 15 Python
django template实现定义临时变量,自定义赋值、自增实例
Jul 12 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
php 检查电子邮件函数(自写)
2014/01/16 PHP
浅析PHP7新功能及语法变化总结
2016/06/17 PHP
php格式化时间戳
2016/12/17 PHP
iis6手工创建网站后无法运行php脚本的解决方法
2017/06/08 PHP
PHP array_reduce()函数的应用解析
2018/10/28 PHP
海量经典的jQuery插件集合
2010/01/12 Javascript
js prototype截取字符串函数
2010/04/01 Javascript
JQuery AJAX提交中文乱码的解决方案
2010/07/02 Javascript
js下写一个事件队列操作函数
2010/07/19 Javascript
jquery 图片轮换效果
2010/07/29 Javascript
javascripit实现密码强度检测代码分享
2013/12/12 Javascript
javascript/jquery获取地址栏url参数的方法
2014/03/05 Javascript
Jquery自定义button按钮的几种方法
2014/06/11 Javascript
Highcharts入门之简介
2016/08/02 Javascript
JS 事件绑定、事件监听、事件委托详细介绍
2016/09/28 Javascript
React为 Vue 引入容器组件和展示组件的教程详解
2018/05/03 Javascript
vue的.vue文件是怎么run起来的(vue-loader)
2018/12/10 Javascript
详解Vue 全局变量,局部变量
2019/04/17 Javascript
javascript+HTML5 canvas绘制时钟功能示例
2019/05/15 Javascript
JS removeAttribute()方法实现删除元素的某个属性
2021/01/11 Javascript
[01:31:02]TNC vs VG 2019国际邀请赛淘汰赛 胜者组赛BO3 第一场
2019/08/22 DOTA
使用python编写脚本获取手机当前应用apk的信息
2014/07/21 Python
Python算法应用实战之队列详解
2017/02/04 Python
使用tensorflow实现AlexNet
2017/11/20 Python
python实现感知器
2017/12/19 Python
python实现简单聊天室功能 可以私聊
2019/07/12 Python
Python selenium 自动化脚本打包成一个exe文件(推荐)
2020/01/14 Python
用Python制作mini翻译器的实现示例
2020/08/17 Python
html5 Canvas画图教程(4)—未闭合的路径及渐变色的填充方法
2013/01/09 HTML / CSS
本科生学习总结的自我评价
2013/10/02 职场文书
求职信需要的五点内容
2014/02/01 职场文书
踏青活动策划方案
2014/08/19 职场文书
2014年维修工作总结
2014/11/22 职场文书
典型事迹材料范文
2014/12/29 职场文书
收费员岗位职责
2015/02/14 职场文书
用Python可视化新冠疫情数据
2022/01/18 Python