python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python 基础学习第二弹 类属性和实例属性
Aug 27 Python
详解Python中用于计算指数的exp()方法
May 14 Python
python爬虫实战之最简单的网页爬虫教程
Aug 13 Python
python批量替换多文件字符串问题详解
Apr 22 Python
python统计字母、空格、数字等字符个数的实例
Jun 29 Python
浅析Python四种数据类型
Sep 26 Python
Python爬虫beautifulsoup4常用的解析方法总结
Feb 25 Python
Django重置migrations文件的方法步骤
May 01 Python
Django使用unittest模块进行单元测试过程解析
Aug 02 Python
对python中的装包与解包实例详解
Aug 24 Python
keras模型保存为tensorflow的二进制模型方式
May 25 Python
利用python Pandas实现批量拆分Excel与合并Excel
May 23 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
mac系统下安装多个php并自由切换的方法详解
2017/04/21 PHP
php数据库的增删改查 php与javascript之间的交互
2017/08/31 PHP
JXTree对象,读取外部xml文件数据,生成树的函数
2007/04/02 Javascript
javascript StringBuilder类实现
2008/12/22 Javascript
jQuery前端框架easyui使用Dialog时bug处理
2014/12/05 Javascript
JavaScript判断表单提交时哪个radio按钮被选中的方法
2015/03/21 Javascript
jQuery拖动元素并对元素进行重新排序
2015/12/30 Javascript
基于jquery实现智能表单验证操作
2016/05/09 Javascript
Bootstrap基本插件学习笔记之Popover提示框(19)
2016/12/08 Javascript
微信端开发--登录小程序步骤
2017/01/11 Javascript
基于JavaScript实现百度搜索框效果
2020/06/28 Javascript
es6 字符串String的扩展(实例讲解)
2017/08/03 Javascript
nodejs对express中next函数的一些理解
2017/09/08 NodeJs
Vue中使用vue-i18插件实现多语言切换功能
2018/04/25 Javascript
angular.js实现列表orderby排序的方法
2018/10/02 Javascript
关于angular浏览器兼容性问题的解决方案
2020/07/26 Javascript
解决新建一个vue项目过程中遇到的问题
2020/10/22 Javascript
padas 生成excel 增加sheet表的实例
2018/12/11 Python
pandas对dataFrame中某一个列的数据进行处理的方法
2019/07/08 Python
pip 安装库比较慢的解决方法(国内镜像)
2019/10/06 Python
如何基于python实现归一化处理
2020/01/20 Python
python进行二次方程式计算的实例讲解
2020/12/06 Python
Marriott中国:万豪国际酒店查询预订
2016/09/02 全球购物
享誉全球的多元化时尚精品购物平台:Farfetch发发奇(支持中文)
2017/08/08 全球购物
女子锻炼服装和瑜伽服装:Splits59
2019/03/04 全球购物
高级运动鞋:GREATS
2019/07/19 全球购物
欧洲最大的预定车位市场:JustPark
2020/01/06 全球购物
英国家居用品和床上用品零售商:P&B Home
2020/01/16 全球购物
高中毕业自我鉴定
2013/12/19 职场文书
2014年应届大学生自我评价
2014/01/09 职场文书
2014领导班子四风问题对照检查材料思想汇报
2014/09/21 职场文书
森马旗舰店双十一营销方案
2014/09/29 职场文书
医院合作意向书范本
2015/05/08 职场文书
开学第一天的感想
2015/08/10 职场文书
会计继续教育培训心得体会
2016/01/19 职场文书
Python实现聚类K-means算法详解
2022/07/15 Python