python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python设计模式之观察者模式实例
Apr 26 Python
人工智能最火编程语言 Python大战Java!
Nov 13 Python
Python实现采用进度条实时显示处理进度的方法
Dec 19 Python
Python zip()函数用法实例分析
Mar 17 Python
Django实现发送邮件功能
Jul 18 Python
python 定时器每天就执行一次的实现代码
Aug 14 Python
python图形绘制奥运五环实例讲解
Sep 14 Python
使用Pandas的Series方法绘制图像教程
Dec 04 Python
python 浅谈serial与stm32通信的编码问题
Dec 18 Python
分享PyCharm最新激活码(真永久激活方法)不用每月找安装参数或最新激活码了
Dec 27 Python
Python tkinter之Bind(绑定事件)的使用示例
Feb 05 Python
如何将numpy二维数组中的np.nan值替换为指定的值
May 14 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
php判断字符以及字符串的包含方法属性
2008/08/30 PHP
drupal 代码实现URL重写
2011/05/04 PHP
深入探讨PHP中的内存管理问题
2011/08/31 PHP
8个PHP数组面试题
2015/06/23 PHP
基于ThinkPHP+uploadify+upload+PHPExcel 无刷新导入数据
2015/09/23 PHP
Linux下快速搭建php开发环境
2017/03/13 PHP
使用laravel和ajax实现整个页面无刷新的操作方法
2019/10/03 PHP
ext form 表单提交数据的方法小结
2008/08/08 Javascript
基于jQuery的投票系统显示结果插件
2011/08/12 Javascript
Extjs4.0设置Ext.data.Store传参的请求方式(默认为GET)
2013/04/02 Javascript
解决js中window.open弹出的是上次的缓存页面问题
2013/12/29 Javascript
使用ajaxfileupload.js实现ajax上传文件php版
2014/06/26 Javascript
JavaScript设置获取和设置属性的方法
2015/03/04 Javascript
window.location.hash知识汇总
2015/11/09 Javascript
JS/jQ实现免费获取手机验证码倒计时效果
2016/06/13 Javascript
微信小程序上滑加载下拉刷新(onscrollLower)分批加载数据(二)
2017/05/11 Javascript
JavaScript输入框字数实时统计更新
2017/06/17 Javascript
Vue cli+mui 区域滚动的实例代码
2018/01/25 Javascript
解决Vue 刷新页面导航显示高亮位置不对问题
2019/12/25 Javascript
python fabric实现远程操作和部署示例
2014/03/25 Python
利用Python-iGraph如何绘制贴吧/微博的好友关系图详解
2017/11/02 Python
快速查询Python文档方法分享
2017/12/27 Python
python中返回矩阵的行列方法
2018/04/04 Python
python操作excel的方法
2018/08/16 Python
python批量替换文件名中的共同字符实例
2020/03/05 Python
Carolina工作鞋官网:Carolina Footwear
2019/03/14 全球购物
工作中个人的自我评价
2013/12/31 职场文书
材料加工工程求职信
2014/02/19 职场文书
农村改厕实施方案
2014/03/22 职场文书
小学生春游活动方案
2014/08/20 职场文书
小学庆六一活动总结
2014/08/28 职场文书
工厂见习报告范文
2014/10/31 职场文书
导游词之白茶谷九龙峡
2019/10/23 职场文书
python3实现无权最短路径的方法
2021/05/12 Python
MySQL中distinct与group by之间的性能进行比较
2021/05/26 MySQL
MySQL中IO问题的深入分析与优化
2022/04/02 MySQL