python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python命令行参数解析OptionParser类用法实例
Oct 09 Python
Python使用Supervisor来管理进程的方法
May 28 Python
Python的Flask框架应用调用Redis队列数据的方法
Jun 06 Python
Python实现PS图像抽象画风效果的方法
Jan 23 Python
python内置数据类型之列表操作
Nov 12 Python
pycharm创建scrapy项目教程及遇到的坑解析
Aug 15 Python
详解基于python的多张不同宽高图片拼接成大图
Sep 26 Python
python GUI库图形界面开发之PyQt5状态栏控件QStatusBar详细使用方法实例
Feb 28 Python
tensorflow使用L2 regularization正则化修正overfitting过拟合方式
May 22 Python
keras多显卡训练方式
Jun 10 Python
python 常用日期处理-- datetime 模块的使用
Sep 02 Python
Python中实现一行拆多行和多行并一行的示例代码
Sep 06 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
解析PHP计算页面执行时间的实现代码
2013/06/18 PHP
PHP分页效率终结版(推荐)
2013/07/01 PHP
destoon复制新模块的方法
2014/06/21 PHP
Zend Framework缓存Cache用法简单实例
2016/03/19 PHP
PHP与SQL语句常用大全
2016/12/10 PHP
获取DOM对象的几种扩展及简写
2006/10/09 Javascript
jQuery实战之仿淘宝商城左侧导航效果
2011/04/12 Javascript
jQuery EasyUI API 中文文档 - PropertyGrid属性表格
2011/11/18 Javascript
JavaScript 用cloneNode方法克隆节点的代码
2012/10/15 Javascript
(跨浏览器基础事件/浏览器检测/判断浏览器)经验代码分享
2013/01/24 Javascript
JavaScript立即执行函数的三种不同写法
2014/09/05 Javascript
jquery validate和jquery form 插件组合实现验证表单后AJAX提交
2015/08/26 Javascript
jquery判断密码强度的验证代码
2020/04/22 Javascript
Bootstrap实现input控件失去焦点时验证
2016/08/04 Javascript
手把手教你 CKEDITOR 4 实现Dialog 内嵌 IFrame操作详解
2019/06/18 Javascript
React中使用UMEditor的方法示例
2019/12/27 Javascript
解决Vue-cli3没有vue.config.js文件夹及配置vue项目域名的问题
2020/12/04 Vue.js
[57:47]Fnatic vs Winstrike 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
python 文件操作api(文件操作函数)
2016/08/28 Python
Python实现求笛卡尔乘积的方法
2017/09/16 Python
python实现比较文件内容异同
2018/06/22 Python
Python实现统计英文文章词频的方法分析
2019/01/28 Python
python 梯度法求解函数极值的实例
2019/07/10 Python
Django之模板层的实现代码
2019/09/09 Python
分享unittest单元测试框架中几种常用的用例加载方法
2020/12/02 Python
使用sublime text3搭建Python编辑环境的实现
2021/01/12 Python
python中的时区问题
2021/01/14 Python
css3 中实现炫酷的loading效果
2019/04/26 HTML / CSS
C语言如何决定使用那种整数类型
2016/11/26 面试题
销售员自我评价怎么写
2013/09/19 职场文书
法律专业个人实习自我鉴定
2013/09/23 职场文书
安全检查验收制度
2014/01/12 职场文书
社区党员先进事迹
2014/01/22 职场文书
初中优秀教师事迹材料
2014/08/18 职场文书
2014年初级职称工作总结
2014/12/08 职场文书
HashMap实现保存两个key相同的数据
2021/06/30 Java/Android