python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Django返回json数据用法示例
Sep 18 Python
Python导入模块时遇到的错误分析
Aug 30 Python
和孩子一起学习python之变量命名规则
May 27 Python
Django实战之用户认证(初始配置)
Jul 16 Python
python查看模块,对象的函数方法
Oct 16 Python
Python3中在Anaconda环境下安装basemap包
Oct 21 Python
PyCharm代码提示忽略大小写设置方法
Oct 28 Python
python占位符输入方式实例
May 27 Python
python 弹窗提示警告框MessageBox的实例
Jun 18 Python
pandas.DataFrame的pivot()和unstack()实现行转列
Jul 06 Python
python3中datetime库,time库以及pandas中的时间函数区别与详解
Apr 16 Python
什么是python的自省
Jun 21 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
全国FM电台频率大全 - 20 广西省
2020/03/11 无线电
我的论坛源代码(二)
2006/10/09 PHP
PHP iconv 函数转gb2312的bug解决方法
2009/10/11 PHP
PHP获取当前页面完整URL的实现代码
2013/06/10 PHP
php生成二维码时出现中文乱码的解决方法
2014/12/18 PHP
解决phpcms更换javascript的幻灯片代码调用图片问题
2014/12/26 PHP
Laravel 5框架学习之环境与配置
2015/04/08 PHP
PHP获取文件行数的方法
2015/06/10 PHP
jQuery 渐变下拉菜单
2009/12/15 Javascript
js实现网页收藏功能
2015/12/17 Javascript
原生js实现水平方向无缝滚动
2017/01/10 Javascript
JavaScript中localStorage对象存储方式实例分析
2017/01/12 Javascript
jQuery实现扑克正反面翻牌效果
2017/03/10 Javascript
js判断是否是手机页面
2017/03/17 Javascript
vue的基本用法与常见指令
2017/08/15 Javascript
微信小程序request请求后台接口php的实例详解
2017/09/20 Javascript
详解Vue webapp项目通过HBulider打包原生APP(vue+webpack+HBulider)
2019/02/02 Javascript
vue使用自定义指令实现拖拽
2021/01/29 Javascript
layui的表单提交以及验证和修改弹框的实例
2019/09/09 Javascript
ckeditor一键排版功能实现方法分析
2020/02/06 Javascript
python类继承与子类实例初始化用法分析
2015/04/17 Python
Python实现把json格式转换成文本或sql文件
2015/07/10 Python
Python socket 套接字实现通信详解
2019/08/27 Python
Python使用__new__()方法为对象分配内存及返回对象的引用示例
2019/09/20 Python
html5使用canvas实现图片下载功能的示例代码
2017/08/26 HTML / CSS
Aeropostale官网:美国著名校园品牌及青少年服饰品牌
2019/03/21 全球购物
英国123鲜花网站:123 Flowers
2019/07/07 全球购物
物业经理求职自我评价
2013/09/22 职场文书
仓库组长岗位职责
2014/01/29 职场文书
教师试用期自我鉴定
2014/02/12 职场文书
医院学雷锋活动策划方案
2014/02/15 职场文书
2015年四年级班主任工作总结
2015/10/22 职场文书
2016毕业实习单位评语大全
2015/12/01 职场文书
2016年企业先进员工事迹材料
2016/02/25 职场文书
大学生奖学金获奖感言(范文)
2019/08/15 职场文书
62句有关感恩节文案(推荐收藏)
2019/11/28 职场文书