在Python dataframe中出生日期转化为年龄的实现方法


Posted in Python onOctober 20, 2018

我们在做数据挖掘项目或大数据竞赛时,如果个体是人的时候,获得的数据中可能有出生日期的Series,举个简单例子,比如这样的一些数:

# -*- coding: utf-8 -*-
import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt %matplotlib inline
data = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']}
frame = DataFrame(data)
frame

在Python dataframe中出生日期转化为年龄的实现方法

从数据来看,'10/8/00'之类的数,最左边的数表示月份,中间的数表示日,最后的数表示年度。

实际上我们在分析时并不需要人的出生日期,而是需要年龄,不同的年龄阶段会有不同的状态,比如收入、健康、居住条件等等,且能够很好地把不同样本的差异性进行大范围的划分,而不是像出生日期那样包含信息量过大且在算法训练时不好作为有效数据进行训练,age是一个很好地特征工程指示变量。

那如何把上述birth数据变为年龄age呢?

在这里用到datetime这个库,如下:

(1)首先把birth转化为标准时间格式

frame['birth'] = pd.to_datetime(frame['birth'])
frame

在Python dataframe中出生日期转化为年龄的实现方法 

(2)获取当前时间的年份,并减去birth的年份

import datetime as dt
now_year =dt.datetime.today().year #当前的年份
frame['age']=now_year-frame.birth.dt.year
frame

在这里使用了dt.datetime.today().year来获取当前日期的年份,然后将birth数据中的年份数据提取出来(frame.birth.dt.year),两者相减就得到需要的年龄数据,如下:

在Python dataframe中出生日期转化为年龄的实现方法

有时候我们可能还会关注到人的出生月份与要预测变量的关系,比如人的星座就是很流行的一种以出生月份、日份来评估其对人的影响,也可以按这种方法去提取月、日数据。

总结

以上所述是小编给大家介绍的在Python dataframe中出生日期转化为年龄的实现方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python登录QQ邮箱发信的实现代码
Feb 10 Python
python中使用sys模板和logging模块获取行号和函数名的方法
Apr 15 Python
python 读写txt文件 json文件的实现方法
Oct 22 Python
pycharm中成功运行图片的配置教程
Oct 28 Python
python执行CMD指令,并获取返回的方法
Dec 19 Python
如何利用Anaconda配置简单的Python环境
Jun 24 Python
python 读取修改pcap包的例子
Jul 23 Python
对Django 中request.get和request.post的区别详解
Aug 12 Python
python实现视频读取和转化图片
Dec 10 Python
Python无头爬虫下载文件的实现
Apr 02 Python
使用Numpy对特征中的异常值进行替换及条件替换方式
Jun 08 Python
Django利用AJAX技术实现博文实时搜索
May 06 Python
Django中的ajax请求
Oct 19 #Python
Tesserocr库的正确安装方式
Oct 19 #Python
Python中Proxypool库的安装与配置
Oct 19 #Python
在cmder下安装ipython以及环境的搭建
Oct 19 #Python
破解安装Pycharm的方法
Oct 19 #Python
使用Selenium破解新浪微博的四宫格验证码
Oct 19 #Python
Selenium的使用详解
Oct 19 #Python
You might like
PHP实现分页的一个示例
2006/10/09 PHP
用PHP 快速生成 Flash 动画的方法
2007/03/06 PHP
PHP执行linux系统命令的常用函数使用说明
2010/04/27 PHP
php使用curl检测网页是否被百度收录的示例分享
2014/01/31 PHP
destoon在360浏览器下出现用户被强行注销的解决方法
2014/06/26 PHP
WordPress中给文章添加自定义字段及后台编辑功能区域
2015/12/19 PHP
Zend Framework教程之Zend_Registry对象用法分析
2016/03/22 PHP
php实现数组纵向转横向并过滤重复值的方法分析
2017/05/29 PHP
php实现微信和支付宝支付的示例代码
2020/08/11 PHP
jquery 鼠标滑动显示详情应用示例
2014/01/24 Javascript
jQuery判断元素是否存在的可靠方法
2014/05/06 Javascript
javascript事件委托的方式绑定详解
2015/06/10 Javascript
微信小程序 安全包括(框架、功能模块、账户使用)详解
2017/01/16 Javascript
VSCode 配置React Native开发环境的方法
2017/12/27 Javascript
JavaScript图片处理与合成总结
2018/03/04 Javascript
从vue源码看props的用法
2019/01/09 Javascript
Antd的table组件表格的序号自增操作
2020/10/27 Javascript
[55:25]2018DOTA2亚洲邀请赛3月29日 小组赛A组 VG VS OG
2018/03/30 DOTA
八大排序算法的Python实现
2021/01/28 Python
windows10下python3.5 pip3安装图文教程
2018/04/02 Python
python sys,os,time模块的使用(包括时间格式的各种转换)
2018/04/27 Python
python数据库编程 ODBC方式实现通讯录
2020/03/27 Python
python代码实现将列表中重复元素之间的内容全部滤除
2020/05/22 Python
Python如何对XML 解析
2020/06/28 Python
python中逻辑与或(and、or)和按位与或异或(&、|、^)区别
2020/08/05 Python
详解Python遍历列表时删除元素的正确做法
2021/01/07 Python
详解CSS3 Media Queries中媒体属性的使用
2016/02/29 HTML / CSS
Banggood官网:面向全球客户的综合商城
2017/04/19 全球购物
经典优秀个人求职自荐信格式
2013/09/25 职场文书
信息技术专业大学生职业生涯规划书
2014/01/24 职场文书
2014年班主任自我评价范文
2014/04/23 职场文书
诚信考试标语
2014/06/24 职场文书
教师个人考察材料
2014/12/16 职场文书
勤俭节约倡议书范文
2015/04/29 职场文书
2015年度物流工作总结
2015/04/30 职场文书
2016年大学生暑期社会实践方案
2015/11/26 职场文书