Python中的相关分析correlation analysis的实现


Posted in Python onAugust 29, 2019

相关分析(correlation analysis)

研究两个或两个以上随机变量之间相互依存关系的方向和密切程度的方法。
线性相关关系主要采用皮尔逊(Pearson)相关系数r来度量连续变量之间线性相关强度;
r>0,线性正相关;r<0,线性负相关;
r=0,两个变量之间不存在线性关系,并不代表两个变量之间不存在任何关系。

Python中的相关分析correlation analysis的实现

相关分析函数
DataFrame.corr()
Series.corr(other)

函数说明:
如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度
如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度

返回值:
DataFrame调用;返回DataFrame

Series调用:返回一个数值型,大小为相关度

import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
 File "<ipython-input-1-ae921a24967f>", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1
]
labels = [
  '20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'
]
 
data['年龄分层'] = pandas.cut(
  data.年龄, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年龄'], 
  index=['年龄分层'], 
  columns=['性别'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年龄    
性别     女   男
年龄分层        
20岁以及以下  111  1950
21岁到30岁 2903 43955
31岁到40岁  735  7994
41岁以上   567  886

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 动态获取当前运行的类名和函数名的方法
Apr 15 Python
python实现二叉查找树实例代码
Feb 08 Python
Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
May 16 Python
python通过ffmgep从视频中抽帧的方法
Dec 05 Python
Django框架中间件定义与使用方法案例分析
Nov 28 Python
最小二乘法及其python实现详解
Feb 24 Python
基于Numba提高python运行效率过程解析
Mar 02 Python
使用python 计算百分位数实现数据分箱代码
Mar 03 Python
Django获取model中的字段名和字段的verbose_name方式
May 19 Python
在keras中对单一输入图像进行预测并返回预测结果操作
Jul 09 Python
Python 数据结构之十大经典排序算法一文通关
Oct 16 Python
Python采集爬取京东商品信息和评论并存入MySQL
Apr 12 Python
python中单下划线(_)和双下划线(__)的特殊用法
Aug 29 #Python
python 计算两个列表的相关系数的实现
Aug 29 #Python
python同步windows和linux文件
Aug 29 #Python
python中几种自动微分库解析
Aug 29 #Python
详解python中index()、find()方法
Aug 29 #Python
python同步两个文件夹下的内容
Aug 29 #Python
Python中 CSV格式清洗与转换的实例代码
Aug 29 #Python
You might like
mysql 中InnoDB和MyISAM的区别分析小结
2008/04/15 PHP
为PHP初学者的8点有效建议
2010/11/20 PHP
ECSHOP完美解决Deprecated: preg_replace()报错的问题
2016/05/17 PHP
验证坐标在某坐标区域内php代码
2016/10/08 PHP
JavaScript 设计模式之组合模式解析
2010/04/09 Javascript
javascript实现限制上传文件大小
2015/02/06 Javascript
如何利用模板将HTML从JavaScript中抽离
2016/10/08 Javascript
js 获取今天以及过去日期
2017/04/11 Javascript
推荐三款日期选择插件(My97DatePicker、jquery.datepicker、Mobiscroll)
2017/04/21 jQuery
jQuery extend()详解及简单实例
2017/05/06 jQuery
Nodejs调用WebService的示例代码
2017/09/29 NodeJs
JavaScript防止全局变量污染的方法总结
2018/08/02 Javascript
Element UI 自定义正则表达式验证方法
2018/09/04 Javascript
在 Vue 应用中使用 Netlify 表单功能的方法详解
2019/06/03 Javascript
一次让你了解全部JavaScript的作用域
2019/06/24 Javascript
JavaScript算法学习之冒泡排序和选择排序
2019/11/02 Javascript
vue.js页面加载执行created,mounted的先后顺序说明
2020/11/07 Javascript
Python开发WebService系列教程之REST,web.py,eurasia,Django
2014/06/30 Python
Python学习之用pygal画世界地图实例
2017/12/07 Python
pycharm下查看python的变量类型和变量内容的方法
2018/06/26 Python
python opencv实现旋转矩形框裁减功能
2018/07/25 Python
深入了解和应用Python 装饰器 @decorator
2019/04/02 Python
大家都说好用的Python命令行库click的使用
2019/11/07 Python
PyCharm刷新项目(文件)目录的实现
2020/02/14 Python
python 使用raw socket进行TCP SYN扫描实例
2020/05/05 Python
AmazeUI 折叠面板的实现代码
2020/08/17 HTML / CSS
C/C++ 笔试、面试题目大汇总
2015/11/21 面试题
老师推荐信
2013/10/28 职场文书
机电职业生涯规划书范文
2014/03/08 职场文书
入股协议书范本
2014/04/14 职场文书
五分钟演讲稿
2014/04/30 职场文书
学校党的群众路线教育实践活动整改措施
2014/10/25 职场文书
品质保证书格式
2015/02/28 职场文书
tensorboard 可视化之localhost:6006不显示的解决方案
2021/05/22 Python
mysql 直接拷贝data 目录下文件还原数据的实现
2021/07/25 MySQL
MySQL配置主从服务器(一主多从)
2021/08/07 MySQL