python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
不可错过的十本Python好书
Jul 06 Python
Python Socket使用实例
Dec 18 Python
Python常用的json标准库
Feb 19 Python
python的一些加密方法及python 加密模块
Jul 11 Python
python图片二值化提高识别率代码实例
Aug 24 Python
python针对mysql数据库的连接、查询、更新、删除操作示例
Sep 11 Python
Django数据库操作之save与update的使用
Apr 01 Python
利用4行Python代码监测每一行程序的运行时间和空间消耗
Apr 22 Python
3种适用于Python的疯狂秘密武器及原因解析
Apr 29 Python
解决Django Haystack全文检索为空的问题
May 19 Python
Python多个装饰器的调用顺序实例解析
May 22 Python
python opencv pytesseract 验证码识别的实现
Aug 28 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
PHP实现简单搜歌的方法
2015/07/28 PHP
PHP使用new StdClass()创建空对象的方法分析
2017/06/06 PHP
关于Curl在Swoole协程中的解决方案详析
2019/09/12 PHP
javascript 拖放效果实现代码
2010/01/22 Javascript
JavaScript类和继承 constructor属性
2010/03/04 Javascript
Javascript动态绑定事件的简单实现代码
2010/12/25 Javascript
js字符串转成JSON
2013/11/07 Javascript
node.js中的fs.symlink方法使用说明
2014/12/15 Javascript
Javascript 实现图片无缝滚动
2014/12/19 Javascript
js实现模拟计算器退格键删除文字效果的方法
2015/05/07 Javascript
第五章之BootStrap 栅格系统
2016/04/25 Javascript
浅谈javascript中的Function和Arguments
2016/08/30 Javascript
jQuery Ajax请求后台数据并在前台接收
2016/12/10 Javascript
JS实现的加减乘除四则运算计算器示例
2017/08/09 Javascript
jquery实现限制textarea输入字数的方法
2017/09/06 jQuery
JS+jQuery实现注册信息的验证功能
2017/09/26 jQuery
Bootstrap 中data-[*] 属性的整理
2018/03/13 Javascript
JavaScript中的"=、==、==="区别讲解
2019/01/22 Javascript
JS实现处理时间,年月日,星期的公共方法示例
2019/05/31 Javascript
React倒计时功能实现代码——解耦通用
2020/09/18 Javascript
用Python实现一个简单的线程池
2015/04/07 Python
Python下实现的RSA加密/解密及签名/验证功能示例
2017/07/17 Python
python发送告警邮件脚本
2018/09/17 Python
Python中Proxypool库的安装与配置
2018/10/19 Python
python调用百度地图WEB服务API获取地点对应坐标值
2019/01/16 Python
在python中,使用scatter绘制散点图的实例
2019/07/03 Python
Pycharm如何导入python文件及解决报错问题
2020/05/10 Python
使用css3实现超炫的loading加载动画效果
2014/05/07 HTML / CSS
html5新增的属性和废除的属性简要概述
2013/02/20 HTML / CSS
世界上第一个创建了罩杯系统的美国内衣品牌:Maidenform
2019/03/23 全球购物
彪马土耳其官网:PUMA土耳其
2019/07/14 全球购物
以实惠的价格轻松租车,免费取消:Easyrentcars
2019/07/16 全球购物
新闻编辑自荐书范文
2014/02/12 职场文书
毕业晚会主持词
2014/03/24 职场文书
论文指导教师评语
2014/04/28 职场文书
大学生学习计划书
2014/09/15 职场文书