python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
Python下线程之间的共享和释放示例
May 04 Python
PYTHON压平嵌套列表的简单实现
Jun 08 Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 Python
Python实现京东秒杀功能代码
May 16 Python
python启动应用程序和终止应用程序的方法
Jun 28 Python
Django实现微信小程序的登录验证功能并维护登录态
Jul 04 Python
flask框架路由常用定义方式总结
Jul 23 Python
解决Django migrate不能发现app.models的表问题
Aug 31 Python
python爬虫爬取监控教务系统的思路详解
Jan 08 Python
python GUI库图形界面开发之PyQt5滑块条控件QSlider详细使用方法与实例
Feb 28 Python
记录模型训练时loss值的变化情况
Jun 16 Python
Python自动化操作实现图例绘制
Jul 09 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
转换中文日期的PHP程序
2006/10/09 PHP
杏林同学录(四)
2006/10/09 PHP
php数组总结篇(一)
2008/09/30 PHP
PHP5 面向对象(学习记录)
2009/12/02 PHP
php分页思路以及在ZF中的使用
2012/05/30 PHP
php汉字转拼音的示例
2014/02/27 PHP
php禁用cookie后session设置方法分析
2016/10/19 PHP
JQuery 学习技巧总结
2010/05/21 Javascript
jQuery学习笔记之jQuery选择器的使用
2010/12/22 Javascript
jQuery之end()和pushStack()使用介绍
2012/02/07 Javascript
根据经纬度计算地球上两点之间的距离js实现代码
2013/03/05 Javascript
js控制淡入淡出示例代码
2013/11/12 Javascript
jquery Tab效果和动态加载的简单实例
2013/12/11 Javascript
全面解析Bootstrap布局组件应用
2016/02/22 Javascript
JS 实现Base64编码与解码实例详解
2016/11/07 Javascript
JS定时器用法分析【时钟与菜单中的应用】
2016/12/21 Javascript
Node.js简单入门前传
2017/08/21 Javascript
使用watch监听路由变化和watch监听对象的实例
2018/02/24 Javascript
js数据类型转换与流程控制操作实例分析
2019/12/18 Javascript
微信h5静默和非静默授权获取用户openId的方法和步骤
2020/06/08 Javascript
基于vue.js仿淘宝收货地址并设置默认地址的案例分析
2020/08/20 Javascript
Python中的多重装饰器
2015/04/11 Python
利用Python中的pandas库对cdn日志进行分析详解
2017/03/07 Python
解决python 自动安装缺少模块的问题
2018/10/22 Python
解决pyttsx3无法封装的问题
2018/12/24 Python
python编写一个会算账的脚本的示例代码
2020/06/02 Python
html5使用canvas实现弹幕功能示例
2017/09/11 HTML / CSS
马来西亚与新加坡长途巴士售票网站:BusOnlineTicket.com
2018/11/05 全球购物
澳大利亚优惠网站:Deals.com.au
2019/07/02 全球购物
浪费资源的建议书
2014/03/12 职场文书
学生请假条格式
2014/04/11 职场文书
诚信贷款承诺书
2014/05/30 职场文书
教师自我剖析材料(四风问题)
2014/09/30 职场文书
年终工作总结范文2014
2014/11/27 职场文书
Redis中有序集合的内部实现方式的详细介绍
2022/03/16 Redis
SpringBoot中HttpSessionListener的简单使用方式
2022/03/17 Java/Android