python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
Python发送email的3种方法
Apr 28 Python
Python使用回溯法子集树模板解决迷宫问题示例
Sep 01 Python
TensorFlow模型保存/载入的两种方法
Mar 08 Python
Python使用matplotlib绘制余弦的散点图示例
Mar 14 Python
python爬虫超时的处理的实例
Dec 19 Python
使用python将mysql数据库的数据转换为json数据的方法
Jul 01 Python
使用PyCharm进行远程开发和调试的实现
Nov 04 Python
python列表推导和生成器表达式知识点总结
Jan 10 Python
Python实现猜年龄游戏代码实例
Mar 25 Python
Python3以GitHub为例来实现模拟登录和爬取的实例讲解
Jul 30 Python
获取CSDN文章内容并转换为markdown文本的python
Sep 06 Python
Python中return函数返回值实例用法
Nov 19 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
《星际争霸II》全新指挥官斯台特曼现已上线
2020/03/08 星际争霸
php时间戳转换的示例
2014/03/31 PHP
PHP多态代码实例
2015/06/26 PHP
Yii2简单实现多语言配置的方法
2016/07/23 PHP
PHP命令空间namespace及use的用法小结
2017/11/27 PHP
thinkPHP5框架闭包函数与子查询传参用法示例
2018/08/02 PHP
js控制淡入淡出示例代码
2013/11/12 Javascript
获取下拉列表框的值是数组,split,$.inArray示例
2013/11/13 Javascript
JS将所有对象s的属性复制给对象r(原生js+jquery)
2014/01/25 Javascript
js函数参数设置默认值的一种变通实现方法
2014/05/26 Javascript
NodeJs中的VM模块详解
2015/05/06 NodeJs
JS实现把鼠标放到链接上出现滚动文字的方法
2016/04/06 Javascript
模拟javascript中的sort排序(简单实例)
2016/08/17 Javascript
js实现简单的手风琴效果
2017/02/27 Javascript
自适应布局meta标签中viewport、content、width、initial-scale、minimum-scale、maximum-scale总结
2017/08/18 Javascript
zTree节点文字过多的处理方法
2017/11/24 Javascript
vue中阻止click事件冒泡,防止触发另一个事件的方法
2018/02/08 Javascript
从零开始搭建一个react项目开发
2018/02/09 Javascript
vue.extend与vue.component的区别和联系
2018/09/19 Javascript
微信小程序基于picker实现级联菜单
2019/02/15 Javascript
Python中使用haystack实现django全文检索搜索引擎功能
2017/08/26 Python
python 遍历目录(包括子目录)下所有文件的实例
2018/07/11 Python
python3 unicode列表转换为中文的实例
2018/10/26 Python
pytorch 可视化feature map的示例代码
2019/08/20 Python
python实现按关键字筛选日志文件
2019/12/24 Python
python目标检测给图画框,bbox画到图上并保存案例
2020/03/10 Python
解决pymysql cursor.fetchall() 获取不到数据的问题
2020/05/15 Python
让IE9以下版本的浏览器兼容HTML5的方法
2014/03/12 HTML / CSS
美国体育用品商店:Rally House(NCAA、NFL、MLB、NBA、NHL和MLS)
2018/01/03 全球购物
英国网上电器商店:Electricshop
2020/03/15 全球购物
澳大利亚在线床零售商:Bedworks
2020/09/01 全球购物
毕业论文评语大全
2014/04/29 职场文书
电子工程求职信
2014/07/17 职场文书
家属慰问信
2015/02/14 职场文书
民事答辩状范本
2015/05/21 职场文书
职场:企业印章管理制度(模板)
2019/10/18 职场文书