Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python的time模块中的常用方法整理
Jun 18 Python
使用Python对IP进行转换的一些操作技巧小结
Nov 09 Python
CentOS 6.5下安装Python 3.5.2(与Python2并存)
Jun 05 Python
Python PyQt5标准对话框用法示例
Aug 23 Python
Python中的Django基本命令实例详解
Jul 15 Python
pycharm的console输入实现换行的方法
Jan 16 Python
在notepad++中实现直接运行python代码
Dec 18 Python
pytorch实现保证每次运行使用的随机数都相同
Feb 20 Python
Python GUI库PyQt5样式QSS子控件介绍
Feb 25 Python
python 邮件检测工具mmpi的使用
Jan 04 Python
Django drf请求模块源码解析
Jun 08 Python
PyTorch device与cuda.device用法
Apr 03 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
php提示无法加载或mcrypt没有找到 PHP 扩展 mbstring解决办法
2012/03/27 PHP
php class中public,private,protected的区别以及实例分析
2013/06/18 PHP
PHP实用函数分享之去除多余的0
2015/02/06 PHP
php简单实现批量上传图片的方法
2016/05/09 PHP
php获取微信基础接口凭证Access_token
2018/08/23 PHP
javascript 用原型继承来实现对象系统
2010/03/22 Javascript
jQuery代码优化 选择符篇
2011/11/01 Javascript
怎样在JavaScript里写一个swing把数据插入数据库
2012/12/10 Javascript
关于JS字符串函数String.replace()
2013/04/07 Javascript
JS的get和set使用示例
2014/02/20 Javascript
JQuery打造省市下拉框联动效果
2014/05/18 Javascript
jquery 3D 标签云示例代码
2014/06/12 Javascript
关闭页面window.location事件未执行的原因及解决方法
2014/09/01 Javascript
在linux中使用包管理器安装node.js
2015/03/13 Javascript
AngularJs directive详解及示例代码
2016/09/01 Javascript
基于jQuery实现的幻灯图片切换
2016/12/02 Javascript
详解基于angular路由的requireJs按需加载js
2017/01/20 Javascript
Angularjs中数据绑定的实例详解
2017/08/25 Javascript
vue2.0的虚拟DOM渲染思路分析
2018/08/09 Javascript
详解如何模拟实现node中的Events模块(通俗易懂版)
2019/04/15 Javascript
微信打开网址添加在浏览器中打开提示的办法
2019/05/20 Javascript
jQuery利用cookie 实现本地收藏功能(不重复无需多次命名)
2019/11/07 jQuery
JavaScript实现手机号码 3-4-4格式并控制新增和删除时光标的位置
2020/06/02 Javascript
[45:50]完美世界DOTA2联赛PWL S3 CPG vs Forest 第二场 12.16
2020/12/17 DOTA
Tensorflow简单验证码识别应用
2017/05/25 Python
Python列表list排列组合操作示例
2018/12/18 Python
Python数据模型与Python对象模型的相关总结
2021/01/26 Python
如何用Lucene索引数据库
2016/02/23 面试题
酒店个人培训自我鉴定
2013/12/11 职场文书
留学生如何写好自荐信
2013/12/27 职场文书
优秀安全员事迹材料
2014/05/11 职场文书
清明节演讲稿
2014/05/27 职场文书
接待员岗位职责
2015/02/13 职场文书
世界气象日活动总结
2015/02/27 职场文书
Python用tkinter实现自定义记事本的方法详解
2022/03/31 Python
关于JS中的作用域中的问题思考分享
2022/04/06 Javascript