Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中特殊函数集锦
Jul 27 Python
Django 实现下载文件功能的示例
Mar 06 Python
Pandas标记删除重复记录的方法
Apr 08 Python
python爬取足球直播吧五大联赛积分榜
Jun 13 Python
利用python对Excel中的特定数据提取并写入新表的方法
Jun 14 Python
在ubuntu16.04中将python3设置为默认的命令写法
Oct 31 Python
Python 做曲线拟合和求积分的方法
Dec 29 Python
使用django和vue进行数据交互的方法步骤
Nov 11 Python
详解Python中字符串前“b”,“r”,“u”,“f”的作用
Dec 18 Python
python 解决Fatal error in launcher:错误问题
May 21 Python
python list的index()和find()的实现
Nov 16 Python
python APScheduler执行定时任务介绍
Apr 19 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
php 在线打包_支持子目录
2008/06/28 PHP
PHPWind 发帖回帖Api PHP版打包下载
2010/02/08 PHP
支持中文的php加密解密类代码
2011/11/27 PHP
destoon会员注册提示“数据校验失败(2)”解决方法
2014/06/21 PHP
laravel容器延迟加载以及auth扩展详解
2015/03/02 PHP
微信第三方登录(原生)demo【必看篇】
2017/05/26 PHP
JavaScript Event学习第五章 高级事件注册模型
2010/02/07 Javascript
可恶的ie8提示缺少id未定义
2014/03/20 Javascript
js正则表达式验证邮件地址
2015/11/12 Javascript
js删除数组元素、清空数组的简单方法(必看)
2016/07/27 Javascript
Vue.js常用指令汇总(v-if、v-for等)
2016/11/03 Javascript
微信小程序 简单DEMO布局,逻辑,样式的练习
2016/11/30 Javascript
解析Vue2.0双向绑定实现原理
2017/02/23 Javascript
解决bootstrap中使用modal加载kindeditor时弹出层文本框不能输入的问题
2017/06/05 Javascript
javascript数组定义的几种方法
2017/10/06 Javascript
js使用cookie实现记住用户名功能示例
2019/06/13 Javascript
关于微信小程序map组件z-index的层级问题分析
2019/07/09 Javascript
微信小程序开发之转发分享功能
2019/10/22 Javascript
node.js中 mysql 增删改查操作及async,await处理实例分析
2020/02/11 Javascript
[52:03]Secret vs VG 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/20 DOTA
python操作日期和时间的方法
2014/03/11 Python
Python数据结构与算法之链表定义与用法实例详解【单链表、循环链表】
2017/09/28 Python
Python使用pyh生成HTML文档的方法示例
2018/03/10 Python
实例讲解Python爬取网页数据
2018/07/08 Python
python 读取数据库并绘图的实例
2019/12/03 Python
python 使用opencv 把视频分割成图片示例
2019/12/12 Python
python 爬取疫情数据的源码
2020/02/09 Python
OpenCV利用python来实现图像的直方图均衡化
2020/10/21 Python
python 发送邮件的示例代码(Python2/3都可以直接使用)
2020/12/03 Python
HTML5 Canvas实现平移/放缩/旋转deom示例(附截图)
2013/07/04 HTML / CSS
英国顶级珠宝品牌之家:John Greed
2018/06/09 全球购物
美国椅子和沙发制造商:La-Z-Boy
2020/10/25 全球购物
高中教师个人工作总结
2015/02/10 职场文书
2015年档案管理员工作总结
2015/05/13 职场文书
干货分享:推荐信写作技巧!
2019/06/21 职场文书
「海贼王」112.9万粉丝纪念图标公布
2022/03/21 日漫