Python 机器学习工具包SKlearn的安装与使用


Posted in Python onMay 14, 2021

1、SKlearn 是什么

  Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

  Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

  Sklearn 包括六大功能模块:

  • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
  • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
  • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
  • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
  • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
  • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
  • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

Python 机器学习工具包SKlearn的安装与使用

  官网地址:https://scikit-learn.org/

  官方文档中文版: https://www.scikitlearn.com.cn/

  内置数据集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安装

  Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

  pip 安装命令:  

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

  注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 内置数据集

  Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
  Sklearn 标准数据集主要包括:

测试问题数据集

  • 波士顿房价:Boston house prices dataset
  • 鸢尾花问题:Iris plants dataset
  • 糖尿病数据:Diabetes dataset
  • 手写数字的识别:Optical recognition of handwritten digits dataset
  • 体能训练:Linnerrud dataset
  • 葡萄酒鉴别:Wine recognition dataset
  • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

实际问题数据集

  • 人脸数据:The Olivetti faces dataset
  • 20个新闻文本数据:The 20 newsgroups text dataset
  • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
  • 森林覆盖类型:Forest covertypes
  • 路透社新闻数据:RCV1 dataset
  • 网络入侵检测数据:Kddcup 99 dataset
  • 加州住房数据:California Housing dataset

4、Sklearn 数模笔记的计划

  粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
  基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

Python 机器学习工具包SKlearn的安装与使用

以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Win7上搭建Cocos2d-x 3.1.1开发环境
Jul 03 Python
在Python中用has_key()方法查找键是否存在的教程
May 21 Python
Python搜索引擎实现原理和方法
Nov 27 Python
基于Python中capitalize()与title()的区别详解
Dec 09 Python
如何使用 Pylint 来规范 Python 代码风格(来自IBM)
Apr 06 Python
详解python Todo清单实战
Nov 01 Python
Python实现E-Mail收集插件实例教程
Feb 06 Python
windows上安装python3教程以及环境变量配置详解
Jul 18 Python
Python使用pymysql模块操作mysql增删改查实例分析
Dec 19 Python
基于MSELoss()与CrossEntropyLoss()的区别详解
Jan 02 Python
Python如何实现机器人聊天
Sep 10 Python
pycharm无法安装cv2模块问题
May 20 Python
python process模块的使用简介
May 14 #Python
django学习之ajax post传参的2种格式实例
May 14 #Python
Python djanjo之csrf防跨站攻击实验过程
python控制台打印log输出重复的解决方法
聊一聊python常用的编程模块
May 14 #Python
如何获取numpy array前N个最大值
May 14 #Python
使用pandas模块实现数据的标准化操作
You might like
php下HTTP Response中的Chunked编码实现方法
2008/11/19 PHP
谈谈php对接芝麻信用踩的坑
2016/12/01 PHP
Dom与浏览器兼容性说明
2010/10/25 Javascript
js单词形式的运算符
2014/05/06 Javascript
深入理解JavaScript系列(30):设计模式之外观模式详解
2015/03/03 Javascript
jQuery幻灯片带缩略图轮播效果代码分享
2015/08/17 Javascript
jQuery基于json与cookie实现购物车的方法
2016/04/15 Javascript
完美解决node.js中使用https请求报CERT_UNTRUSTED的问题
2017/01/08 Javascript
AngularJS表格添加序号的方法
2017/03/03 Javascript
react-router4 嵌套路由的使用方法
2017/07/24 Javascript
小程序点赞收藏功能的实现代码示例
2018/09/07 Javascript
玩转vue的slot内容分发
2018/09/22 Javascript
VueJS 取得 URL 参数值的方法
2019/07/19 Javascript
swiper自定义分页器的样式
2020/09/14 Javascript
关于Node.js中频繁修改代码重启服务器的问题
2020/10/15 Javascript
如何使用 JavaScript 操作浏览器历史记录 API
2020/11/24 Javascript
Python Property属性的2种用法
2015/06/21 Python
Python 'takes exactly 1 argument (2 given)' Python error
2016/12/13 Python
pandas获取groupby分组里最大值所在的行方法
2018/04/20 Python
Django框架使用富文本编辑器Uedit的方法分析
2018/07/31 Python
django云端留言板实例详解
2019/07/22 Python
利用Python的turtle库绘制玫瑰教程
2019/11/23 Python
浅谈pymysql查询语句中带有in时传递参数的问题
2020/06/05 Python
python软件都是免费的吗
2020/06/18 Python
python读取excel进行遍历/xlrd模块操作
2020/07/12 Python
美国顶级防滑鞋:Shoes For Crews
2017/03/27 全球购物
罗马尼亚购物网站:Vivantis.ro
2019/07/20 全球购物
介绍一下Java中的static关键字
2012/05/12 面试题
院药学专业个人求职信
2013/09/21 职场文书
村创先争优活动总结
2014/08/28 职场文书
中层领导干部群众路线对照检查材料思想汇报
2014/10/02 职场文书
小班上学期个人总结
2015/02/12 职场文书
放射科岗位职责
2015/02/14 职场文书
会计实训总结范文
2015/08/03 职场文书
四十九个javascript小知识实用技巧
2021/11/20 Javascript
python数据分析之单因素分析线性拟合及地理编码
2022/06/25 Python