sklearn 基础教程

sklearn 特征工程

sklearn 基础教程

sklearn 分类算法

sklearn 回归算法

sklearn 笔记

original icon
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.knowledgedict.com/tutorial/sklearn-intro.html

sklearn 简介


sklearn 是 scikit-learn 的简写,它是一款基于 python 编程语言的开源机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k-means 和 DBSCAN 等,并且可以与 python 数值库 NumPy 及科学库  SciPy 进行互操作。

sklearn 发展历史

这个 scikit-learn 项目最初是作为 scikits.learn 开始的,最初由 David Cournapeau 在2007年开发的 Google Summer of Code 的一个项目。它的名字来源于它是一个“SciKit”(SciPy 工具包)的概念,它是 SciPy 的一个单独开发和分布的第三方扩展。原始代码库后来被其他开发人员重写。2010年,来自法国计算机科学与自动化研究所(INRIA)的 Fabian Pedregosa,Gael Varoquaux,Alexandre Gramfort 和 Vincent Michel 领导了该项目并于2010年2月1日首次公开发布。

版本历史:

  • 2018年9月25日,scikit-learn 0.20.0 发布。值得注意的是,0.20 是最后一个支持 Python 2.7 和 Python 3.4 的版本。0.21 版本开始需要 Python 3.5 或者更高的 Python 版本。 
  • 2017年10月,scikit-learn 0.19.1 发布。
  • 2017年7月,scikit-learn 0.19.0 发布。
  • 2017年6月,scikit-learn 0.18.2 发布。
  • 2016年9月,scikit-learn 0.18.0 发布。
  • 2015年11月,scikit-learn 0.17.0 发布。
  • 2015年3月,scikit-learn 0.16.0 发布。
  • 2014年7月,scikit-learn 0.15.0 发布。
  • 2013年8月,scikit-learn 0.14 发布。

sklearn 特点

  • 简单高效的数据挖掘和数据分析工具。
  • 建立在 NumPy,SciPy 和 matplotlib上。
  • 开源软件,可商业使用,基于 BSD 开源授权许可协议。