python画学习曲线_python机器学习之learning_curve（学习曲线）

1.导包：from sklearn.model_selection import learning_curve2.函数的调用格式：learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learni

weixin_39638929

820人浏览 · 2020-12-09 14:35:22

weixin_39638929 · 2020-12-09 14:35:22 发布

1.导包：

from sklearn.model_selection import learning_curve

2.函数的调用格式：

learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch=‘all’, verbose=0)

3.函数的作用：对于不同大小的训练集，确定交叉验证训练和测试的分数。一个交叉验证发生器将整个数据集分割k次，分割成训练集和测试集。不同大小的训练集的子集将会被用来训练评估器并且对于每一个大小的训练子集都会产生一个分数，然后测试集的分数也会计算。然后，对于每一个训练子集，运行k次之后的所有这些分数将会被平均。

4.参数详解：

estimator：所使用的分类器

X官方解释：array-like, shape (n_samples, n_features)

训练向量，n_samples是样本的数量，n_features是特征的数量

y官方解释：array-like, shape (n_samples) or (n_samples, n_features), optional

目标相对于X分类或者回归

train_sizes：官方解释:array-like, shape (n_ticks,), dtype float or int

训练样本的相对的或绝对的数字，这些量的样本将会生成learning curve。如果dtype是float，他将会被视为最大数量训练集的一部分(这个由所选择的验证方法所决定)。否则，他将会被视为训练集的绝对尺寸。要注意的是，对于分类而言，样本的大小必须要充分大，达到对于每一个分类都至少包含一个样本的情况。

cv:官方解释：int, cross-validation generator or an iterable, optional

确定交叉验证的分离策略

–None，使用默认的3-fold cross-validation,

–integer,确定是几折交叉验证

–一个作为交叉验证生成器的对象

–一个被应用于训练/测试分离的迭代器

n_jobs : 整数，可选并行运行的作业数(默认值为1)。windows开多线程需要在"name"==__main__中运行。

**verbose

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐