sklearn.datasets.make_gaussian_quantiles

sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)

[源码]

通过分位数生成各向同性的高斯并标记样本

通过采用多维标准正态分布并定义由嵌套的同心多维球体分隔的类,以使每个类中的样本数量大致相等(分配)。

在用户指南中阅读更多内容。

参数 说明
mean array of shape [n_features], optional (default=None)
多维正态分布的均值。如果为None,则使用原点(0,0,…)。
cov float, optional (default=1.)
协方差矩阵将是该值乘以单位矩阵。该数据集仅产生对称正态分布。
n_samples int, optional (default=100)
总点数在各类之间平均分配。
n_features int, optional (default=2)
每个样本的特征数量。
n_classes int, optional (default=3)
类的数量。
shuffle boolean, optional (default=True)
shuffle样本。
random_state int, RandomState instance, default=None
确定用于生成数据集的随机数生成。 为多个函数调用传递可重复输出的int值。 请参阅词汇表
返回值 说明
X array of shape [n_samples, n_features]
生成的样本。
y array of shape [n_samples]
每个样本的分位数隶属关系的整数标签。

数据集来自Zhu等人[1]。

参考

  • 1

    Zhu, H. Zou, S. Rosset, T. Hastie, “Multi-class AdaBoost”, 2009.

sklearn.datasets.make_gaussian_quantiles使用示例