sklearn.datasets.make_gaussian_quantiles¶
sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)
通过分位数生成各向同性的高斯并标记样本
通过采用多维标准正态分布并定义由嵌套的同心多维球体分隔的类,以使每个类中的样本数量大致相等(分配)。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
mean | array of shape [n_features], optional (default=None) 多维正态分布的均值。如果为None,则使用原点(0,0,…)。 |
cov | float, optional (default=1.) 协方差矩阵将是该值乘以单位矩阵。该数据集仅产生对称正态分布。 |
n_samples | int, optional (default=100) 总点数在各类之间平均分配。 |
n_features | int, optional (default=2) 每个样本的特征数量。 |
n_classes | int, optional (default=3) 类的数量。 |
shuffle | boolean, optional (default=True) shuffle样本。 |
random_state | int, RandomState instance, default=None 确定用于生成数据集的随机数生成。 为多个函数调用传递可重复输出的int值。 请参阅词汇表。 |
返回值 | 说明 |
---|---|
X | array of shape [n_samples, n_features] 生成的样本。 |
y | array of shape [n_samples] 每个样本的分位数隶属关系的整数标签。 |
注
数据集来自Zhu等人[1]。
参考
1
Zhu, H. Zou, S. Rosset, T. Hastie, “Multi-class AdaBoost”, 2009.