sklearn.datasets.fetch_covtype¶
sklearn.datasets.fetch_covtype(*, data_home=None, download_if_missing=True, random_state=None, shuffle=False, return_X_y=False)
加载covertype数据集(分类)。
如有必要,请下载。
类 | 7 |
---|---|
样本总数 | 581012 |
Dimensionality | 54 |
特征 | int |
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
data_home | string, optional 为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。 |
download_if_missing | boolean, default=True 如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。 |
random_state | int, RandomState instance, default=None 确定用于数据集改组的随机数生成。 为多个函数调用传递可重复输出的int值。 请参阅词汇表。 |
shuffle | bool, default=False 是否shuffle数据集。 |
return_X_y | boolean, default=False 如果为True,则返回(data.data,data.target)而不是Bunch对象。 0.20版中的新功能。 |
返回值 | 说明 |
---|---|
dataset | Bunch 类字典对象,具有以下属性。 - data: numpy array of shape (581012, 54) 每行对应于数据集中的54个要素。 - target: numpy array of shape (581012,) 每个值对应于7种forest covertypes之一,其值在1到7之间。 - DESCR: str forest covertype数据集的描述。 |
(data, target) | tuple if return_X_y is True0.20版中的新功能。 |