sklearn.datasets.fetch_olivetti_faces¶
sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False)
从AT&T(分类)中加载Olivetti人脸数据集。
如有必要,请下载。
类 | 40 |
---|---|
样本总数 | 400 |
维度 | 4096 |
特征 | real, between 0 and 1 |
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
data_home | optional, default: None 为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。 |
shuffle | boolean, optional 如果为True,则将shuffle数据集的顺序,以避免对同一个人的图像进行分组。 |
random_state | int, RandomState instance or None, default=0 确定用于数据集shuffle的随机数生成。 为多个函数调用传递可重复输出的int值。 请参阅词汇表。 |
download_if_missing | optional, True by default 如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。 |
return_X_y | boolean, default=False. 如果为True,则返回(数据,目标)而不是Bunch对象。 有关data和target对象的更多信息,请参见下文。 0.22版中的新功能。 |
返回值 | 说明 |
---|---|
data | Bunch 类字典对象,具有以下属性。 - data:ndarray, shape (400, 4096) 每行对应于原始大小为64 x 64像素的散乱的面部图像。 - images:ndarray, shape (400, 64, 64) 每行是对应于数据集的40个主题之一的面部图像。 - target:ndarray, shape (400,) 与每个面部图像关联的标签。 这些标签的范围是0-39,并且与“主题ID”相对应。 - DESCR:str 修改后的Olivetti Faces数据集的描述。 |
(data, target) | tuple if return_X_y=True 0.22版中的新功能。 |