sklearn.datasets.fetch_olivetti_faces

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False)

[源码]

从AT&T(分类)中加载Olivetti人脸数据集。

如有必要,请下载。

40
样本总数 400
维度 4096
特征 real, between 0 and 1

用户指南中阅读更多内容。

参数 说明
data_home optional, default: None
为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。
shuffle boolean, optional
如果为True,则将shuffle数据集的顺序,以避免对同一个人的图像进行分组。
random_state int, RandomState instance or None, default=0
确定用于数据集shuffle的随机数生成。 为多个函数调用传递可重复输出的int值。 请参阅词汇表
download_if_missing optional, True by default
如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。
return_X_y boolean, default=False.
如果为True,则返回(数据,目标)而不是Bunch对象。 有关data和target对象的更多信息,请参见下文。

0.22版中的新功能。
返回值 说明
data Bunch
类字典对象,具有以下属性。
- data:ndarray, shape (400, 4096)
每行对应于原始大小为64 x 64像素的散乱的面部图像。
- images:ndarray, shape (400, 64, 64)
每行是对应于数据集的40个主题之一的面部图像。
- target:ndarray, shape (400,)
与每个面部图像关联的标签。 这些标签的范围是0-39,并且与“主题ID”相对应。
- DESCR:str
修改后的Olivetti Faces数据集的描述。
(data, target) tuple if return_X_y=True
0.22版中的新功能。