sklearn.datasets.fetch_lfw_people

sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70195None), slice(78172None)), download_if_missing=True, return_X_y=False)

[源码]

将带标签的人脸加载到Wild(LFW)人群数据集中(分类)。

如有必要,请下载。

5749
样本总数 13233
维度 5828
特征 real, between 0 and 255

用户指南中阅读更多内容。

参数 说明
data_home optional, default: None
为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。
funneled oolean, optional, default: True
下载并使用数据集的漏斗形变体。
resize float, optional, default 0.5
用于调整每张脸部图片尺寸的比率。
min_faces_per_person int, optional, default None
提取的数据集将仅保留具有至少min_faces_per_person个不同图片的人的图片。
color boolean, optional, default False
保留3个RGB通道,而不是将它们平均为一个灰度通道。 如果color为True,则数据的形状比color = False的形状多一维。
slice_ optional
提供自定义2D切片(高度,宽度)以提取jpeg文件的“interest”部分,并避免使用背景的统计相关性
download_if_missing optional, True by default
如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。
return_X_y boolean, default=False.
如果为True,则返回(dataset.data,dataset.target)而不是Bunch对象。 请参阅下文,以获取有关dataset.data和dataset.target对象的更多信息。

0.20版中的新功能。
返回值 说明
dataset Bunch
类字典对象,具有以下属性。
- data:numpy array of shape (13233, 2914)
每行对应于原始大小为62 x 47像素的散乱的面部图像。 更改slice_或resize参数将更改输出的形状。
- images:numpy array of shape (13233, 62, 47)
每行是对应于数据集中5749个人之一的面部图像。 更改slice_或resize参数将更改输出的形状。
- target:numpy array of shape (13233,)
与每个面部图像关联的标签。这些标签的范围是0-5748,并对应于人员ID。
- DESCR:string
Wild(LFW)数据集中的带标签的人脸的描述。
(data, target) tuple if return_X_y is True
0.20版中的新功能。

sklearn.datasets.fetch_lfw_people使用示例