sklearn.datasets.load_digits¶

sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)

[源码]

加载并返回数字数据集（分类）。

每个数据点都是一个8x8的数字图像。

类	10
每类的样本数	~180
样本总数	1797
维度	64
特征	integers 0-16

在用户指南中阅读更多内容。

参数	说明
n_class	integer, between 0 and 10, optional (default=10) 返回的类数。
return_X_y	bool, default=False. 如果为True，则返回（data, target）而不是Bunch对象。有关data和target对象的更多信息，请参见下文。版本0.18中的新功能。
as_frame	bool, default=False 如果为True，则数据为pandas DataFrame，其中包含具有适当dtypes（numeric）的列。根据目标列的数量，目标是pandas DataFrame或Series。如果return_X_y为True，则（data,target）将是pandas DataFrame或Series，如下所述。 0.23版中的新功能。

返回值说明

data Bunch
类字典对象，具有以下属性。
- data{ndarray, dataframe} of shape (1797, 64)
展平的数据矩阵。如果as_frame = True，则数据将为pandas DataFrame。
- target: {ndarray, Series} of shape (1797,)
分类目标。如果as_frame = True，target将是pandas系列。
- feature_names: list
数据集列的名称。
- target_names: list
目标类的名称。

0.20版中的新功能。
- frame: DataFrame of shape (1797, 65)
仅在as_frame = True时存在。具有data和target的DataFrame。

0.23版中的新功能。
- images: {ndarray} of shape (1797, 8, 8)
原始图像数据。
- DESCR: str
数据集的完整描述。

(data, target) tuple if return_X_y is True
版本0.18中的新功能。

返回值	说明
data	`Bunch` 类字典对象，具有以下属性。 - data{ndarray, dataframe} of shape (1797, 64) 展平的数据矩阵。如果as_frame = True，则数据将为pandas DataFrame。 - target: {ndarray, Series} of shape (1797,) 分类目标。如果as_frame = True，target将是pandas系列。 - feature_names: list 数据集列的名称。 - target_names: list 目标类的名称。 0.20版中的新功能。 - frame: DataFrame of shape (1797, 65) 仅在as_frame = True时存在。具有data和target的DataFrame。 0.23版中的新功能。 - images: {ndarray} of shape (1797, 8, 8) 原始图像数据。 - DESCR: str 数据集的完整描述。
(data, target)	tuple if `return_X_y` is True 版本0.18中的新功能。

这是UCI ML手写数字数据集测试集的副本

https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

示例

加载数据并可视化图像：

>>> from sklearn.datasets import load_digits
>>> digits = load_digits()
>>> print(digits.data.shape)
(1797, 64)
>>> import matplotlib.pyplot as plt 
>>> plt.gray() 
>>> plt.matshow(digits.images[0]) 
>>> plt.show()