sklearn.datasets.load_iris

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False

[源码]

加载并返回iris(鸢尾花)数据集(分类)。

iris数据集是经典且非常容易的多类分类数据集。

3
每类样本数 50
样本总数 150
维度 4
特征 real, positive

在用户指南中阅读更多内容。

参数 说明
return_X_y bool, default=False.
如果为True,则返回(data, target)而不是Bunch对象。 有关data和target对象的更多信息,请参见下文。

版本0.18中的新功能。
as_frame bool, default=False
如果为True,则数据为pandas DataFrame,其中包含具有适当dtypes(numeric, string或categorical)的列。 target是pandas DataFrame还是Series,取决于目标列的数量。如果return_X_y为True,则(data, target)为pandas DataFrame或Series,如下所述。

0.23版中的新功能。
返回值 说明
data Bunch
类字典对象,具有以下属性。
data:{ndarray, dataframe} of shape (20, 3)
数据矩阵。如果as_frame = True,则数据为pandas DataFrame。
- target: {ndarray, dataframe} of shape (20, 3)
回归target。 如果as_frame = True,则目标为pandas DataFrame。
- feature_names: list
数据集列的名称。
- target_names: list
target列的名称。
- frame: DataFrame of shape (20, 6)
仅在as_frame = True时存在。具有data和target的DataFrame。

0.23版中的新功能。
- DESCR: str
数据集的完整描述。
- data_filename: str
数据位置的路径。
- target_filename: str
target位置的路径。

0.20版中的新功能。
(data, target) tuple if return_X_y is True
版本0.18中的新功能。