sklearn.datasets.load_wine

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)

[源码]

加载并返回葡萄酒数据集(分类)。

版本0.18中的新功能。

葡萄酒数据集是经典且非常容易的多类别分类数据集。

3
每类样本数 [59,71,48]
样本总数 178
维度 13
特征 real, positive

在用户指南中阅读更多内容。

参数 说明
return_X_y bool, default=False.
如果为True,则返回(data, target)而不是Bunch对象。 有关data和target对象的更多信息,请参见下文。
as_frame bool, default=False
如果为True,则数据为pandas DataFrame,其中包含具有适当dtypes(numeric)的列。target是pandas DataFrame还是Series,取决于目标列的数量。如果return_X_y为True,则(data,target)将是pandas DataFrame或Series,如下所述。

0.23版中的新功能。
返回值 说明
data Bunch
类字典对象,具有以下属性。
- data:{ndarray, dataframe} of shape (178, 13)
数据矩阵。 如果as_frame = True,则数据将为pandas DataFrame。
- target:{ndarray, Series} of shape (178,)
分类target。如果as_frame = True,target为pandas系列。
- feature_names: list
数据集列的名称。
- target_names: list
target类的名称。
- frame: DataFrame of shape (178, 14)
仅在as_frame = True时存在。具有data和target的DataFrame。

0.23版中的新功能。
- DESCR: str
数据集的完整描述。
(data, target) tuple if return_X_y is True
下载并修改了UCI ML Wine数据集数据集的副本以适合
标准格式来自:
https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

示例

假设您对示例10、80和140感兴趣,并想知道它们的类名。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[1080140]]
array([012])
>>> list(data.target_names)
['class_0''class_1''class_2']