sklearn.datasets.load_wine¶
sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)
加载并返回葡萄酒数据集(分类)。
版本0.18中的新功能。
葡萄酒数据集是经典且非常容易的多类别分类数据集。
类 | 3 |
---|---|
每类样本数 | [59,71,48] |
样本总数 | 178 |
维度 | 13 |
特征 | real, positive |
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
return_X_y | bool, default=False. 如果为True,则返回(data, target)而不是Bunch对象。 有关data和target对象的更多信息,请参见下文。 |
as_frame | bool, default=False 如果为True,则数据为pandas DataFrame,其中包含具有适当dtypes(numeric)的列。target是pandas DataFrame还是Series,取决于目标列的数量。如果return_X_y为True,则(data,target)将是pandas DataFrame或Series,如下所述。 0.23版中的新功能。 |
返回值 | 说明 |
---|---|
data | Bunch 类字典对象,具有以下属性。 - data:{ndarray, dataframe} of shape (178, 13) 数据矩阵。 如果as_frame = True,则数据将为pandas DataFrame。 - target:{ndarray, Series} of shape (178,) 分类target。如果as_frame = True,target为pandas系列。 - feature_names: list 数据集列的名称。 - target_names: list target类的名称。 - frame: DataFrame of shape (178, 14) 仅在as_frame = True时存在。具有data和target的DataFrame。 0.23版中的新功能。 - DESCR: str 数据集的完整描述。 |
(data, target) | tuple if return_X_y is True下载并修改了UCI ML Wine数据集数据集的副本以适合 标准格式来自: https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data |
示例
假设您对示例10、80和140感兴趣,并想知道它们的类名。
>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
['class_0', 'class_1', 'class_2']