datasets.fetch_species_distributions

sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True)

[源码]

Phillips等人的物种分布数据集加载程序。 等 (2006年)

用户指南中阅读更多内容。

参数 说明
data_home optional, default: None
为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。
download_if_missing optional, True by default
如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。
返回值 说明
data Bunch
类字典对象,具有以下属性。
- coverages:array, shape = [14, 1592, 1212]
这些代表在地图网格的每个点测量的14个特征。 下面讨论了网格的纬度/经度值。 缺少的数据由值-9999表示。
- trainrecord array, shape = (1624,)
数据的训练点。 每个点都有三个字段:

train ['species']是物种名称

train ['dd long']是经度,以度为单位

train [‘dd lat’]是纬度,以度为单位
- testrecord array, shape = (620,)
数据的测试点。其格式与训练数据相同。
- Nx, Ny:integers
网格中的经度(x)和纬度(y)数
- x_left_lower_corner, y_left_lower_cornerfloats
左下角的(x,y)位置,以度为单位
- grid_sizefloat
网格点之间的间距,以度为单位

该数据集表示物种的地理分布。该数据集是由Phillips等提供(2006)。

这两个物种是:

sklearn.datasets.fetch_species_distributions使用示例