datasets.fetch_species_distributions¶
sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True)
Phillips等人的物种分布数据集加载程序。 等 (2006年)
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
data_home | optional, default: None 为数据集指定另一个下载和缓存文件夹。 默认情况下,所有scikit-learn数据都存储在“〜/ scikit_learn_data”子文件夹中。 |
download_if_missing | optional, True by default 如果为False,则在数据不在本地可用时引发IOError,而不是尝试从源站点下载数据。 |
返回值 | 说明 |
---|---|
data | Bunch 类字典对象,具有以下属性。 - coverages:array, shape = [14, 1592, 1212] 这些代表在地图网格的每个点测量的14个特征。 下面讨论了网格的纬度/经度值。 缺少的数据由值-9999表示。 - trainrecord array, shape = (1624,) 数据的训练点。 每个点都有三个字段: train ['species']是物种名称 train ['dd long']是经度,以度为单位 train [‘dd lat’]是纬度,以度为单位 - testrecord array, shape = (620,) 数据的测试点。其格式与训练数据相同。 - Nx, Ny:integers 网格中的经度(x)和纬度(y)数 - x_left_lower_corner, y_left_lower_cornerfloats 左下角的(x,y)位置,以度为单位 - grid_sizefloat 网格点之间的间距,以度为单位 |
注
该数据集表示物种的地理分布。该数据集是由Phillips等提供(2006)。
这两个物种是:
“Bradypus variegatus” ,褐喉树懒。
“Microryzomys minutus”,也被称为森林小老鼠大米,啮齿动物,生活在秘鲁,哥伦比亚,厄瓜多尔,秘鲁和委内瑞拉。
有关将此数据集与scikit-learn一起使用的示例,请参见examples/applications/plot_species_distribution_modeling.py。
参考资料
“Maximum entropy modeling of species geographic distributions” S. J. Phillips, R. P. Anderson, R. E. Schapire - Ecological Modelling, 190:231-259, 2006。