sklearn.neighbors.kneighbors_graph

sklearn.neighbors.kneighbors_graph(X, n_neighbors, *, mode='connectivity', metric='minkowski', p=2, metric_params=None, include_=False, n_jobs=None)

[源码]

计算X中点的k临近点的(加权)图

用户指南中阅读更多内容。

参数 说明
X array-like of shape (n_samples, n_features) or BallTree
样本数据,以numpy数组或预先计算的BallTree形式。
n_neighbors int
每个样本的临近点数。
mode {‘connectivity’, ‘distance’}, default=’connectivity’
返回矩阵的类型:“连通性”将返回带1和0的连通性矩阵,“距离”将根据给定的指标返回临近点之间的距离。
metric str, default=’minkowski’
用于计算每个采样点的k临近点的距离度量。 DistanceMetric类提供了可用指标的列表。 默认距离是'euclidean'(“ minkowski”度量标准,p参数等于2。)
p int, default=2
Minkowski指标的功率参数。 当p = 1时,这等效于对p = 2使用manhattan_distance(l1)和euclidean_distance(l2)。对于任意p,使用minkowski_distance(l_p)。
metric_params dict, default=None
度量功能的其他关键字参数。
include_ bool or ‘auto’, default=False
是否将每个样本标记为其自身的第一个最近临近点。 如果为“自动”,则模式=“连接性”使用True,模式=“距离”使用False。
n_jobs int, default=None
为临近点搜索运行的并行作业数。 除非在joblib.parallel_backend上下文中,否则None表示1。 -1表示使用所有处理器。 有关更多详细信息,请参见词汇表
返回值 说明
A sparse matrix of shape (n_samples, n_samples)
该图为A [i,j]分配了将i连接到j的边的权重。 矩阵为CSR格式。

另见:

radius_neighbors_graph

示例

>>> X = [[0], [3], [1]]
>>> from sklearn.neighbors import kneighbors_graph
>>> A = kneighbors_graph(X, 2, mode='connectivity', include_=True)
>>> A.toarray()
array([[1.0.1.],
       [0.1.1.],
       [1.0.1.]])