sklearn.neighbors.kneighbors_graph¶
sklearn.neighbors.kneighbors_graph(X, n_neighbors, *, mode='connectivity', metric='minkowski', p=2, metric_params=None, include_=False, n_jobs=None)
[源码]
计算X中点的k临近点的(加权)图
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
X | array-like of shape (n_samples, n_features) or BallTree 样本数据,以numpy数组或预先计算的BallTree形式。 |
n_neighbors | int 每个样本的临近点数。 |
mode | {‘connectivity’, ‘distance’}, default=’connectivity’ 返回矩阵的类型:“连通性”将返回带1和0的连通性矩阵,“距离”将根据给定的指标返回临近点之间的距离。 |
metric | str, default=’minkowski’ 用于计算每个采样点的k临近点的距离度量。 DistanceMetric类提供了可用指标的列表。 默认距离是'euclidean'(“ minkowski”度量标准,p参数等于2。) |
p | int, default=2 Minkowski指标的功率参数。 当p = 1时,这等效于对p = 2使用manhattan_distance(l1)和euclidean_distance(l2)。对于任意p,使用minkowski_distance(l_p)。 |
metric_params | dict, default=None 度量功能的其他关键字参数。 |
include_ | bool or ‘auto’, default=False 是否将每个样本标记为其自身的第一个最近临近点。 如果为“自动”,则模式=“连接性”使用True,模式=“距离”使用False。 |
n_jobs | int, default=None 为临近点搜索运行的并行作业数。 除非在joblib.parallel_backend上下文中,否则None表示1。 -1表示使用所有处理器。 有关更多详细信息,请参见词汇表。 |
返回值 | 说明 |
---|---|
A | sparse matrix of shape (n_samples, n_samples) 该图为A [i,j]分配了将i连接到j的边的权重。 矩阵为CSR格式。 |
另见:
示例
>>> X = [[0], [3], [1]]
>>> from sklearn.neighbors import kneighbors_graph
>>> A = kneighbors_graph(X, 2, mode='connectivity', include_=True)
>>> A.toarray()
array([[1., 0., 1.],
[0., 1., 1.],
[1., 0., 1.]])