sklearn.metrics.pairwise.cosine_similarity

sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)

源码

计算X和Y中样本之间的余弦相似度。

余弦相似度或余弦内核将相似度计算为X和Y的标准化点积:

K(X,Y)=<X,Y>/(||X||*||Y||)

在L2归一化的数据上,此函数等效于linear_kernel。

用户指南中阅读更多内容。

参数 说明
X ndarray or sparse array, shape: (n_samples_X, n_features)
输入数据。
Y ndarray or sparse array, shape: (n_samples_Y, n_features)
输入数据。如果为None,则输出将为X中所有样本之间的成对相似性。
dense_output boolean (optional), default True
是否即使输入稀疏也返回密集输出。如果为False,则两个输入数组均为稀疏时,输出为稀疏。
版本0.17中的新功能:用于密集输出的参数density_output。
返回值 说明
kernel matrix array
形状为(n_samples_X,n_samples_Y)的数组。