sklearn.datasets.make_biclusters¶
sklearn.datasets.make_biclusters(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)
生成具有恒定块对角线结构的数组以进行双聚类。
在用户指南中阅读更多内容。
参数 | 说明 |
---|---|
shape | iterable (n_rows, n_cols) 结果的形状。 |
n_clusters | integer biclusters的数量。 |
noise | float, optional (default=0.0) 高斯噪声的标准偏差。 |
minval | int, optional (default=10) bicluster的最小值。 |
maxval | int, optional (default=100) bicluster的最大值。 |
shuffle | boolean, optional (default=True) shuffle样本。 |
random_state | int, RandomState instance, default=None 确定用于生成数据集的随机数生成。为多个函数调用传递可重复输出的int值。请参阅词汇表。 |
返回值 | 说明 |
---|---|
X | array of shape shape 生成的数组。 |
rows | array of shape (n_clusters, X.shape[0],) 每行集群成员的指标。 |
cols | array of shape (n_clusters, X.shape[1],) 每个列的集群成员资格指标。 |
另见
参考
Dhillon, I. S. (2001, August). Co-clustering documents and words using bipartite spectral graph partitioning. In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 269-274). ACM.