是否可以使用scikit-learn K-Means Clustering指定您自己的距离函数?
是否可以使用scikit-learn K-Means Clustering指定您自己的距离函数?
没有找到相关结果
已邀请:
6 个回复
镰茧钩
一些笔记添加了26mar 2012: 1)对于余弦距离,首先将所有数据向量归一化为| X | = 1;然后
很快对于位向量,请将规范与向量分开 而不是扩展到浮动 (虽然有些程序可能会为您扩展)。 对于稀疏向量,比如N,X的1%。 Y应该花费时间O(2%N), 空间O(N);但我不知道哪些程序可以做到这一点。 2) Scikit-learn群集 给出了k-means,mini-batch-k-means的优秀概述...... 使用适用于scipy.sparse矩阵的代码。 3)在k-means之后总是检查簇大小。 如果您期望大致相同大小的群集,但它们会出现
......(头部划伤的声音)。
摊揉售
寿柬窟年
嫩昧竞莫
疏腔傻小雹
朗排谎纷瘟
实际上,我还没有测试过这段代码,而是从票证和示例代码拼凑而成。