[100分] 请问:如何计算两篇维度不同的文档的欧氏距离?
在文本聚类中,两篇文档表示成两个不同长度的向量,相近的文档的欧式距离应该小,如何排除不同向量长度(文本长度)的干扰?实际实现的时候采用怎么样的方法?
谢谢!
[解决办法]
把高维的降维比较
[解决办法]
向量归一化
发布时间: 2012-04-02 19:58:59 作者: rapoo
[100分] 请问:如何计算两篇维度不同的文档的欧氏距离?
在文本聚类中,两篇文档表示成两个不同长度的向量,相近的文档的欧式距离应该小,如何排除不同向量长度(文本长度)的干扰?实际实现的时候采用怎么样的方法?
谢谢!
[解决办法]
把高维的降维比较
[解决办法]
向量归一化