读书人

tfidf解决思路

发布时间: 2012-02-21 16:26:23 作者: rapoo

tfidf
tfidf
在信息检索里面很经典的公示,谁有写过相关算法的嘛?还有就是倒排索引的函数实现,谁告诉怎么写最好有源程序,愿意轻分相送

[解决办法]
tf idf 目前好像就是count一下吧.然后你就可以根据自己的发挥加权了,比如log一下,比如tf*idf等等啦.然后可以用log, ln....
倒排索引的函数实现?这个应该是指建个索引吧?


query 在每个出现的doc都会有tf, idf值.算一下,然后对前N(N自定)个doc排个序就OK了.

读书人网 >软件架构设计

热点推荐