请问自动提取Tag算法的实现
比如csdn和sina的blog上的自动提取标签,他们是怎么实现的呢?
[解决办法]
http://www.cnblogs.com/onlytiancai/archive/2008/04/29/1176981.html
[解决办法]
是的, 他的那个算法就是一个简单的词频统计.
如果你想比较准确的话, 那你必须要做语义分析, 根据语义来提取.
不考虑语义的话, 那么在分词时, 给与标题远大于正文的权重值.
另外. 文中的分词结果, 只保留名词.
发布时间: 2011-12-17 23:37:33 作者: rapoo
请问自动提取Tag算法的实现
比如csdn和sina的blog上的自动提取标签,他们是怎么实现的呢?
[解决办法]
http://www.cnblogs.com/onlytiancai/archive/2008/04/29/1176981.html
[解决办法]
是的, 他的那个算法就是一个简单的词频统计.
如果你想比较准确的话, 那你必须要做语义分析, 根据语义来提取.
不考虑语义的话, 那么在分词时, 给与标题远大于正文的权重值.
另外. 文中的分词结果, 只保留名词.