垃圾邮件处理,贝叶斯算法中hash表是怎样建立的?
如题,我用map存储的,然后运行会很慢,如有做过的请给点建议吧_。
hash表应该会加快速度,但是不知怎样影射。
再就是新邮件中token串的提取,是不是要用到字典什么的,定义token串,不是全部提取,有没有巧妙的提取方法?不然全部提取会使程序运行起来极其的慢。
[解决办法]
帮顶,不会
[解决办法]
gcc中有hash_multimap的实现,在include文件夹
The C++ Programming Language中也有一个简单的hash_map实现,自己找找看吧
[解决办法]
#include "xxx.h " // 在当前目录里找
#include <xxx.h> // 在include_path中找
你都是 #include "xxx.h " 的吗? 原来怎么会对的啊? 怪!