读书人

输入法词库调频数据有什么数据结构

发布时间: 2012-03-15 11:50:38 作者: rapoo

输入法词库,调频数据,有什么数据结构记录
a 工 戈
aa 式 戒
aaa 工
aaaa 工 恭恭敬敬
……

一个编码可能对应几个词,如a 对应"工"、"戈",两个字,aaaa 对应:工、恭恭敬敬两个词。
词库编码是排好序的,二分查找,很快的就能找到用户输入的一段编码代表的词。

如果用户输aaaa的时候,给出1.工 2.恭恭敬敬,用户点2,输入了恭恭敬敬,那就要在下次按aaaa的时候,把恭恭敬敬放在第一位。
这个词频记录,不应该是改变原始词库,即记录词库的这个文件,因为这个文件很大,每次按一下就改变这个文件,很花时间,而且原始词库理应不被修改。

所以这个词频的东西 ,要用个什么数据结构保存呢?

[解决办法]
我查看了极点五笔文件夹下的"最近修改文件",极点五笔是直接在freeime.mb这个词库上修改的,并没有做什么"数据结构"
[解决办法]
而QQ五笔则是放在C:\Documents and Settings\Administrator\Application Data\Tencent\QQWubi
WBUser3.dict
下,这个文件已经有300多K,说明它是打多少词,记录多少词的词频的。

读书人网 >软件架构设计

热点推荐