读书人

高分求海量中文字符串的模糊搜索算法解

发布时间: 2012-03-13 11:21:11 作者: rapoo

高分求海量中文字符串的模糊搜索算法
比如做图书名称搜索,有100万部,
可以按照关键字搜索, 比如输入 "算法 ",则所有带有算法的书名都能查到.
请问谁有相关算法或者经验?

另外,如果这时要通过出版社和书名查找,也要支持模糊,
比如还是输入 "算法 + 铁路出版社 "

请 有经验的人指教.或给予相关信息.
注意不是用数据库查询,而是数据存储格式和算法.

这个算法要考虑时间和空间需求(是在嵌入式下工作).

也可联系我: psscn@msn.com

[解决办法]
数据库好象都支持%的
[解决办法]
参考 lucene
[解决办法]
数据存放哪啊?按你的要求应该是在外存吧?是不是可以考虑b+树啊,记得北大新版的数据结构最后有做搜索引擎的东西,可能会有所相似。另外好像一本数据库的什么书(机械出版的)里面讲了数据结构怎样在数据库实现中使用的,或许会有参考意义。

读书人网 >软件架构设计

热点推荐