读书人

深入索引和搜索引擎

发布时间: 2010-04-19 06:30:54 作者:

 深入索引和搜索引擎


基本信息出版社:清华大学出版社
页码:511 页
出版日期:2009年04月
ISBN:7302197369/9787302197362
条形码:9787302197362
版本:第1版
装帧:平装
开本:16
正文语种:中文
丛书名:微软技术丛书

内容简介 《深入索引和搜索引擎》共10章,首先简要介绍SharePoint Server 2007中的企业搜索和最终用户搜索体验。接着阐述如何定制搜索用户体验,介绍搜索使用报告和搜索管理,随后介绍如何对业务数据进行索引和搜索,提出搜索部署注意事项,描述搜索API和搜索引擎高级主题。最后简单介绍了如何利用Windows SharePoint Services 3.0进行搜索。通过《深入索引和搜索引擎》,读者可洞悉SharePoint Server 2007内幕,掌握优化搜索结果的秘诀。
《深入索引和搜索引擎》适合对搜索领域感兴趣的任何读者阅读
作者简介 PatrickTisseghem,微软MVP,主讲sharePoint产品和技术相关课程。LarsFastrup
独立承包商,主要提供SharePoint产品和技术、NETFrarnework和SQL Server方面的软件开发与咨询服务。他曾供职于搜索技术公司Morldosoft,主持过流行搜索插件Oiqtolica的开发,此类插件用于SharePoilltPot talServer2003和ShareF)oirlt Server2007。
译者简介:
王璃,南京腾文信息科技有限公司首席系统架构师。最早关注WebServices架构的人员之一,一直致力于XML.WebServices和微软COM+.NET等关键技术架构的研究和应用,精通主流电子商务技术。目前主要为金融机构设计并实现IT系统。
李燕,系统分析和架构设计师,拥有电子技术学士学位和MBA学历。痴迷于主流软硬件技术框架和新兴技术,近年来主要致力干采用微软.NET技术平台的应用框架设计。曾为多家公司设计各种软件的整体架构和技术解决方案,策划并撰写技术文档,翻译新技术资料,获多方认可。现供职于国电南瑞(北京)控制系统有限公司。
编辑推荐 《深入索引和搜索引擎》特色介绍:
在企业环境中构建定制搜索解决方案时,需要哪些工具和技术?《深入索引和搜索引擎》将为您一一呈现。通过定制和拓展Sharepoint Server 2007中的企业搜索功能,我们可以优化工作环境中的用户搜索体验。在业内知名Sharepoint专家的悉心指导下,我们可通过简明易懂的行文和实用的范例代码,以更快的速度排除干扰,直击关键信息。《深入索引和搜索引擎》主题:
配置和管理Sharepoint Server 2007的索引文件和搜索引擎
规划搜索部署策略,综合考虑性能、可扩展性和安全三大因素
安装并定制搜索功能和UI控件
监视和分析搜索使用数据,从而优化最终用户的搜索体验
使用搜索管理对象模型为管理功能进行编程
开发和安装自定义IFilters和协议处理器
使用商业数据目录(BDC)建立关键业务数据的结构和索引
使用Windows Sharepoint Services 3.0为搜索操作进行编程
目录
第1章 SharePoint2007企业搜索功能简介1
1.1 搜索的重要性和微软所扮演的角色1
1.1.1 用户搜索体验3
1.1.2 企业中的员工4
1.1.3 企业的准备5
1.2 微软的企业搜索产品6
1.2.1 WindowsSharePointServices3.0 6
1.2.2 OfficeSharePointServer20077
1.2.3 SearchServer200812
1.2.4 功能比较23
1.3 搜索架构概览25
1.3.1 索引引擎26
1.3.2 搜索引擎26
1.3.3 搜索对象模型27
1.4 与本书搜索相关主题概述27
1.4.1 管理人员主题28
1.4.2 开发人员主题29
1.5 小结30

第2章 最终用户使用体验31
2.1 最终用户搜索体验介绍31
2.2 小搜索框32
2.2.1 关键词查询语法35
2.2.2 对搜索结果请求的近距离观察39
2.3 搜索中心40
2.3.1 在协作门户中创建包含选项卡的搜索中心41
2.3.2 发布门户中的Lite版搜索中心42
2.3.3 在协作网站中创建Lite版搜索中心44
2.3.4 搜索选项卡46
2.3.5 “搜索”页面47
2.3.6 “人员搜索”页面47
2.3.7 “高级搜索”页面49
2.3.8 “搜索结果”页面52
2.3.9 “人员搜索结果”页面54
2.4 小结56

第3章 定制搜索用户界面57
3.1 搜索中心网站定义57
3.2 带选项卡的搜索中心的架构59
3.2.1 选项卡列表61
3.2.2 搜索页面布局62
3.2.3 搜索Web部件63
3.3 搜索中心的管理工作64
3.3.1 为搜索中心创建自定义页面64
3.3.2 创建自定义选项卡68
3.3.3 配置搜索Web部件69
3.4 XSL详解96
3.4.1 定义搜索结果的显示布局96
3.4.2 自定义搜索结果的显示布局106
3.4.3 在搜索结果中显示自定义属性116
3.4.4 XSL链接属性118
3.4.5 定义人员搜索结果页面的显示布局118
3.4.6 定义操作链接的显示布局124
3.4.7 显示自定义可操作链接125
3.5 通过代码扩展最终用户搜索体验126
3.5.1 自定义搜索相关页面布局126
3.5.2 从开发人员角度看搜索Web部件135
3.5.3 创建自定义搜索选项卡145
3.6 创建一个自定义小搜索框145
3.7 小结152

第4章 搜索使用率报告153
4.1 搜索使用率报告概述153
4.2 报告架构154
4.2.1 RecordClick参数的XML格式156
4.2.2 向自定义Web服务发送使用率数据157
4.2.3 报表定义语言文件158
4.2.4 对搜索结果XSL的依赖158
4.3 启用或禁用搜索使用率报告160
4.4 访问报告161
4.5 搜索查询报告163
4.5.1 过去30天中的查询以及过去12个月中的查询163
4.5.2 过去30天中的主要查询起点网站集164
4.5.3 过去30天中每个范围内的查询165
4.5.4 过去30天中的主要查询165
4.6 搜索结果报告166
4.6.1 搜索结果中的主要目标页面167
4.6.2 无结果的查询167
4.6.3 点击率最高的最佳匹配168
4.6.4 无最佳匹配的查询168
4.6.5 低点击率的查询169
4.7 导出搜索使用率数据169
4.7.1 将数据导出到Excel170
4.7.2 将数据导出到AdobeAcrobatPDF171
4.8 小结172

第5章 搜索管理173
5.1 搜索是一种共享服务173
5.2 搜索管理设置概述174
5.3 管理共享服务提供程序(SSP)175
5.3.1 配置和启动搜索服务175
5.3.2 创建一个新的SSP179
5.3.3 将SSP与IISWeb应用程序关联起来181
5.4 管理SSP的搜索设置182
5.4.1 管理内容源183
5.4.2 完全爬网和增量爬网特性192
5.4.3 配置爬网计划194
5.4.4 配置爬网规则196
5.4.5 即时删除搜索结果199
5.4.6 爬网程序验证方案200
5.4.7 默认内容访问帐户202
5.4.8 检查爬网日志203
5.4.9 服务器名称映射204
5.4.10 文件类型205
5.4.11 搜索范围210
5.4.12 元数据属性映射217
5.4.13 权威页面227
5.4.14 基于搜索的通知229
5.4.15 重置索引230
5.5 管理搜索服务231
5.5.1 服务器场级搜索设置231
5.5.2 爬网程序影响规则233
5.6 为个人网站配置首选搜索中心235
5.7 管理网站级别搜索设置236
5.7.1 将搜索框绑定到搜索中心237
5.7.2 管理本地搜索范围238
5.7.3 管理关键字240
5.7.4 将网站排除在爬网范围之外242
5.7.5 将栏排除在爬网范围之外243
5.7.6 将列表排除在爬网范围之外244
5.8 辞典244
5.8.1 扩展系列246
5.8.2 替换系列247
5.9 干扰词247
5.10 读音符号敏感的搜索248
5.11 使用PowerShell自动化管理工作249
5.11.1 探察SSP的搜索应用程序名称251
5.11.2 使用脚本创建新的内容源251
5.11.3 使用脚本执行爬网252
5.11.4 使用脚本创建新的搜索范围252
5.12 小结254

第6章 对业务数据进行索引和搜索255
6.1 业务数据目录介绍255
6.2 业务数据目录架构256
6.3 业务数据建模258
6.3.1 创建应用程序定义文件259
6.3.2 导入应用程序定义文件275
6.3.3 管理权限277
6.4 使用业务数据Web部件279
6.5 管理和配置282
6.5.1 创建内容源282
6.5.2 搜索业务数据284
6.5.3 创建托管属性285
6.5.4 创建搜索范围287
6.5.5 搜索结果XSL的配置289
6.6 使用业务数据目录运行时对象模型292
6.7 小结296

第7章 搜索部署注意事项297
7.1 部署搜索时需要考虑的关键因素298
7.1.1 性能因素298
7.1.2 可用性因素299
7.1.3 可扩展性因素302
7.1.4 安全性因素303
7.2 搜索拓扑结构304
7.2.1 搜索组件及其扮演的角色305
7.2.2 每个服务器角色停机时的后果308
7.2.3 通用拓扑模型308
7.2.4 选择一个基准拓扑结构316
7.3 软件边界317
7.4 硬件建议319
7.5 计算磁盘空间321
7.5.1 计算内容索引的大小321
7.5.2 计算搜索数据库的大小321
7.6 性能优化322
7.6.1 优化查询服务器的性能322
7.6.2 优化索引服务器的性能322
7.6.3 优化数据库服务器的性能322
7.7 测量一个示例部署环境的性能323
7.7.1 测试环境323
7.7.2 测试查询服务器性能324
7.7.3 测试索引服务器的性能325
7.8 小结325

第8章 搜索API326
8.1 搜索API介绍326
8.2 搜索管理对象模型327
8.2.1 ServerContext类328
8.2.2 SearchContext类329
8.2.3 操作内容源330
8.2.4 操作搜索范围338
8.2.5 操作托管属性346
8.2.6 改进关联性352
8.2.7 操作关键字、定义和最佳匹配355
8.3 建立搜索查询357
8.3.1 关键字语法357
8.3.2 企业搜索SQL查询语法357
8.4 查询对象模型366
8.4.1 Query类367
8.4.2 KeywordQuery类369
8.4.3 FullSqlQuery类375
8.4.4 创建、打包及部署自定义文档搜索器Web部件376
8.5 构造一个自定义小搜索框406
8.6 查询Web服务407
8.6.1 QueryPacket元素409
8.6.2 ResponsePacket元素411
8.6.3 自定义Word2007的业务数据搜索任务面板415
8.6.4 将查询Web服务注册为信息检索服务419
8.7 小结422

第9章 深入探讨搜索引擎423
9.1 搜索引擎架构详述424
9.1.1 共享服务提供程序内容索引424
9.1.2 索引引擎425
9.1.3 查询引擎427
9.2 IFilter431
9.2.1 构建自定义IFilter432
9.2.2 与过滤器Daemon的集成440
9.2.3 在索引服务器上安装一个IFilter441
9.3 协议处理器443
9.3.1 内置协议处理器444
9.3.2 构建一个自定义协议处理器445
9.3.3 用于索引文件共享的协议处理器示例453
9.3.4 在索引服务器上安装协议处理器478
9.3.5 创建一个自定义内容源480
9.3.6 测试示例协议处理器482
9.4 自定义安全过滤器483
9.4.1 ISecurityTrimmer接口484
9.4.2 注册自定义安全过滤器487
9.4.3 测试安全过滤器488
9.5 面搜索488
9.5.1 什么是面搜索488
9.5.2 SharePointServer2007的FacetedSearch489
9.5.3 安装FacetedSearch489
9.5.4 将FacetedSearch添加到搜索中心491
9.5.5 配置FacetedSearchWeb部件493
9.6 小结498

第10章 使用WindowsSharePointServices3.0 进行搜索499
10.1 WindowsSharePointServices3.0 搜索对象模型499
10.1.1 构建搜索查询500
10.1.2 查询对象模型500
10.1.3 查询Web服务504
10.2 WindowsSharePointServices3.0 搜索管理507
10.3 小结509
结语510
……
序言 十年来,微软对企业级搜索领域进行大幅投入,并有日益增加之势,这是我们有目共睹的。在写作本书的同时,我们已经在Windows SharePoint Services 3.0和Microsoft Office SharePoint Server 2007中实现了对搜索功能的支持,并且,新发布的Microsoft Search Server 2008和Community(社区)工具集还拓展和完善了搜索的功能架构及用户搜索体验。它们是致力于企业级搜索领域的微软公司的一笔财富,它们能够帮助微软公司在竞争日益激烈的市场中拼杀,销售扩展组件提升管理人员、开发人员及客户的使用体验,以及为他们提供咨询服务。
2007年夏天,我们(Lars Fastrup和Patrick Tisseghem)决定合作写作本书。从那时到现在,我们始终确信,写一本涵盖在一个组织中部署Microsoft Office SharePoint Server 2007的书正当其时。Lars的大部分职业生涯都献给了一款名为Ontolica Search的极为成功的第三方产品。Patrick是《SharePoint Server 2007实用宝典》(微软出版社2007年出版)一书的作者,他负责SharePoint的开发培训,并且他对使用定制解决方案组件来定制及扩展搜索架构课题有着极大的热情。
目 标 读 者
本书涵盖管理人员和开发人员所关心的广泛主题。正如阅读本书时你将发现的那样,很多时候,管理人员和开发人员之间的职责并不是那么泾渭分明的。为了很好地完成工作,管理人员和开发人员都必须加深对对方工作的了解。
当然,本书参考了大量Windows SharePoint Services 3.0和Microsoft Office SharePoint Server 2007的Software Developer Kit(SDK)中的内容。在阅读本书的同时,使用这些资源是非常有帮助的。可以在微软开发者网络(MSDN)中找到这些资源,网址为http://msdn.microsoft.com/en-us/library/bb931736.aspx,或访问http://www.microsoft.com/downloads/ details.aspx?familyid=6d94e307-67d9-41ac-b2d6-0074d6286fa9,下载完整的SharePoint Server 2007 SDK文件。管理人员可以在http://technet.microsoft.com/en-us/library/cc263630.aspx得到微软Technet站点更多的背景资料。
文摘 插图:


第1章 SharePoint 2007企业搜索功能简介
1.1 搜索的重要性和微软所扮演的角色
“知识有两种,一种是知识本体,另一种是我们获取知识的方法。”时至今日,SamuelJohnson在18世纪的思考显然仍不落伍。以数字技术存储的信息数量极为庞大,并且日益增加。如今,如果没有软件工具帮助我们适时地找到有用的信息,人类几乎无法全面而深入地认知我们所生活的这个世界。不仅在个人的工作中我们能够感受到这一点,在一个由不同人员组成的组织中,这种感受更为深刻。组织机构中的信息工作人员迫切需要使用专业化软件从存储在不同位置的庞杂数据中查找到组织合作信息。
过去十年来,微软对于互联网、桌面和组织内联网(或称企业内联网)这三大搜索领域的相关搜索技术进行了大量的投入。微软通过Live Search(http://www.live.com)实现互联网上的搜索,见图1-1。尽管Live Search面对的是与Google和Yahoo这样的搜索行业巨头的艰难竞争,但是最近的报表显示了其颇具成长性的市场占有率,这得益于Live Search最强大的特性:与其他微软在线服务的整合性。
读书人网 >程序设计

热点推荐