论文摘要:搜索引擎搜索结果的分类排序技术研究
搜索引擎是在给定的用户需求下,利用索引、匹配等技术,从大量信息中识别满足条件的信息。近年来因特网的迅猛发展,为人们提供了海量的、动态的Web 网页信息。针对实体网页的个性化检索,本文提出了一种有效的分类排序方法。该方法将检索问题的处理从检索词的机械匹配提升到实体属性的结构化匹配,具体来说就是对搜索引擎搜索到的结果网页内容与实体属性进行相关度的分析与计算,最终得出结果的排序。这样针对性更强,准确率更高,从而为用户提供高效优质的实体网页的个性化检索服务。 在研究过程中我们将一种通过有限自动机实现的名为LDM的多模式字符串匹配算法应用到了实际的信息检索系统中。该算法的应用使文本分类过程中切词和匹配的效率得到了提高。 本文成功地将基于向量空间的分类排序方法应用于自然语言的信息分类排序技术中,实现了基于向量空间模型的文本自动分类系统。然后将文本自动分类系统应用于搜索结果的分类排序的研究,并最终实现了科技资源导航与检索结果分类排序系统。科技资源导航与检索结果分类排序系统同时考察了影响用户评判网页相关性的多种因素,通过参数调整优化实体网页的相关度评价模型,并在本文中提供了翔实的实验结果。