信息检索(Information Retrieval)有广义和狭义之分。广义的信息检索是指将信息按一定的方式组织和存储起来,然后根据用户需求查找出特定信息的技术,所以全称是信息存储与检索(Information Storageand Retrieval)。狭义的信息检索仅指用户查找特定信息这部分。
信息检索的主要方法如下:
- 全文检索。以文本数据为主要处理对象,根据内容而不是外在特征来实现的信息检索手段。
- 字段检索。把检索对象按一定标准在不同字段中进行著录,并把不同字段作为检索依据。
- 基于内容的多媒体检索。按检索内容可分为图像检索、视频检索和声音检索等。
- 数据挖掘。从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中且人们事先不知道的潜在、有用的信息和知识的过程。
信息检索的常用技术包括布尔逻辑检索技术、截词检索技术、临近检索技术、限定字段检索技术、限制检索技术等。
- 布尔逻辑检索技术。严格意义上的布尔检索法是指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应的逻辑运算,以找出所需信息的方法。
- 截词检索技术。截词检索技术是指用截断的词的一个局部进行检索,并认为凡是满足这个词局部的所有字符的信息,都为命中的信息。截词符用“?”或“*”表示。
- 临近检索技术。临近检索又称位置检索,主要是通过检索式中的专门符号来规定检索词在结果中的相对位置。在某些情况下,若不限制检索词之间的位置关系则会造成误检,影响查准率。
- 限定字段检索技术。限定字段检索即指定检索词在记录中出现的字段。检索时,计算机只对限定字段进行匹配运算,以提高检索效率和查准率。
- 限制检索技术。限制检索是通过限制检索范围,达到优化检索的方法。限制检索的方