信息检索系统研究综述
前言: 由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。因此在计算机领域的信息检索系统研究是指信息检索算法及软件系统的研究和开发,比如建立索引的方法,检索结果的排序算法等。
一丶信息检索系统的历史
(1)脱机检索阶段
此阶段是从50年代中期到60年代中期。19xx年,美国海军兵器中心首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用“逻辑与”,检索结果只是文献号,19xx年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。19xx年,H.P.卢恩(Luhn)利用IBM-650对文献进行统计分析,实现定题情报检索服务。20世纪60 年代,在图书情报工作中广泛利用计算机脱机批处理系统进行情报检索。
(2)联机检索阶段
此阶段是从60年代中期到70年代初。由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。19xx年,美国M.M.凯塞尔进行了世界上最早的的联机信息检索试验。19xx年,美国系统发展公司(SDC)研制成功ORBIT(On-Line Retrieval of Bibliographic Information-Time shared)联机信息检索软件。
这个时期,由于计算机处理功能的加强,数据存贮容量的扩大和磁盘机的应用,为建立大型的文献数据库创造了条件。联机信息检索系统除了上述的ORBIT之外,还有美国的DIALOG系统(DIALOG对话系统)、BRS系统(存贮和信息检索系统)、欧洲的ESA-IRS系统(欧洲航天局信息检索系统)等都是在此时期开始研制并逐步发展起来的,并且均在国内或组织范围内得到实际应用。
(3)网络化检索阶段
此阶段是从70年代初到现在。由于电话网、电传网、公共数据通信网都可为情报检索传输数据。特别是卫星通信技术的应用,使通信网络更加现代化,也使信息检索系统更加国际化,信息用户可借助国际通讯网络直接与检索系统联机,从而实现不受地域限制的国际联机信息检索。尤其是世界各大检索系统纷纷进入各种通信网络,每个系统的计算机成为网络上的节点,每个节点联接多个检索终端,各节点之间以通信线路彼此相连,网络上的任何一个终端都可联机检索所有数据库的数据。这种联机信息系统网络的实现,使得信息检索从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快速、分布广泛、管理松散的Web内容。
可以说,联机网络和检索终端几乎遍及世界所有国家和地区,使得国际联机信息检索的发展达到了相当高的水平,开展商业性国际联机检索服务的大机构已达200余家,像美国的DIALOG信息公司已成为全世界最为著名的联机检索服务机构。
计算机信息检索的实现,大大方便和加速了信息资源的交流和利用,并对社会经济的发展和人们的科研方式产生了深刻的影响,从而也极大地促进了科技的进步。
二丶三大信息检索系统的特点
(1) 联机信息检索系统
检索速度快,检索效率高;信息资源丰富且质量较高;可及时提供最新信息;费用较高。
各大联机信息检索系统提供的检索方式包括单词检索、词组检索、截词检索、布尔逻辑检索和位置逻辑检索,提供的基本服务包括回溯检索(RS)、定题检索(SDI)、联机订购文献原文、电子邮件、光盘服务。
(2) 光盘信息检索系统
主要采用菜单驱动方式,直接检索,易操作;存储能力强;戒指成本低;数据可靠 性高;便于携带。
光盘信息检索系统的检索方式包括布尔逻辑检索、截词检索、位置逻辑检索、字段 限制等检索功能。
(3) 因特网信息检索系统
它的主要特点是检索范围大、超文本检索、界面友好、良好的反馈能力和快速响应 能力。
基于全文的自动单词索引,较之人工的词组规范化标引,速度快、成本低,但信息检索的效率要差些、检索的准确性和全面性都要低,漏检有时非常突出。它的基本服务包括文档查询服务、基于菜单的信息检索服务、基于关键词的文档检索服务、基于超文本的搜索引擎服务。三丶简单的评述及问题
(1) 光盘信息检索与联机信息检索相比,前者具有价格低廉、容易掌握的优点,后者需要掌握许多复杂的指令及其用法,只能靠专门培训过的检索人员代为服务,容易因为人的交际问题导致检索的各种失误。
(2) 光盘数据库的更新周期较长,过于依赖出版商难以满足时效性较高的检索需要。
(3) 联机信息检索提供原文较困难,它们主要提供文摘或题录等二次信息,原文支持能力低。
(4) 几个应当深入探讨的问题
这儿基于各种信息检索系统的优缺点,应该实行相互补充、多元并存的方法,可以运用信息融合技术。主要包括多种搜索方法获得的结果的融合、多种媒介信息、多种语言信息的融合。然而在实行融合的过程中还存在很多技术上的难点,能不能解决这些技术难点成为能否实施信息融合技术的关键所在。 【参考文献】
[1]李四福、叶玫:《信息存储与检索》,机械工业出版社,2007
[2]苏新宁:《信息检索理论与技术》,科学技术文献出版社,2004
[3]隋莉萍:《网络信息检索与利用》,清华大学出版社,2008
[4]刘挺、秦兵、张宇、车万翔:《信息检索系统导论》,机械工业出版社,2008
第二篇:信息检索对研究生科研生涯的重要性
信息检索对医学研究生科研生涯的重要性
信息检索是科学研究的组成部分。科学研究首先是从课题调研掌握资料起步的。信息检索有助于掌握本课题研究的进展动态,开拓思路、避免重复劳动,把研究水平提到新的高度。科研成果的评估与鉴定,也需要通过信息检索——资料的查新活动,才能作出正确的结论。特别是在社会科学文献检索系统尚不完备的条件下,信息检索能力的高低,往往影响着科研成果的价值。对于我们医学研究生来说,信息检索主要的作用是查找文献,而文献在我们研究生涯中有着极其重要的意义。
文献可以告诉研究者在本领域内已做了哪些工作。通过查阅有关文献,要搜集现有的与这一特定研究领域的有关信息,对所要研究的问题做出系统的评判性的分析。
要了解该课题所涉及的领域内前人或他人的主要的研究成果,达到的研究水平,研究的重点,研究的方法、经验和问题。还要了解哪些问题已基本解决,哪些问题有待于进一步修正和补充,在此问题上争论的焦点是什么,从而进一步明确研究课题的科学价值,找准自己研究的真正起点。这些都需要相关信息的积累。
文献可以帮助研究者更具体地限制和确定研究课题及假设。找准研究的起点之后,要形成一个可以集中精力研究的具体问题也并不容易。换句话说,要选择适合研究者的兴趣和物力的、便于操作并有希望取得明显效果的研究变量,往往不是轻而易举
的。这就需要从更详细的文献资料中,通过筛选和比较进一步缩小研究范围,找出比以往同类研究更集中的变量范围,形成更凝练、更准确的研究假设。
文献可以提供一些可能对当前研究有帮助的研究思路和方法。文献资料反映了国内外研究学术思想和最新成就,是我们了解科研前沿动向并获得新情报新信息的有效途径。通过查阅文献资料,了解国内外最新的理论、手段和研究方法,从过去和现在的有关研究成果中受到启发,使研究范围内的概念、理论具体化,而且为更科学地论证自己的观点提供有说服力的、丰富的事实和数据资料,使研究结论建立在可靠的材料基础上。
研究者充分占有材料,可以避免重做前人已经提出的正确观点,把握研究中可能出现的差错,并为解释研究结果提供背景资料。
具体地说,信息检索有以下重要作用:
1.为研究提供内容参考;
2.更具体地限制和确定研究课题及假设;
3.告诉研究者在本领域内已做了哪些工作;
4.提供一些可能对当前研究有用的研究思路及方法;
5.对研究方案提出一些适当的修改意见,以避免预想不到的困难;
6.把握在研究中可能出现的差错;
7.为解释研究结果提供背景材料。