北 京 师 范 大 学 网 络 教 育
《计算机信息检索》作业
:
一、选择题(每题1分,共15题)
1.关键词语言属于:b
A.代码语言
B.主题语言
C.叙词语言
D.分类语言
2.以下不属于黑色文献的是:b
A.内部档案
B.政府报告
C.具有保存价值的个人日记和信件
D.政府未解密的文件
3.信息检索语言是: a
A.一种专门的人工书面语言
B.一种机器语言
C.一种数据库语言
D.一种编程语言
4.以下不属于零次文献的是:d
A.论文手稿
B.新闻稿
C.试验记录
D.会议论文
5.可以用来缩小检索范围的检索策略有:c
A.逻辑“或”
B.前截断
C.逻辑“与”
D.截词检索
6.计算机信息检索技术的特征为:a
A.效率高
B.检索范围小
C.受时空的限制
D.数据更新慢
7.以下定义哪个不是信息的定义:c
A.是用于消除不定性的东西。
B.是关于事物运动状态和运动方式的反映。
C.是指记录知识的一切载体。
D.是与物质和能量相并列的三大要素之一。
8.属于二次文献的是:a
1
北 京 师 范 大 学 网 络 教 育
A.索引
B.学位论文
C.会议论文
D.期刊论文
9.以下检索分类不属于按查询信息的特征划分的是:c
A.事实检索
B.图像检索
C.手工检索
D.多媒体信息检索
10.美国国立医学图书馆建立了MEDLINE系统,标志着计算机检索进入联机检索时期是:c
A.19xx年
B.19xx年
C.19xx年
D.19xx年
11.不属于源数据库的是:b
A.数值数据库(numeric database)
B.指南数据库(referral database)
C.全文数据库(full-text database)
D.文本—数值数据库(textual-numeric database)
12.以下特性哪个不属于印刷型信息资源具有的特点:b
A.增值性
B.间接性
C.不可替代性
D.实用性
13.《中图法》属于:d
A.叙词语言
B.代码语言
C.主题语言
D.分类语言
14.FTP信息资源的索引工具是:a
A.Archie
B.Jughead
C.Veronica
D.Wais
15.计算机信息检索系统的基本结构中不属于软件部分的是:a
A.外围设备
B.词表管理程序
C.自动标引程序
D.数据库管理程序
一、简答题(每题2.5分,共2题)
2
北 京 师 范 大 学 网 络 教 育
1、什么是位置逻辑检索?
答:位置逻辑检索即在检索词之间使用位置算符(或称邻近算符),规定算符两边的词出现在信息中的位置。它可以放映出两个检索词在文献中的邻近关系。
2、从数据本身的性质来看,数据库可以划分为哪几种类型?
答:从数据本身的性质来看,数据库可以划分为:文献数据库、数据型数据库、事实型数据库、多媒体数据库和超媒体数据库等几种形式。
二、论述题(每题5分,共2题)
1、谈谈你对信息资源的基本概念及其基本特征的了解和认识。
答案:
信息资源的基本概念:
信息论的奠基者申农的观点:信息是用于消除不定性的东西。控制论创始人维纳认为:信息是与物质和能量相并列的三大要素之一。《中国大百科全书》沿用了美国人申农的观点,同时认为是关于事物运动状态和运动方式的反映。信息资源就其本意来讲,就是信息的资源化或资源化的信息,是经过人类主观处理或加工的,能够传输或传播的,可以对社会生活发挥作用的信息。
信息资源的基本特征:
1. 信息资源的普遍性
2. 信息资源的传递性
3. 信息资源的时效性
4. 信息资源的价值性
5. 信息资源的可转换性
6. 信息资源的可利用性
7. 信息的共享性
2、论述计算机的检索方法主要有哪些?
答案:
计算机的检索方法大致可分为以下几种类型,即菜单检索、指令检索、浏览式检索和提问—回答式检索。
1. 菜单检索 (Easy Menu Search)
菜单检索这是计算机存取系统中最普遍的查询方式之一。用户在系统给出的菜单中选择项目来完成各种操作。在检索过程中,用户还可以参考屏幕提示的信息或按下F1键来获取帮助。菜单方式的缺陷是检索的步骤多,而且检索的精确度不及指令检索。 2. 指令检索(Command Search)
指令检索是一种依靠各种指令来完成操作的检索方法。检索指令包括检索过程中所使用的功能键。指令检索一般适用于有经验的用户。应用各种指令有助于用户表达检索提问和进行各种方案的检索比较,以获取比较理想的检索结果。
3. 浏览式检索 (Browsing Search)
浏览式检索一般用于网络信息资源的超文本或超媒体查询。浏览式检索通过跟踪信息节点之间的链路,在网络系统中查找与检索概念相关的信息资源。Internet互联网与Web都具有导航浏览式检索的功能。这种检索方式的缺陷是用户在漫游中可能会“迷航”。 4. 提问—回答式检索(Quiz & Answer Search)
3
北 京 师 范 大 学 网 络 教 育 提问检索目标明确,技术规范,不仅检索速度快,而且“查全率”和“查准率”比较高,适用于大型检索系统,可以广泛应用与光盘数据库和Web网上的各类搜索引擎。提问—回答式检索可以划分为基本检索、二次检索、词组检索、索引词典检索、高级检索和综合检索等几种方式。
4
第二篇:计算机信息检索考试题目及答案
一、填空题; 书本教材第一、二章 二、
名词解释;
1流媒体
所谓流媒体是指采用流式传输的方式在Internet播放的媒体格式。 流媒体又叫流式媒体,它是指商家用一个视频传送服务器把节目当成数据包发出,传送到网络上。用户通过解压设备对这些数据进行解压后,节目就会像发送前那样显示出来
这个过程的一系列相关的包称为“流”。流媒体实际指的是一种新的媒体传送方式,而非一种新的媒体。流媒体技术全面应用后,人们在网上聊天可直接语音输入;如果想彼此看见对方的容貌、表情,只要双方各有一个摄像头就可以了;在网上看到感兴趣的商品,点击以后,讲解员和商品的影像就会跳出来;更有真实感的影像新闻也会出现。
流媒体技术发端于美国。在美国目前流媒体的应用已很普遍,比如惠普公司的产品发布和销售人员培训都用网络视频进行。
流式传输方式则是将整个A/V及3D等多媒体文件经过特殊的压缩方式分成一个个压缩包,由视频服务器向用户计算机连续、实时传送。在采用流式传输方式的系统中,用户不必像采用下载方式那样等到整个文件全部下载完毕,而是只需经过几秒或几十秒的启动延时即可在用户的计算机上利用解压设备(硬件或软件)对压缩的A/V、3D等多媒体文件解压后进行播放和观看。此时多媒体文件的剩余部分将在后台的服务器内继续下载。
2云计算
云计算概念是由提出的,这是一个美丽的网络应用模式。狭义云计算是指基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源;广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务,它具有超大规模、虚拟化、可靠安全等独特功效;“云计算”图书版本也很多,都从理论和实践上介绍了云计算的特性与功用。
股票里“多和空分别指什么。是什么意思” 多头:股票后市看好,先行买进股票,等股价涨至某个价位,卖出股票赚取差价的人。
空头:是指认为股价已上涨到了最高点,很快便会下跌,或当股票已开始下跌时,认为还会继续下跌,趁高价时卖出的投资者。
请罗列5个 所学的数据库 以及他们使用的浏览器
它们的含义 蜘蛛 垂直搜索殷勤 爬行 中间件 分布式检索
蜘蛛:当“蜘蛛”程序出现时,现代意义上的搜索引擎才初露端倪。它实际上是一种电脑“机器人”(Computer Robot),电脑“机器人”是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序,----什么是网络蜘蛛呢?网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网 站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
----这样看来,网络蜘蛛就是一个爬行程序,一个抓取网页的程序
垂直搜索引擎:垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用
户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深刻
爬行:爬行器(Spider)指在 Web 上漫游,寻找要添加进搜索引擎索引中的列表。爬行器有时也称为 Web 爬行榜(Webcrawler)或机器人。针对有机列表优化页面也就是为了吸引爬行器的注意。
网络爬虫,也称为蜘蛛程序(Spider)。网络爬虫是一个自动提取网页的程序,是搜索引擎的重要组成部分。作为爬虫来讲,就是尽可能多和快的给搜索引擎输送网页,实现强大的数据支持。
网络爬虫是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
如果把整个互联网当成一个网站,那么网络爬虫就可以用这个原理把互联网上所有的网页都抓取下来。 中间件:中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源。中间件位于客户机/ 服务器的操作系统之上,管理计算机资源和网络通讯。是连接两个独立应用程序或独立系统的软件。相连接的系统,即使它们具有不同的接口,但通过中间件相互之间仍能交换信息。执行中间件的一个关键途径是信息传递。通过中间件,应用程序可以工作于多平台或 OS 环境。 分布式检索:分布式信息检索将更大范围分布的异构数据联合起来,形成一个逻辑整体,为用户提供强大的信息检索能力,传统的搜索引擎的工作方式基本上是集中式的,它们将搜集来的数据相对集中地存放在某处,在用户进行查询时,由系统对这些信息统一进行检索,并将检索结果返回给用户。随着网络信息的膨胀,系统维护的数据库变得非常庞大,对这样的数据库进行查询操作非常费时,从而造成性能瓶颈。采用分布式的体系结构,以便提高速度,减轻负载,并使系统易于扩展。本论文就要研究,分布式信息检索的相关理论,通过对分布式中会遇到的问题和相应的解决方法,分布式文件系统,和检索系统的研究,最终能够提供一个比较完整的,稳定高效的解决方案。
三、判断题; 四、连线题;
五、1查找美国就业和增长挑战的作者,并指出它发表在哪一种杂志的哪一期:
迈克尔。斯宾塞 财经 20xx年24期
2北京交通大学硕士研究生温阳的硕士论文,并写出他的学科专业名称,论文题名及他的导师; 计算机图形学 李宇; 游戏中室外场景渲染技术的实现 3观看《一枝春雪冻梅花》 爱迪克森的视频,并写出他的主题内容; 梅花的特性及种植 国人与梅花的关系 梅花的应用前景
4查找“中国粮食作物辐射诱变育种和及其影响因素分析”这个项目的研究基金类型
国家自然科学基金项目