信息组织
1.信息组织:是指在系统科学理论指导下,依靠专门的技术方法和手段对信息资源进行选择
和整理,从而达到使这类资源得以充分利用的目的。(P2)
2.著录:即“文献著录”或“目录著录”,是对表示文献内容、外表形式和物质形态的特征
进行分析、选择和记录的过程,著录的结果是款目。(P3)
3.标引:指在分析文献内容或情报提问的基础上,用某种索引语言或标识符号把文献的主题
概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。按照使用的索引语言或标识符号的类型,可分为分类标引、主题标引和非主题标引。按照使用标引设备,可分为手工标引、自动标引和机助标引。(P3)
4.简述信息组织必要性(P4~5)
答:其一,知识和信息的海量性和无限性与人的精力和时间的有限性形成了尖锐的矛盾;其二,知识和信息的无序性和污染性与人类使用的选择性也形成了尖锐的对立。而信息组织是信息资源管理的基本范畴之一,是信息资源建设中心环节,是建立信息系统的重要条件,是信息检索与咨询的基础,是开展用户服务的有力保证。正是由于信息组织在信息资源开发领域中所处的至关重要地位及其在信息管理科学中所起的承上启下作用,所以,深入研究与解决关于信息组织的系列问题是十分必要。
5.信息组织:即信息序化或信息整序。也就是利用一定的科学规则和方法,通过对信息外在
特征和内容特征的描述与序化,实现无序信息流向有序信息流的转换。从而保证用户对信息的有效获取和利用及信息的有效流通和组合。(P6)
6.简述信息组织的基本专业要求与目的。(P6~7)
专业要求:(1)信息内容有序化;(2)信息流向明确化;(3)信息流速适度化。 目的:(1)减少社会信息流的混乱程度;
(2)提高信息产品的质量和价值;
(3)建立信息产品与用户的联系;
(4)节省社会信息活动的总成本。
7.信息组织发展的理论基础。(P7~8)
答:(1)系统科学理论:
20世纪20年代由奥地利路德维希·冯·贝塔朗菲提出。
系统:相互作用的诸要素的复合体,即处于一定相互关系中并与环境发生关系的各组
成部分的总体。
系统基本特征:整体性、内部相关性、环境相关性、层次性、有序性和目的性。
(2)耗散结构论:
20世纪60年代由比利时学者普里高津提出。
定义:在开放的系统中,系统不断与外界进行物质和能量的交换,熵趋于最小值,能
量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。
(3)协同论:
19xx年,海尔曼·哈肯提出。方式:自组织。指导思想:无论什么系统都是从无序到有序的转化,都是大量子系统之间相互作用而又协同一致的结果。
(4)知识组织的理论:
19xx年英国H.E.布利斯就曾使用过。
知识组织分为主观知识的组织和客观知识的组织两种类型。
(5)信息自组织理论
8.网罗度:反映了我们在信息揭示主题分析中对信息中论述的主题范围和数量的表征程度,
即信息本身是多主题还是单主题,信息包容了哪些主题。
专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示程度,
即各个主题是单因素主题还是多因素主题,各主题具体包容了哪些主题因素。
(P11)
9.从宏观上看,按照信息组织的组织对象把信息组织分为信息资源组织和检索工具。(P22)
10.依据信息资源的主题内容,主要有分类法和主题法两种。(P24)
11.七分法:是我国出现的最早的一种图书分类体系,始创于汉代的《七略》,后现于南朝的
《七志》 、梁朝的《七录》 。(P27)
四部法: 即四部分类体系,是我国古代占主导地位的一种图书分类体系。到清代编制《四库全书总目》时,四部法就更加完善了 。(P27)
近代图书分类体系:《仿杜威书目十类法》 ,《中国图书十进分类法》 ,《中国十进分类
法》(P28~29)
12.MARC---机读目录。
MARC格式是被设计来用于以机器可读形式共享书目和其他相关信息的标准。(P39) OCLC---联机计算机图书馆中心
13.信息构建:(P42)
信息构建就是从信息复杂的状态中抽取本质要点,并将这些要点以清晰、美观、易用的方式提交给用户。
14.信息过滤:是指计算机根据用户提供的一个过滤要求,从动态变化的信息流(比如Web)
中自动检索出满足用户个性化需求的信息。(P43)
15.知识组织的方法:(P48~49)
知识表示、知识重组、知识聚类、知识存检、知识编辑、知识布局、知识监控。
(1)知识表示:是将知识对象中的知识因子和知识联系表示出来,以便于人们识别和理解。
(2)知识重组:是知识组织的初级但很重要的方法,是对知识对象内的知识因子和知识联
系进行语法结构上的重新整合,结果生产出新的知识产品。
(3)知识聚类:是将知识按一定的聚类标准分门别类地加以类集和序化的过程,它也是一
种形式的知识重组。
(4)知识存检:是由“存储”和“检索”两个方面构成的系统或过程,知识因能存储而得
以积累和延传,因能检索而得以吸收利用。
(5)知识编辑:是指对知识客体进行的搜集、整理、加工制作等编辑活动。
(6)知识布局:是一种宏观的知识组织方式,是指对社会上的知识资源进行调配和布局,
2 / 7
以实现知识资源的合理配置,满足社会、经济、文化发展的需要。根据载体不同分为主观知识布局和客观知识布局。
(7)知识监控:只要是指政策主体按照自己的意思和利益,制定相关的政治法规,对知识
主体(包括生产主体、管理主体和利用主体)的行为活动加以限制和监督。
16.国际标准书目著录(ISBD)(P54)
《国际标准书目著录》是国际图联(IFLA)根据19xx年国际编目专家会议的建议,为了实现文献编目工作标准化,特别是为了实现文献著录的统一和规范而制定的一套供各类型文献著录用的国际标准。
17.MARC记录的总体结构特点(P71):
(1)可变格式可变长字段的记录格式;
(2)采用目次方式;
(3)每条MARC记录分3个区:头标区、目次区和数据区
(4)物理记录和逻辑记录的关系:物理记录又称字块。MARC格式采用固定长字块不定
形式的记录数据的方式。每个物理记录的长度是4096个字节。因此,经常在一个字块中存放多个MARC记录,或一个MARC记录分存于两个或两个以上字块中。但是,不管一个MARC记录有多长,仅有一个头标区和目次区。
18.置标语言:就是一种用来给文本添加标记的语言。
置标:就数据本身的信息对数据进行编码的方法。(P77)
标准通用置标语言---SGML
超文本置标语言---HTML
可扩展的置标语言---XML
HTML使用语句(P81~89)
19.文件类型定义(DTD)
DTD是SGML语言程序的一个重要组成部分。DTD规定了一个语法分析器解释一个“有效的”XML文件需要知道的所有规则的细节。(P93)
20.元数据:就是“关于数据的数据”,是对数据进行组织和处理的基础。(P94)
21.都柏林核心的设计原则(P114~115):
(1)内在本质原则;(2)可扩展原则;(3)语法独立原则;(4)可选择性原则;
(5)可重复原则;(6)可修饰原则。
22.信息资源分类:指根据信息资源内容的学科属性与相关的其他特征,对各种类型的信息资源予以系统的揭示、区分,并进行组织的一种方法。
信息资源分类特征:
(1)揭示信息资源;(2)区分信息资源;(3)组织信息资源。(P128)
23.信息资源分类法(文献分类法)类型:(P129~130)
(1)等级列举式分类法;
3 / 7
(2)分面组配式分类法;
(3)半分面分类法(列举—组配分类法)
半面分类法的主体结构是属于等级列举式分类法的基本体系,而分面组配的思想与方法又主要体现在附表的复分方面。
24.科学分类:是指根据事物各自的特殊矛盾及其运动规律对事物进行划分类别。
信息资源分类:是在科学分类的基础上,依据信息资源内容特征和一些非本质属性等对信
息资源进行划分类别的过程。(P131)
25.复分表依据使用范围分为通用复分表和专类复分表。
26.标记符号的作用与特点:(P136~137)
(1)在分类法的标记符号中,通常以简洁的号码来代替类目的名称,反映类目的内涵和表
达类目概念,将类目的文字主题转变为分类语言,在文献信息组织、加工、排检中就非常方便。
(2)以号码标记类目,易于固定类目先后次序。也易于文献信息工作者对类目体系的了解和掌握。
(3)类号之间的关系同样可以反映类目之间的关系,在一定程度上可增强文献分类检索的逻辑性。
由此可看出,标记符号有方便性、易记性、逻辑性特点。
27.冒号分类法提出年份,作用,特点
《冒号分类法》 :19xx年出版第一版
作用:类表篇幅小,容纳性大,标引文献能力强,能及时反映新学科和新主题,
可以满足读者多种检索的要求。
特点: (1)冒号分类法是典型的组配-体系分类语言。冒号分类法的主要精神是
分面分析理论,但就冒号法的总体而言,还不是一个纯粹的分面组配分类法,是在对人类知识做基本划分的基础上再逐类进行分面分类,它是具有体系分类因素的分面分类法,有人谓之组配-体系分类法。
(2)冒号分类法的组配特点:冒号分类法的组配是多方面的有面间组配,类间组配、面内组配和类列内组配。(来自百度)
28.几种国内外分类法:
(1)《杜威十进分类法》(DDC)
(2)《国际十进分类法》(UDC)
(4)《美国国会图书馆图书分类法》(LC或LCC)(
(5)《中国图书馆分类法》是属于等级列举分类法,采用五分法设立了5大部类,在部类的基础上扩展为22个基本大类(P154~155)
《中国图书馆分类法》采用的汉语拼音字母与阿拉伯数字相结合的混合号码制。它用一个字母表示一个基本大类,通过字母的顺序反映大类的序列。(P155)
29.主题词:经过选择,用来表达信息资源主题的语词。
主题法:一般是指就直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、
并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。(P177)
4 / 7
30.主题法的类型按照选词方法划分:(P179~181)
(1)标题法(2)元词法(3)叙词法(4)关键词法
我国目前使用最广泛的叙词表为《汉语主题词表》 。
叙词法特点:
(1)结构完备,词汇控制严格,可以根据检索系统的需要时间对词汇进行有效控制;
(2)组配准确,标引能力强,能够准确、专指的标引和揭示各种主题内容;
(3)检索效率高,可以通过灵活组配方式进行多途径检索,达到更好的检索效果;
(4)检索系统适应能力强,可以同时适用于标识单元和文献单元检索方式,既能较好适应计算机检索系统的要求,又能适应于手工检索的要求。
31.组成叙词字顺表的基本构成单元是叙词款目和非叙词款目。
两者都是由款目项、标注项及参照项三项组成。(P198)
32.整体标引:也叫浅标引,是一种概括提示信息资源基本主题内容的标引。
全面标引:也叫深标引,是一种充分提示信息资源论及的所有有检索价值的主题概念的
标引。(P214)
33.对主题概念转换,主要有概念的直接转换和概念的分解转换两种方式。(P218)
34.分解转换的方法和规则:(P218~219)
(1)必须进行概念分解,避免字面分拆;
(2)要善于掌握分解转换的程序,按照从专指到泛指的次序进行查找,对于一个复杂主
题概念有时往往可以有多种分解转换的形式。
(3)必须根据概念内涵析出最专指的分解形式。
35.主题标引选用标引词适度标引规则:
这是指标引深度要适当。叙词标引深度一般用每一文献标引的叙词数量来衡量。(P223)
36.分组标引:是指标引同一文献中的多个主题时,为防止表达不同的叙词之间发生虚假组配,产生文献中没有相关内容的概念,应将表达(往往是组配表达)各主题的叙词相应的分组,予以区别。(P226)
37.分类主题一体化:是指分类系统与主题系统实现完全兼容,既能充分发挥各自特有的功能,又能互相配合,发挥最佳的整体效应。它包括检索系统的分类主题一体化和检索语言的分类主题一体化。(P248)
38.分类主题一体化词表,按其结构可分为分面叙词表、叙词表式索引、分类表—叙词表对照索引和集成叙词表四种类型。(P251)
39.网络信息资源组织新特征:(P266~267)
(1)网络信息资源组织的技术先进化;
(2)网络信息资源组织的多元化和动态性;
(3)网络信息资源组织的概念关联复杂化;
(4)网络信息资源组织的非线性特征;
5 / 7
(5)网络信息资源组织的易用化和透明化。
40.网络信息资源组织的目标:(P267)
(1)网络信息组织方法应能够处理各种类型的信息资源,以建立符合网络资源内容特点
的网络信息资源组织方法体系,并深入到知识单元、信息单元,便于显示信息之间的语义关联,便于对知识内容的深度挖掘;
(2)网络信息资源组织应设置标准的信息终端和良好的检索交互界面,提高网络信息资
源组织应用的通用性、易用性;
(3)网络信息资源组织应根据用户对信息的需求进行组织的,应重视它的实用性和针对
性。
41.网络信息资源组织方式:(P268~273)
①文件方式 ②数据库方式 ③网站方式 ④超文本/超媒体方式 ⑤主题树方式
⑥搜索引擎方式 ⑦复合方式
42.从网络信息资源的存储形式角度,将网络信息资源组织方式区分为文件方式、数据库方式、主题树方式和超媒体方式。(P268)
43.应用于网络信息资源检索系统的叙词表:(P284)
①独立的叙词表 ②集成在数据库或信息检索系统中的叙词表
44.在网络信息资源检索系统中一个完整的检索过程包括三个步骤:(P284~285)
(1)叙词浏览;(2)选取领词;(3)检索。
45.语义网:(the semantic Web)是指能够根据语义进行判断的网络,其中的语义就是文本的含义。(P292)
46.本体:是对领域内概念的本质和关系所作的详尽和明确的描述。(P296)
47.本体对于信息组织至关重要,主要的原因:(P298)
(1)本体关于领域知识的共同理解和描述,使得现代网络信息资源组织是建立在语义信
息而不是语法信息基础之上的,它是以信息(或知识)内容或其本质特征为依据进行信息组织的有效方法,它在优化网络信息资源组织的同时,也必将促进信息组织向知识组织的转变。
(2)信息组织的目的是建立有效的信息系统,从而便于信息的检索和利用,而本体对于概念及其之间关系的精确描述可以极大地提高信息系统的检索效率。
(3)本体面向计算机和网络的特点及其形式化描述使其能更好地满足现代信息组织,特别是网络信息资源组织的需要。
48,网络信息资源组织的本体论与分类法和主题法的关系:(P298)
长久以来,我们一直采用分类法和主题法来组织和描述信息。然而面对信息资源越来越复杂多样的情况,则要求有功能更加强大的资源描述工具来支撑。本体作为一种能在语义和知识层次上描述概念体系的有效工具,正好符合了这种趋势。
6 / 7
49.网络信息资源信息重组:是指将网上零散的、无序的、优劣混杂的大量的信息进行筛选、解构、组合、整序,使之有序化的过程。(P303)
50. 数据挖掘:数据挖掘是网络知识挖掘的基础。数据挖掘是指从大量的、不完全的、有噪
声的、模糊的、随机的数据中,提取隐含在其中的、事先未知的、潜在的、
有用的知识的过程。(P306)
网络知识挖掘:是指利用数据挖掘技术,自动地从异构数据组成的网络文档中发现和抽
取知识,从概念及相关因素的延伸比较上找出用户需要的深层次知识的过
程。(P306)
51.根据挖掘对象不同,网络知识挖掘可分为:网络结构挖掘,网络用法挖掘,网络内容挖掘。
52.分析论述题:网络信息资源
N1-503 牛奶 杏仁露 卷子
倾情奉献,如有不足,欢迎指正~~
嘿嘿~~好好复习,加油!!!
7 / 7
第二篇:《信息组织》复习要点
第一章
一、名词解释
1、 文献:是用一定的技术手段把一定的信息内容记录到一定载体上形成的存储型传递媒
体。
2、 著录:对表示文献内容、外表形式和物质形态的特征进行分析、选择和记录的过程。
标引:指在分析文献内容和情报提问的基础上,用某种索引语言或标志符号把文献的主题概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。按照索引语言或标示符号的类型,可分为分类标引,主题标引和非主题标引。
3、 款目:依据一定的方法,对表示文献内容,外表形式和物质形态的特征所做出的记录。
4、 信息组织的必要性即为什么要学习信息组织?
a.知识和信息的海量新和无限性与人的精力和时间的有限性形成了尖锐的矛盾; b.知识和信息的无序性和污染性与人类使用的选择性也形成了尖锐的矛盾;
c.越来越多的人意识到,“原始信息本身并不能产生价值”,只有对信息资源采用相应的方法加以控制和处理才能使人们实现对其合理开发和有效利用,而信息组织则是解决这一问题的根本方法和关键措施之一;
d.深入研究与解决关于信息组织的系列问题是十分必要的。
5、 信息组织(信息序化或信息整理):利用一定的科学规则和方法,通过对信息外在特
征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
6、 信息组织的基本专业要求是?
a.信息内容有序化;
b.信息流向明确化;
c.信息流速适度化。
7、耗散结构论是比利时学者普里高津提出来的;
协同论是德国物理学教授海尔曼.哈肯提出来的。
知识理论——H.E.布里斯提出来的。
知识组织可分为主观知识的组织和客观知识组织两种类型。
8、 专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示过程。
9、 按照信息组织的组织对象把信息组织分为信息资源组织和检索工具; 依据信息组资源的注意内容,主要分为分类法和主题法。
第二章
1、 七分法是我国出现最早的一部图书分类体系,始创于汉代的《七略》,后现于南朝的《七志》和梁朝的《七录》。
2、 《四部法》是我国的古代占主导地位的一种图书分类体系。
3、 《四库全书》是《四部法》发展,分为经、史、子、集四部。
4、 《人大法》《科图法》《中图法》是我国现在仍然在使用的大型综合性文献分类法。
5、 MARC格式(机读编目格式):被设计用于以机器可读形式共享书目和其他相关信息的标准。
6、 网格:网格是把整个互联网整合成一台巨大超级计算机,实现计算机资源、存储资源。数据资源、信息资源、知识资源、专家资源的全面共享。
7、 信息构建:从信息复杂的状态中抽取本质要点,并将这些要点以清晰、美观易用的方式提交给用户。
8、 信息过滤:计算机根据用户提供的一个过滤要求,从动态的信息流中自动检索出用户个性化需求的信息。
9、 从过滤方法看,知识过滤分为认知过滤、经济过滤、社会过滤,社会过滤有称为合作过滤。
10、 信息是物质的一种普遍属性,是物质存在的方式和运动的规律及特点,它们普遍存在于自然界、社会和人类思维活动中,信息是在媒体上按空间顺序排列的字符序列。
11、 知识:人们在改造世界的时间中所获得的认识和经验的总和。
12、 知识表示:是指把知识客体中的知识因子与知识关联起来,便于人们识别和理解知识。
13、 知识重组:是对知识对象的知识因子和知识联系进行语法结构上的重新组合,产生新的知识产品。
第三章
1、 国际标准书目著录简称为ISBD;
2、 英美编目条例第二版简称为AACR2;
3、 机读目录简称为MARC。
4、 每条MARC记录分为三个区:头标区、目次区、数据区。数据区又分为控制区和可变
区,所以有时候称为四个区。
置标语言:一种给文本添加标记的语言。
5、 置标:就数据本身的信息对数据加以编码的方法
6、 标准通用置标语言简称为SGML;超文本置标语言简称为HTML;可扩展置标语言简称
为XML。
7、 元数据:就是关于“数据的数据”是数据组织和处理的基础。
8、 都伯林核心元素集也被称为都柏林核心,简称为DC。目前未限定的都柏林核心元素
集共有15个元素。
9、 DC的元素限定词主要有三类:语言、模式、类型。
10、 都柏林的核心的设计原则?
内在本质原则;
可扩展原则;
语法独立原则;
可选择性原则;
可重复原则;
可修饰原则;
第四章
1、信息资源分类:是指在科学的分类基础上,依据信息资源的内容特征和一些非本质属性等对信息资源进行划分别类的过程
2、半面分类法:以等级列举式的类目体系为基础,在类目扩展方面采用分面组配的方法。
3、半分面分类法的主题结构是属于等级列举式分类法的基本体系,而分面组配的思想与方法又主要体现在附表的复分方面。
4、文献分类法主要包括三种类型:等级列举式、分面组配式、列举组配式;列举式分类法主要是将所有的类目组成一个等级系统。它的结构一般是等级树状结构,最终形成一个比较完整的等级链。
5、《中图法》的特点:
类目体系严谨;等级列举与组配结合;分类兼容性
6、主表分为基本部类、基本大类、简表和详表
7、《汉语主题词表》有4个附表:范畴索引、词族索引。轮排索引、英汉对照索引。
8、建立类目体系应遵循的原则:属性原则、知识原则、逻辑原则、国家原则。
类目关系主要可以分为两大类,相关关系和非相关关系。相关关系一般包括从属关系,同一关系和交叉关系。
10、《国际十进制分类法》简称UDC
12、《中图法》采用汉语拼音字母与阿拉伯数字相结合的混合号码制(双字母制、小数制)。
13、《人大法》《科图法》《中图法》是我国现在仍然在使用的大型综合性文献分类法。
14、分类款目是指以分类号作为标目的款目,分类款目可以分为主要分类款目、附加分类 款目和综合分类款目。
16、分类目录是一句分类款目的标识,按照分类号之间的逻辑体系,将分类款目进行组 织,编排后形成的目录。
17、信息资源分类的特征?
1)揭示信息资源,就是对信息资源的内容特征和形式特征等进行比较、分析、研究、评价,并进行揭示的过程,可以内容和形式两个方面揭示信息资源;
2)区分信息资源,就是根据揭示出来的内容特征与形式特征,将不同类型的信息资源的内容特征或形式特征进行比较,从而将信息资源区别开来;
3)组织信息资源,是指将区分开来的信息资源,按照一定的组织标准,将信息资源及其相关记录存储于文献体系的逻辑系统中
第五章
1、标引信息资源分类号的方式多种多样,主要有整体标引、全面标引、重点标引、分析标引和互见标引。
2、主题法:直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。
3、 按照选词方法奖主题法划分为:标题法、元词法、叙词法、关键词。
组成叙词字顺表的基本构成单元是叙词款目和非叙词款目
4、《汉语主题词表》的结构:主表、附表、辅助索引;
5、附表包含:世界各国行政区划名称、自然地理区划名称、组织机构、人物;
6、 辅助索引包含:范畴索引、词组索引、轮排索引、英汉对照索引。
7、组表叙词款目结构通常是由款目叙词、汉语拼音、英语译名。范畴号、注释项及其语 义关系。
8、《汉语主题词表》有4个附表:范畴索引、词族索引。轮排索引、英汉对照索引。
9、专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示过程。 按照索引语言或标示符号的类型,可分为分类标引,主题标引和非主题标引。
10、标引:指在分析文献内容和情报提问的基础上,用某种索引语言或标志符号把文献的主题概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。
11、叙词法的特点:
a.结构完备,词汇控制严格,可以根据检索系统的需要对词汇进行有效的控制; b.组配标准,标引能力强,能够准确、专指的标引和揭示各种主题;
c.检索效率高,可以通过灵活组配方式进行多途径检索,达到更好的检索效果; d.检索系统适应能力强,可以同时适用于标识单元和文献单元检索方式,既能较好适应计算机检索系统的要求,又能适应于手工检索的要求。
13、 分解转换主题标引的方法和规则
A.必须进行概念分解,避免字面分拆;
B.要善于掌握分解转换的程序,按照从专指到泛指的次序进行查找,对于一个复杂主题概念有时往往可以有多种分解转换的形式;
C.必须根据概念内涵析出最专指的分解形式。
第六章
1、分类主题一体化包括检索系统的分类一体化和检索语言的分类主题一体化。
2、分类主题一体化词表,按其结构可分为分面叙词表,叙词表式索引,分类表——叙词 表对照索引和集成叙词表四种类型。
3、分类法与主题法在对新学科的适应能力的差异
a.在反映新主题时,分类法不如主题法灵活,及时;
b.由分类法属先组式检索语言,表达文献主题概念受类目局限,增添和改变类目困难,对新学科、交叉学科和边缘学科难以找到恰当的位置,标引时,只能采用一些简单的人为方法,跟不上现代科学技术发展的需要;
c.主题法是一种后组式检索语言,可以通过主题词组配来表达文献的主题概念,新主题词只要名称一经确定,按照词序总有它一定的位置,还可以根据科学技术的发展与文献的实际情况,增加或补充新词,删除或调整旧词,使系统中内容的主题与科技发展同步。
第七章
1、网络信息资源组织特征
A.网络信息资源组织的技术先进化;
B.网络信息资源组织的多元化和动态化;
C.网络信息资源组织的概念关联复杂化;
D.网络信息资源组织的非线性特征;
E.网络信息资源组织的易用化和透明化。
2、网络信息资源组织的目标
A.网络信息资源组织方法应能够处理各种类型的信息资源,以建立符合网络资源内容的特点
的网络信息资源组织方法体系,并且深入到知识单元、信息单元,便于显示信息之间的语义关联,便于对知识内容的深层挖掘;
B.网络信息资源组织应设置标准的信息终端和良好的检索交互界面,提高网络信息资源组织
应用的通用性、易用性;
C.网络信息资源组织应根据用户对信息的需求进行组织,应重视它的实用性和针对性。
3、 以文件组织网络信息资源组织的优势和劣势
优势:a.简单方便;
b.它是存储非结构化信息的天然单位。
劣势:a.随着网络信息资源组织的不断普及和信息量不断增多,以文件为单位共享和传输 信息就会使网络负载越来越大;
b.对结构化信息的组织与管理显得软弱无力;
c.随着以文件形式保存和管理的信息资源的迅速增多,文件本身也需要作为对象进 行管理。
4、 传统分类法在网络信息资源组织中功能上的优势
A.使组织非文本信息成为可能;
B.为管理超文本系统提供指南;
C.更适用于网络信息的浏览检索。
5、 本体对于网络环境下的信息组织至关重要的原因是:
A.本体关于领域知识的共同理解和描述,使得现代网络信息资源组织是建立在语义信息而不是语法信息基础之上的,它是以信息内容或其本质特征为依据进行信息组织的有效方法,它是在优化网络信息资源组织的同时,也必将促进信息组织向知识组织的转变;
B.信息组织的目的是建立有效的信息系统,从而便于信息的检索和利用,而本体对于概念及其之间关系的精确描述可以极大地提高信息系统的检索效率;
C.本体面向计算机和网络的特点及其形式化描述使其能更好地满足现代信息组织,特别是网络信息资源的需要。
6、语义网:是指能够根据语义进行判断的网络。
7、网络信息资源重组:是指将网上零散的、无序的、优劣混杂的大量信息进行筛选、解构、组合、整序,使之有序化的过程。
按照表现形式,可将网络信息资源区分为全文型网络信息资源、数值型网络资源、书 目索引网络信息、资源和实时活动型网络信息资源。
8、网络知识挖掘:是指利用数据挖掘技术,自动地从异构数据组成的网络文档中发现和抽取知识,从概念及相关因素的延伸比较上找出用户需要的深沉次知识的过程。
9、 根据挖掘对象的不同,网络知识挖掘可分为:网络结构挖掘,网络用法挖掘和网络内 容挖掘。