您好,欢迎来到吉趣旅游网。
搜索
您的当前位置:首页信息组织的复习资料(重点)

信息组织的复习资料(重点)

来源:吉趣旅游网
第一章导言

1、信息组织:亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。 2、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。作为一种为了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。

3、信息组织与信息检索的关系(P3) (1)信息组织是信息检索的基础和前提。 (2)信息检索是信息组织的出发点和归宿。

总之,信息组织与信息检索是密切联系,相辅相成的两个环节。要使信息组织取得较好的效果,必须充分了解系统的检索需要,根据信息资源的特点和用户的使用要求加以实施。 4、按照检索工具的对象和特点,可以分为以下类型:

(1)文献目录:是以文献集合中的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏和数目。前者以一个或多个文献单位收藏的文献为对象加以描述和揭示;后者则以某一领域、地域或者时限内出版的文献为对象进行组织,为用户提供较为全面的文献信息。 (2)索引:是以文献集合中的文献单元或者文献中的信息单元为揭示对象的检索工具,包括图书索引、期刊索引、报纸索引、专利索引、标准索引、档案索引、会议文献索引、词语索引、书后索引等。

(3)机读数据库:是由文献资源为对象的机读记录的有序集合。这是一种依托现代计算机技术,以机读形势建立的索引系统。

(4)网络搜索引擎:这是一种以网络信息资源为研究对象的检索系统,实际上是数据库的一种特殊形式。

5、按照依据的标识特征,检索工具可以分为两种:

一类以信息资源的外部特征为检索依据,提供从资源形势出发进行检索的途径。常见的这类标识包括:责任者名、题名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等。

另一类则以表达信息主题内容标识为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种.

分类法以表达信息资源内容的标记符号为标识,按照主题之间的关系进行系统组织;主题法直接以表达文献内容的词语为标识,依据主题字顺等方式检索途径。 按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。 信息组织的常见类型(P7) 6、对信息资源处理的基本做法是: (1)对信息资源的特征进行描述。 (2)对信息资源的内容进行浓缩。

1

(3)提供检索点。

7、检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。 8、信息组织活动包括两个基本的方面:

(1)信息组织的操作。指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。

(2)信息资源组织规范。这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。

第二章信息组织原理

1、信息组织的主要目的是为了有效地检索和利用.一般认为下述因素是一个信息组织系统必须考虑的重要因素:(1)检全率(2)检准率(3)检索速度和系统的及时性(4)系统的易用性(5)检索的成本效益

2、检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。可以表示为:检全率=检出相关信息资源量/系统相关信息资源总量*100% 表示系统检出相关信息资源的能力。

3、检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。可以表示为:检准率=检出相关信息资源量/检出信息资源总量*100%

表示检索系统排除与检索提问无关信息资源的能力.

检索系统的检全率与检准率之间是一种互逆关系.因为检全率高,必然会检出一些内容关联程度较低的信息资源,从而影响系统的检准率;反之提高检准率,则要求排除与检索提问关联程度较低的信息资源,必然会反过来影响系统的检全率。 4、检索速度:指用户实施检索时获得检索结果花费的时间。

5、系统的及时性:检索工具能否在较短时间内将信息资源纳入系统,以较快速度提供使用。 6、系统的易用性:系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中是否可以得到各种减少处理差错的提示和帮助等.

7、描述控制:描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。

(1)描述项目的控制:根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目.描述项目应该充分反映信息资源的基本特征和数据.

(2)描述文字的控制:规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。 (3)描述级别的控制:规定对信息资源进行描述的详略程度.应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。

2

(4)描述格式的控制:包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。

8、词汇控制:词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。 9、词汇控制包括下述内容:

同义控制:即对字面形势不同,含义相同的词进行控制,使一个概念只能用一个语词表达:目的是克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。

词义控制:即对同形异义词和语意含糊的词进行控制,使得词义明确,一个词语之表示一个概念,客服克服一词多义现象。常用措施:加限义词、增设含义注释和范围性注释等方法。 词间关系控制:指揭示词汇之间的各种联系,使其还曾为一个语义相关的系统。

10、句法控制:根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定.

11、句法控制的内容:1、引用次序:指复合主题标引和检索时,各个主题因素的组合次序2、辅助符号:是检索语言解释主题概念之间关系意义,进行检索操作的标识形式3、句式转换:简单地说,就是转换语词的排列顺序。

12、辅助符号是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。 13、常见的组配符号有以下几种:

(1)关系符号-—用于揭示语词组配中形成的关系类型的符号,常用于先组式检索系统。 (2)逻辑组配符号——使用逻辑符号对组配关系实施控制,可以进行各种演算,实施精确查找,常用于后组式检索系统。

(3)联系符号—-用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现错误的组配关系,常用于后组式检索系统.

(4)职能符号——用以表明主题标识在组配中的句法职能的辅助符号,作用是明确主题标识的句法含义,防止出现错误的组配关系。 14、句式转换的形式通常有三种:

(1)轮排转换。即依次将检索语句中每一个有检索意义的语词轮流在排检位置上出现,并对句子中其他语词在保持原有相对位置的情况下随着移动。

(2)链式转换。即通过逐次拆卸链环的方式,依次将检索检索语句中每一个有检索价值的语词作为检索语句的入口。

(3)分析转换。即每次抽取少量主题词组配标题,使所有检索价值的词都可以成为检索入口。 15、概念之间的关系:

(1)同一关系:具有相同外延的概念之间的关系.

(2)包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。 (3)交叉关系:部分外延重合的概念之间的关系.

3

(4)不相容关系:不存在共有外延的概念之间的关系。

(5)矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。 (6)反对关系:外延之和小于属概念的两个相互对立概念之间的关系。 (7)并列关系:一个属概念下几个不存在共有外延的并列种概念之间的关系。 16、信息资源组织的特点:

信息资源组织除应采用逻辑的方法,以知识分类为基础外,同时还必须根据信息资源的特点和检索需求进行控制,一般应考虑以下各方面因素:

(1)文献保证原则:文献保证亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。

(2)用户保证原则:所谓用户保证,即是指根据用户需要进行描述控制和词汇控制。 (3)与设备条件相适应:信息组织中的规范控制是在一定的设备条件下使用的,只有与设备条件的特点相一致,才能取得较好的实际效果。

第三章信息描述

1、信息描述:信息描述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。在传统文献检索系统的编制中,信息描述又称为文献著录或书目著录,是信息资源组织的重要内容。信息描述的结果,是获得描述记录,亦即元数据,用作信息资源的代替物组织检索工具。 2、元数据:所谓元数据是关于数据的数据,或关于数据的结构化的数据。

3、信息描述的作用:(1)识别:确认并对要进行组织的信息资源进行个别化描述,使用户能识别该组织的资源对象(2)定位:提供信息资源位置的信息,以便供用户访问时使用(3)检索:通过在描述数据中提供检索点,方便用户对资源的检索和利用(4)选择:通过记录信息资源的各种特征,诸如主题、作者、资源类型、篇幅、出版或发布信息以及日期等,供用户对信息资源的使用价值进行判断,决定是否选择该资源

4、信息描述的规范:为了一致、有效地对信息资源进行描述,便于不同机构之间的信息交换,信息描述通常应依据一定的描述规范进行。(书目文献领域描述标准化的努力最为典型。文献描述标准,亦即文献著录标准。) 5、著录格式:指描述记录内各个描述项目的记录次序和表述方式。

6、描述信息源:又称著录信息源、著录根据,指进行信息资源描述时描述信息的来源和出处。 7、检索点:检索信息资源所使用的题名、责任者、分类号、主题词等各种供检索使用的数据。 8、题名检索点:建立题名目录的依据,可以从题名角度查找信息资源局,是检索文献的重要途径之一。

9、参照法的基本类型:(1)单纯参照、(2)相关参照、(3)一般参照. (1)单纯参照,又称直接参照,从不用作标目的标识去查找用作标目的标识。 (2)相关参照,又称兼互参照,从一个使用的标目去参考另一条或几条相关标目的参考

4

(3)一般参照,又称普通参照,是提供关于一定编目事项的说明,介绍用户使用系统的方法。 9、规范文档:一种根据信息组织的需要,对元数据记录的标目进行控制、跟踪、维护的工具,包括名称规范档、主题规范等。

10、规范控制的作用:(1)有利于以统一的方式加以记录.(2)以规范、通用的形式加以记录(3)方便标引和检索(4)有助于实现国际书目共享。

11、名称规范档:是一种对描述记录中的名称标目进行规范控制的工具.其处理的范围,包括人名、机构团体名、著作题名等。

12、对几种基本名称类型的规范:(1)人名规范控制(2)团体责任者规范控制(3)题名规范控制

13、计算机编码的作用:(1)控制显示方式(2)提供检索点(3)促进资源共享

14、MARC格式:机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式.我国使用的是《中国机读目录格式》,简称CNMARC. 15、机读目录格式中,一个书目记录通常由以下四部分组成:(1)记录头标区(2)地址目次区(3)数据字段区(4)记录分隔符

16、标记语言的作用:为了方便计算机处理文档,例如标记前的文档,标记后的文档。 17、标记语言:标记语言是指在文本文件中使用一个代码集,用于指示计算机在打印机或显示器上编排文件的格式,以及文件中的索引和链接内容等。

18、标记语言的分类:一般通用的标记语言、特殊用途的标记语言。

19、SGML:描述电子文件的结构及内容的国际标准,文献的一种计算机语言的一种元语言。 20、SGML与XML、HTML的关系:HTML是由SGML定义的,是SGML在WWW上的具体应用,XML是SGML的子集.

21、XML:SGML的子集的一种元语言。它的优越性:扩展性,数据的显示与处理分离,支持异构系统间的通信,更有意义和更准确地搜索 第四章 信息描述工作

1、为了保证元数据的质量,信息描述操作必须客观的反映信息资源的特征,严格遵守元数据规范进行操作,一般应做到:(1)准确。即对信息资源的描述应真实反映其内容特征,通常应根据描述对象提供数据加以记录,必要时,也可以参考其他来源对有关的数据加以纠正,使用可以通过描述,对信息资源的特征有一个准确的了解。(2)规范。指信息资源的描述应严格遵守相应的描述规范,并在可能时依据相关的规范文档或控制词表.(3)完备。描述项目应比较完备,使得可以从信息资源的各种特征出发进行检索操作,文献单位对传统文献的描述一般应按照系统规定的描述级别进行,对各种电子资源,特别是网络资源的描述,也应该利用相关条件句对各种特征进行充分记录,尽可能保证基本数据的完备。

2、信息描述工作的方式:(1)按照描述的资源对象,分为文献编目、档案编目、博物馆藏品编目、网络资源编目(2)按照其处理的方式,分为原始编目和复制编目(3)按照编目采用的组织形式,集中编目和共享编目

3、在版编目:在文献出版过程中进行编目,使编目数据得以与文献一起提供,方便文献机构使用。

5

4、共享编目:两个或多个编目机构共同进行编目活动,通过各个参加机构通力协作,使编目结果为各参加机构共享的一种编目形式。

5、OCLC:该机构原为美国俄亥州图书馆中心,后来发展为对全美和各国进行书目服务的机构。中国高等教育文献保障体系(简称CALIS)

6、信息描述工作程序:(1)查重(2)描述(3)标引(4)复核

7、Connexion系统的特点:(1)编目工作界面功能完备、形式简明、友好,能同时提供DC、MARC方式的编目界面,使用者可以通过它方便地对网络资源进行各种与描述有关的操作。(2)具有通过协作编目方式建立的资源目录,该目录的所有记录同时也进入OCLC的Worldcat,可以通过资源目录或Worldca检索已有的描述记录,供编目操作时查重或作为信息描述的参考之用.(3)可以自动获取网络资源已有的元数据信息,只要输入有关该资源的urL或各种相关数据,系统就能够自动获取网络资源的基本信息,在编目界面上显示,供进行各种必要的处理。(4)根据设计,可以通过系统与DDC、国会标题表、人名规范文档等建立联系,并利用上述工具进行规范标引。(5)处理结果可以方便地实现不同格式如DC格式、MARC格式、HTML语言方式、XML语言方式.

8、题名:创建者或出版者赋予信息资源的名称。

9、责任者指对信息资源的生产负有责任的个人或团体,是区别信息资源的的一个重要特征。

第五章分类法

1、分类及信息资源分类的特征

分类:是指依据事物的属性或特征加以区分和类聚,并将区分的结果按照一定的次序进行组织的活动,分类是人类思维的基本形式,是认识世界的基本方法。

信息资源分类的特征:(1)按照内容特征对的相互关系进行组织的。(2)从一定角度出发组织和揭示信息信息资源的(3)采用一定的标记符号作为排序工具(4)往往通过类目索引提供从字顺角度查找类目的途径。

2、信息资源的作用:(1)进行资源组织(2)建立分类检索工具(3)分类统计(4)兼容工具 3、分类法:一种从主题内容角度组织和揭示信息资源的方法,是分类方法在信息资源组织中的应用。

4、分类表:亦称信息资源分类表,是根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具。分类表是分类法的具体体现,它与分类规则一起构成分类语言,是进行分类工作的依据和规范,十分关键。由于它的重要作用,人们习惯上也直接将它称为分类法。 5、信息资源分类法按照其编制方式,通常可以区分为:(1)等级列举式分类法(2)分面组配式分类法(3)列举组配式分类法

6、等级列举式分类法:等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法,亦称列举式分类法、枚举式分类法。 特点:①从一定的角度出发有层次地揭示信息资源,类目展开比较系统;

6

②分类结构显示直观,易于把握、便于使用;

③标记简明,号码单纯,适于分类排架,也可以用于组织分类检索工具。

不足:①揭示专门主题能力差,往往无法满足确切分类的需要,不能充分揭示现代文献中大量存在的细小专深主题;

②类表具有一定的凝固性,不便于根据需要随时改变、调整检索途径,不能进行多角度检索; ③无法根据现代科学的发展自动生成新类,难以与科学的发展保持同步; ④大型列举类表一般类目详尽、篇幅较大,对类表管理的要求较高. 7、分面组配式分类法:以简单概念组成复合类目的分类法. 特点:

①标引专指度较高,可以通过基本概念的组配,充分揭示信息资源中的复合主题;

②标记表达性强,可以表达出主题成分所属的分面,便于根据不同需要,调整组配次序,进行多元检索;

③对科学发展的适应性强,可以通过组配方式,表达新产生的复杂主题,有利于与科学的发展保持同步;

④类表的篇幅较小,便于管理、修订等.

不足:①分面类表的类目体系是隐含的,直观性不如等级列举式分类法; ②检索工具中的类目是根据组配建立的,类目分布往往不够均衡; ③标引难度较高,要求分类人员有较高的专业素养;

④分面标记的成分一般比较复杂,号码冗长,不适宜用于组织文献排架,主要用于组织检索工具。

8、列举组配式分类法:是上述两种编制方式的结合,是一种在详尽类表的基础上,广泛采用各种组配方式的分类法,亦称半分面分类法。 特点:

①以列举式类表为基础,具有一定的直观性

②广泛采用组配方法,基本上可以达到分面类表同等标引水平。 不足:

①列举式类表的管理修订工作,需要较大的工作量 ②类目之间的组配要求使用多种辅助符号,标记复杂、冗长 9、主表:是基本大类、简表、详表的合称.

10、基本部类:基本部类是为分类法的合理展开对知识范畴所作的最概括、最本质的划分。依据一定的知识分类体系来确定。

11、简表:又称为基本类目表、主要类目表,是由分类表的基本类目组成的表。通常是在基本大类下展开的二、三级类目,在基本大类和详表之间起承上启下的作用。作用:(1)帮助用户

7

迅速了解整个分类法的概况,通过它的引导,方便地在详表相应门类中查找相应的类目(2)可供概略分类使用

12、详表:是由详细列出的子目组成的类目表,是分类法的主体和正文,类分信息资源的真正依据。

13、复分表:为了增强类表的细分程度,缩小类表的篇幅,分类法一般将这些共性子目抽出,单独编列成表,供有关类目进一步区分时共同使用。这种将主表中按同一标准对类目划分产生的一系列相同子目抽出,单独编列,供主表有关类目共同使用的表,称为复分表,亦称副表、辅助表、共性区分表。

14、复分表的作用:(1)缩小类表的篇幅(2)加强类表的伸缩性 (3)增强类表的规律性

15、复分表使用的注意事项:①除有明确规定外,一般必须结合主表类目使用; ②是否使用复分表,应根据复分表中的说明以及类目下的注释确定;

③文献单位可以根据需要对复分表的使用加以调整,但一经确定,就应严格遵守,不得随意变动,以保持复分表使用的一致性。

④由于复分表使用意味着新的分类成分的插入,一般还应注意标记配置方面的有关规定。 16、标记符号:亦称分类号,是分类法中用于标识类目的代号。

17、分类号的作用:具有固定类目次序,显示类目之间关系的作用,是分类法的重要组成部分。现代文献分类法正是通过以分类标记为中介,将分类体系有效地用于组织文献收藏和建立检索工具。

18、分类号的要求:(1)简明性(2)表达性(3)容纳性(4)助记性

19、编号制度:(1)顺序标记制(2)层累标记制(3)顺序—层累标记制(4)分面标记制 20、说明与注释:有关分类表体系结构及使用方法的说明性文字。分类法通过它说明类表的编制原则、类目体系的特点以及使用方法等。通常包括如下三种形式:编制说明、大类说明、类目注释

21、类目索引:一种按主题字顺方式,从主题名称指向分类号或相应类目,帮助分类人员利用类目表的辅助工具。这种工具在每个类名及同义词后记录该类的分类号,将所有的条目按字顺排列,通过将分类体系的系统排列转变成字顺排列,从而可以从表达主题的语词出发找到相应的分类号,克服类目查找的困难。

22、类目体系通过层层划分建立起来:1、确定引用次序逐层划分类目2、类目的排列3、确定类名4、类目的配号5、类间关系的揭示和处理

23、类目:又称为类,通常是指一组具有某一共同属性的事物对象的集合。是分类体系的基本构成单元.类目的划分,即分类,是指依据一定的属性或特征对类目的外延进行区分,生成一组子目的过程。这是类目体系建立的基本方法。

24、类目体系的建立:类目体系的建立,是从基本大类出发,按照区分对象的属性,层层划分,层层展开得到的。

25、类目划分遵循的一般规则:(1)每次划分只使用一个标准(2)划分应该穷尽被区分类的外

8

延(3)划分后各子类应相互排斥,界限分明

26、引用次序:指复合主题在标引和检索中,不同主题因素的组配次序.具体如下:

27、引用次序的作用:引用次序决定着类目体系以何种方式集中信息资源以及提供什么样的检索途径问题,是与分类体系的性能和适用性密切联系的。

28、对同位类进行系统排列的作用:①可以揭示类目之间联系,方便相关类目的查找;②有助于结合类目的排列,明确类目的含义;③只要在系统排列中采用统一方式,就可以增加类目排列的一致性和可预见性。

29、类名:分类体系中表达类目概念的名称,它规定类目的含义和范围,是分类语言中表示类目概念的词汇单元.分类法的类名通常由单词或词组构成,用以表达学科、专业、事物对象及其方面等。

30、选择类名的要求:

(1)科学:一般不选俗称、旧称、不通用的同义词、简称、不准确的流行语等。 (2)简明:一般略去子类中的上位概念.

(3)确切:贴切揭示类目的内涵和外延,无法做到时通过类目注释补充说明。 (4)通用:符合用户的使用习惯

31、类名的确定:《中图法》对除基本大类以外的大部分类目都采用缩减的形式予以命名,即将表示上位类含义的部分去掉,这样对大多数类目来说,只从类名字面是无法判断其含义的,必须结合上位类的意义才能准确判断其意义。 32、(1)从属关系

性质:指类目体系中一个类与其直接区分出来的子类之间的关系。

特点:从属关系类目之间存在一种限定关系,即上位类的属性或特征必然存在于下位类之中,或对下位类产生限定作用.

33、并列关系的性质:指类目体系中同位类之间构成的关系。特点:同位类之间由于都带有上位类的属性或为上位类所限定,具有相互联系的一面。同时,它们之间又各有自己的特有属性,因此又是相互排斥的。

34、交替关系的性质:指交替类目与相应使用类目之间形成的关系。特点:通常在一些知识门类具有多重从属关系,同时隶属于两个或两个以上的学科或部门时使用。交替类目是一种供选择使用的类目,它与使用类目之间是一种同一关系。

35、相关关系的性质:指类目之间除从属、并列、交替等方式以外的其他联系。

36、横向关系揭示的作用:因为类目之间的关系不是简单的多对一或一对多的从属关系,而是多对多的网状关系,同时同级类之间也存在或近或远的联系,要科学地组织类目体系,就必须对这些复杂的关系加以揭示.而且这样地揭示也增加了检索入口,方便了用户使用分类工具进行检索。

37、网络分类法与传统文献分类法的不同:(1)揭示角度不同(2)类目的设置特点不同(3)展开的形式不同(4)同位类的排列方式不同(5)适用特点不同

38、网络分类法不同于传统类目体系的组织和揭示形式:(1)改进主题之间关系的(2)

9

从多个角度组织信息资源(3)进行轮排,亦即多表列类(4)设置镜像类目(5)动态组织分类体系(6)用于联结不同的检索系统(7)联结说明与规则系统

第七章分类标引工作

1、分类标引:信息资源进行分类组织的基础和前提,对信息资源的开发利用具有重要的意义. 2、分类标引的意义:分类标引工作是对信息资源进行分类组织的基础和前提。

通过对信息资源赋予分类标识,信息机构就可以将各种信息资源纳入相应知识门类,建立起相应的分类检索系统并提供各种检索途径供用户查找。 3、分类标引的要求:

(1)准确:其一归类要正确,将信息资源归入对应的学科和专业;其二,归类确切,要将信息资源归入分类体系中最专指、最切合其内容的类目。

(2)充分:即指恩那个根据使用需要,充分揭示有检索价值的信息资源主题。 (3)一致:即对同一主题内容资源的标引结果应一致.

(4)适用:标引应考虑系统的特点和用户的检索需要,使标引结果使用。 4、分类标引的工作程序:

查重—主题分析-归类—给号—审核

(1)查重:查重通常在进行信息资源描述操作时统一进行.主要查核该标引对象是否为已经处理过的信息资源。

(2)主题分析:要标引信息资源的主题内容,必须对资源的内容特征进行分析,确定需要揭示的主题概念。

(3)主题概念转换—-归类:所谓归类,是指将主题分析的结果归入分类体系中相应的门类。一般应以特定的分类表为工具,根据其特点进行 (4)确定标识--取号:根据确定的类目给予相应的分类号.

(5)审核:在结束文献标引前,必须对每种文献的标引结果进行审核。 5、一般分类规则:

1.单主题信息资源的分类标引:单主题信息资源是论述某一特定事物对象的资源.根据其论述特点又分为简单单主和方面单主题等类型。

分类时,一般应按照该资源对事物、对象研究的学科角度,再根据论述的内容范围加以标引。具体方法如下:

(1)简单单主题信息资源,指只论述一基本主题的资源,一般应按照主题对象的学科性质归类。

(2)方面单主题信息资源,指论述一主题一个或多个方面的资源,应根据其论述的方面以及各个方面之间关系归类。

(3)论述主题两个或者两个以上方面的信息资源,应根据不同方面之间的关系,确定其归属。

10

2.多主题信息资源的分类标引:主题信息资源是指同时论述两个或多个事物对象的资源,一般应按照论述的主题对象及其关系,区别情况分类。

根据主题之间的关系,多主题资源包括并列关系、从属关系、联结关系等基本类型。 3.丛书、多卷书的分类标引: 丛书的分类标引 多卷书的分类标引

4。词典、百科全书、年鉴、手册的分类标引 综合性词典、百科全书、年鉴、手册等的分类标引 专科性词典、百科全书、年鉴、手册的分类标引 语文词典的分类标引 5.目录、索引的分类标引

综合性目录、文摘、索引的分类标引 专科性目录、文摘、索引的分类标引 专书索引的分类标引

6。关于对著作的研究、注释的标引 科学著作的评论、研究、注释的分类标引 马列经典作家著作的评论、研究的分类标引 文学作品的评论、研究的分类标引 缩写、节选文献的分类标引 7。特种文献的分类标引

技术标准和专利文献的分类标引的分类标引 技术报告、学位论文的分类标引 8.非书资料的分类标引 9.网络信息资源的分类标引 同类书排列的类型

1.常见的同类书排列类型: ①按到馆次序顺排 ②按题名字顺排 ③按出版的年代排 ④按分编的先后次序排 ⑤按著者姓名字顺排

11

2。按分编次序排:亦即按种次号排。所谓种次号,是指按照同类书分编先后,按每一种书为计数单位顺序编制的号码。

第8章主题法

1、主题法:分类以外另一种从内容角度标引和检索信息资源的方法。

2、目前国内外采用的主题法的类型很多,一般都具有下述特征:(1)直接以语词作为检索标识(2)以字顺作为主要检索途径(3)以特定的事物、问题、现象,即主题为中心信息资源(4)往往是通过参照系统等方式揭示主题之间关系的。

3、标题法:一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。 4、元词法:克服标题法的不足发展起来的一种主题法类型,它是以元词作为主题标识,通过字面组配的方式表达信息资源主题的主题法。

5、叙词法:是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。

6、字顺表:一种由众多叙词款目和飞叙词款目按字顺排列的一览表.

7、范畴索引:亦称分类索引,范畴表,是一种按照词汇所属学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。 8、词族索引:指一组具有属分关系的叙词集合。

9、轮排索引:亦称轮排表,是将词表中的叙词按词素的字顺排列,使含有同一词素的叙词集中显示于一次的词汇表,是一种从词素的角度查找叙词的辅助工具

10、叙词语言是在自然语言的基础上进行词汇控制的结果,它广泛吸收了多种检索语言的技术和措施,对词汇的规范较为完备。

11、叙词语言的词汇控制一般是根据标引和检索的需要进行的,包括词汇选择、词形控制、词义控制、词间关系控制等基本方面。

12、等同关系:指以叙词与含义相同或相近,可以相互替代的语词之间的关系,亦称同一关系、用代关系.

13、等级关系:指上位概念叙词和下位概念叙词之间的一种关系亦称属分关系.

14、相关关系:是叙词之间除等同关系、等级之外语义相关的一种关系,亦称为类缘关系.

第九章国内外主题词表介绍

1、《美国国会标题表》是美国国会图书馆在编目实践的基础上编制起来的标题表。

2、《汉语主题词表》是在中国科技情报所和北京图书馆主持下,根据现代文献标引和检索的需要编制的一部大型综合性叙词表,

3、《中国分类主题词表》在《中图法》和《汉表》主题词对应的基础上编制的分类法 4、《汉表》的特点:(1)结构完备.(2)词汇丰富(3)探索了词表编制的方法(4)探索了叙词

12

表的实际使用方法(5)国内文献单位在机读目录、在版编目数据中都使用《汉表》的主题词,是国内广泛使用的综合性主题标引工具。

5、《汉表》的不足:(1)在结构上,印刷型词表因篇幅巨大,组成分散,加之编排不紧凑,整体性较差(2)在词汇上,存在个别专业收词过多,不同专业之间收词数量不平衡的问题.(3)词间关系处理上,《汉表》等同率低于国内外同期专业词表平均值、基本上不设与组代词的等同项,无关联词数量大等,是影响词表易用性的比较突出的不足。(4)《汉表》没有设置统一的管理机构,未确定明确的修订方针,缺乏健全的管理机制从而影响了词表的发展和使用。 6、《中国分类主题词表》的特点:

(1)通过将《中图法》类目与《汉表》主题词的对应,建立起了一个分类语言与主题语言结合的一体化工具,可以利用它,同时进行分类主题的标引和检索,简化操作程序,降低标引难度,改进标引和检索的质量。

(2)其分类法部分是将《中图法》、《资料法》融为一体的类目体系,可以同时供图书资料标引使用,在作为图书标引工具时,《资料法》部分的类目,可以作为《中图法》对应类目的说明对待。

(3)其主题法部分,除收入原有的虚词外,还包括今年来中文图书奖标引中新增的虚词和对应表编制时的新增词,以及《分类号-主题词对应表》中出现的主题词组配形式,是《汉表》叙词比较完善的版本。

(4)改进了字顺表的款目结构,改进了排检方法,采用音序和字形结合排序,符合人们查找习惯,使得编排紧凑,便于查找,易于使用。 不足

1. 本表中的类目和对应主题词之间只有一种先组语言和后组语言之间的兼容互换关系,很难进行精确转换

2. 类目的处理由人工按照概念关系的理解转换而成,存在随意性和不一致性,影响对应的质量

第十章主题标引和主题检索工具

1.主题标引:是依据一定的主题词表或主题标引规则,赋予文献语词标识的过程。 2.主题标引与分类标引的异同

相同:(1)揭示的对象相同(2)依据数据来源相同(3)操作程序相同(4)基本处理方法相同。不同:(1)主题分析的角度不同(2)转换途径不同:属于后组式检索语言(3)标识不同:分类号,主题词(4)揭示的特点不同

3.标引方式:是根据文献特点和使用需要确定的标引和揭示文献主题的形式。 包括:

4、整体标引:一种概括揭示文献基本主题内容的标引。

5、全面标引:一种充分揭示文献论及的所有有检索价值的主题概念的标引。 6、对口标引:一种只揭示文献中适合本专业需要的主题内容的标引。

13

7、综合标引:一种以集合型信息资源的整体为单位进行的概括性标引

8、分析标引:一种根据信息资源中部分片段或集合型信息资源的构成单元进行的标引 9、主题分析:指根据文献标引和检索的需要,对文献主题内容进行分析,提炼主题概念的过程。 10、主题分析的特点:

(1)、不必受学科体系,比较直接。

(2)、不受等级列举形式的束缚,对主题成分揭示比较充分,可以在深入分析主题构成的基础上,对主题概念做出取舍,通常在分析文献主题类型,主题结构的基础上,根据主题标引的需要进行。

11、分析主题类型 (1)单主题和多主体 (2)单元主题、复合主题 (3)主要主题和次要主题 (4)专业主题和非专业主题 (5)显性主题和隐性主题

12、我国国家标准中提出的主题分面公式:

A主体因素(A1研究对象、A2材料、A3方法、A4过程、A5条件等) B通用因素 C空间因素 D时间因素 E文献类型因素

13、主题标引规则:(1)主题标引的查询规则(2)组配标引的组配规则 14、主题标引的查询规则:⑴采用正式叙词标引. ⑵选取最专指的叙词标引。 ⑶组配标引。 ⑷上位叙词标引。

⑸靠词标引.例:将“藏书剔除”,标引为:“图书登录”。 ⑹增词标引。 ⑺自由词标引.

⑻标引数量:一般每种图书的标引词数量保持在1—8个之间,机检系统主题词数量可适当增加。

15、组配标引:是指将两个或两个以上叙词按照一定的逻辑关系结合在一起,表达文献主题。限定组配的类型:

14

①特称限定组配. ②方面限定组配。 ③说明语限定组配. ④联结组配。

16、主题检索工具:主题检索系统大多采用后组方式,有的也利用标引成果,在显示检索结果的同时提供标引题浏览的功能,往往在一定机读编目格式的基础上,通过一定软件进行操作的。 17、按照采用的设备条件,分为: 手检主题工具,包括主题目录和主题索引; 主题机检系统,可以是不同对象的数据库。 18、按照组配先后,分为:

先组式检索系统,通常需要预先建立标题;

后组式检索系统,不必预先建立标题,根据用户的检索式组配检索。 19、按照是否控制,分为: 控制系统;自然语言系统 20、主题检索系统的功能设置

(1)主题词检索功能。通过输入主题词,输出命中的检索对象,命中篇数,及相关信息. (2)入口词检索功能。输入与主题词具有用代关系的词,按对应主题词输出检索结果. (3)组配检索功能.结合逻辑组配符,进行组配检索,扩大或缩小检索范围,改进检索效果. (4)综合查找功能。可结合其他描述数据进行综合查找。例,北大馆联机目录的“复杂检索”可同时结合主题、著者、题名等进行检索.

(5)浏览查找功能。利用预先确定的标题进行浏览查找。 (6)词典浏览功能。可通过显示词汇表,供检索参考. (7)限定范围检索。利用选择框,提供地区、时间等。 (8)排序显示功能.即根据需要对输出结果排列。

(9)结合联号等检索.一般为以论文为检索对象的专业数据库使用.

(10)输出手工检索工具。包括输出书本式主题索引或卡片式主题目录等产品。

第十一章自然语言标引与检索

1。自然语言:指直接使用不经过控制的自然语言中的语词作标识,进行信息资源的标引和检索。 2.用于标引和检索的自然语言的类型

(1)关键词法(2)文本检索(3)自由标引(4)自然语言入口词检索(5)自动标引

15

3。关键词语言的类型:(1)题内关键词索引(2)题外关键词索引(3)双重关键词索引 4。关键词索引的性能

优点(1)简便易行,标引时无需查看词表,直接根据题名、文摘中的语词进行标引,可以降低对标引人员的要求,节省标引时间。

(2)易于使用计算机编制,实现检索工具编制过程的计算机化,保证通报文献的及时性及生产过程的高效率和低成本.

(3)能够及时更新词汇,出现在题名、文摘中的具有检索意义的词汇均可立即用于标引和检索。 不足是:(1)关键词检索工具的质量往往直接受文献题名质量的影响.

(2)作为一种自然语言形式,关键词语言未进行同义词、相关词的处理,用户检索时很难依靠自己的了解查全同一概念的不同词形及进行相关词的检索,会增加用户负担,影响检全率。 (3)题名中的不少语词为通用概念,以它们为检索入口建立的检索款目没有实际检索意义. (4)汉语由于存在分词难题,应用计算机进行汉语关键词标引仍需要解决词汇切分问题. 5、文本检索:通常指不对文献进行任何标引,直接依据自然语言中的语词实施匹配查找的检索类型。

6、后控词表:是一种在检索阶段进行控制的词表,这种词表不像传统的控制词表那样在标引阶段对标识实施控制,而是在检索阶段通过同义控制和相关词推荐等方式提供帮助。后控词表的控制对象,可以是在自由标引基础上建立的关键词标识系统,也可以是文本检索系统中的文本本身。

7、后控词表的特点

①不承担标引功能,只用于检索控制. ②词汇控制不如先控词表严格。 ③入口词丰富。 ④动态性强。

⑤有较强的灵活性和自由度。 ⑥具有面向文献和用户的特点. ⑦词间关系不同于传统词表.

8、自动标引:一种依据一定算法,由计算机赋予文献检索标识的过程.分为自动主题标引和自动分类标引。

9、自动主题标引:所谓自动主题标引就是由计算机自动确定语词标识来表达信息资源主题的过程。包括自动抽词标引和自动赋词标引两种基本方式. ①自动抽词标引

计算机要完成这项任务,某种程度上需要模仿人类的思维过程。根据自动抽词标引时所采用的方案,可以分为下面几种: (1)绝对频率法(2)相对频率法

16

(3)逆文献频率法(权值log(N/n)+1)(4)位置法 ②自动赋词标引

就是从某种形式的受控词表中选取词语来表达文献主题内容.自动赋词标引则是指由计算机来自动完成这一标引过程。它与自动抽词标引的最大区别就是,所使用的标引词来自于某一受控词表,而不是来自文献本身。

10、自动分类标引:由计算机代替人工对文献或信息进行分类,赋予分类标识,以描述文献主题内容的活动。 ① 文献自动归类 ② 文献自动聚类

17

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- jqkq.cn 版权所有 赣ICP备2024042794号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务