地查到所需的标识。
3.具有对先进的检索方式和检索设备的适应性,以及对多种检索方式和 检索设备的适应性。
检索设备可分为传统检索设备和非传统检索设备。传统检索设备如普通 卡片式目录、书本式目录;非传统检索设备如机械式检索系统、充电式检索 系统、电子计算机检索系统等。
各种检索方式和检索设备都有一定优缺点和适用范围,所以信息检索语 言应能适应多种检索方式和检索设备,使其发挥更大的效应。如《汉语主题 词表》就兼顾了电子计算机检索系统和手工检索系统两个方面的需要。
4.能满足多种检索要求。信息检索语言使用的标识多,能概括信息的外 部特征和内容特征,满足从不同方面、不同层次进行检索的要求,提供较多 的检索途径。
5.具备与其它信息检索语言的兼容性和一定地域范围内的通用性。每一 种信息检索语言都有自己的特点,但又不应忽视检索语言之间的相互交流及 推广使用,这就要求实现各种信息检索语言的兼容性。尤其是要适应当前信 息检索自动化和网络化的发展趋势,更应要求信息检索语言向国际标准化靠 拢,以求达到更大范围的通用。
第二节 检索语言的基础与分类
一、检索语言的基础:概念逻辑和知识分类
(一)概念逻辑 检索语言的最终目的是表达一系列概括文献信息内容的概念及其相互关
系的概念标识系统。因此,它们都是建立在概念逻辑的基础上的。概念是语
言包含的内容,语言是概念的表达形式。事物——概念——语言三者之间—
—对应的辩证关系既是建立检索语言的基础,也是建立检索语言必须遵循的 原则。
概念逻辑,是一种科学思维方法。它通过明确各种概念及其相互关系而
揭示事物的本质属性及各种事物之间的联系与区别。检索语言在建立词汇、 显示概念关系以及在文献标引和检索中使用时,都离不开概念逻辑。所以, 它们只有以概念逻辑为基础,才能使检索语言具有广泛的通用性和适应性。 概念是事物本质属性的概括。任何概念都有其内涵与外延。某一概念的 内涵,即指及所反映事物的本质属性;外延则是指其反映事物的范围。它们 之间存在着“反变关系”,即概念的内涵包含的属性增加,概念的外延便缩
小;反之,概念的内涵减少,其外延就扩大。 概念之间的各种关系可归结为相容关系与不相容关系。概念的相容关系
包括同一关系、隶属关系、交叉关系、不互相排斥的并列关系;不相容关系 包括互相排斥的并列关系、矛盾关系、对立关系。
检索语言在表达各种概念及其相互关系时,普遍地应用了概念逻辑的原 理,并且有效地利用了“概念的划分与概括”和“概念的分析与综合”这两 种逻辑方法来建立自己的结构体系。
1.概念的划分与概括(分类),就是利用概念内涵由反映事物本质属性 的概念因素构成,概念因素的增加或减少可以形成新的概念,概念内涵与外 延成反变关系等的性质,对概念进行划分(缩小)或概括(扩大),形成更
为专指或更为泛指的新概念,用以区别客观世界千差万别的事物;并利用划 分或概括过程中所产生的概念隶属关系和并列关系,建立某种形式的检索语 言结构体系,即概念等级体系,用以显示客观世界千差万别的事物之间的内 在联系。这种结构具有很好的系统性。例如,体系分类法就是应用此种逻辑 方法的典型。
2.概念的分析与综合(组配),是利用在概念的交叉关系中两个概念外 延的相同部分可以形成一个新概念,其内涵等于原来两个概念内涵之和,并 且它与原来的两个概念具有隶属关系的这种性质,进一步发展为将一个内涵 较深的概念分解为两个或两个以上内涵较浅的概念,以及将两个或两个以上 内涵较浅的概念合成为一个内涵较深的概念的一种概念逻辑方法,用以建立 另一些形式的检索语言结构体系,即概念组配体系。
这种结构体系可以提供从多种途径来进行信息检索的功能,而且可以任 意选择检索标识的专指度,根据实际需要扩大、缩小或改变检索的范围。例 如,叙词语言与组配分类法便是应用概念分析与综合的典型。
(二)知识分类 知识分类包括事物分类和学科分类。它将客观世界事物以及各种学科根
据当代科学认识的最新成就构成一个完整的、有科学认识意义的体系。所以, 它是对千差万别的事物作系统研究的重要方法,是对各种事物之间的区别和 联系从本质上、原理上进行揭示的重要手段,对文献信息的系统化具有重大 的价值。
为了使信息检索语言能够适合科学研究的需要,必须把各种概念之间的
关系建立在知识分类的基础上。如果说概念逻辑是检索语言的基础,则知识 分类便是概念逻辑的基础。信息检索语言中的体系分类法、组配分类法、叙 词法、标题法以及代码系统等,都在不同程度上反映了知识分类。但是,知 识分类体系是多维性和处在不断变化中的,信息检索语言能在多大程度上反 映当代知识分类水平,是其质量的重要标志之一。只有较充分反映知识分类 的信息检索语言,才能保证信息检索语言在信息检索工作中得到有效运用, 并达到较好的检索效果。
二、信息检索语言的分类
信息检索语言有很多类型,可以按不同的方式和标准划分。
(一)按语言的结构原理划分
1.分类语言。其又可分为:
(1)体系分类语言:按学科体系层次,从上到下,从综合到一般,逐级 展开,属层累制结构。
(2)组配分类语言:一般按学科性质分组,称为“组面”,标引时,选 择“组面”和有关词汇加以组配。它是一种新型分类方法,其原理是用有关 词汇结合文献信息的内容加以组配。
(3)混合分类语言:是体系分类语言和组配分类语言的结合,又因对二 者的侧重之不同又有体系一组配分类语言和组配—体系分类语言之别,但都 是先组配。
2.主题语言。按照主题词性质的不同,又可分为:
(1)标题词语言:从标题词作为文献信息内容的标引标识和检索标识。 标题词一般分为主标题和副标题,词表中按级一一列举各级标题,把主标题 和副标题加以组配,作为标引和检索使用中的依据。
(2)叙词语言:以规范化的标引词形成词表,各词独立,标引时根据需 要进行组配,可表达文献内容方面的复杂概念,属后组配式,适用于机检和 手检。
(3)关键词语言:是一种无词表的自然语言。关键词选自文献的题目和 内容,属于非规范的后组配式。
(4)单元词语言:以文献中的单元词表达文献信息的内容性质,一般无 词表。单元词是文献内容中最基本的不能再加复分的知识单元,单元词之间 可以进行组配,属后组配式。
(5)引文语言:利用文献的引文关系而建立的一种自然语言,无词表, 标引词为文献中的主要著录项目,属后组配式。
(二)按照语言标识的组配方式划分
1.先组式检索语言:指表述文献主题概念的标识在检索之前就已固定的 检索语言,如体系分类语言、标题词语言均属于这种类型。这种语言标识明 确,系统性较好,适用于传统的文献单元方式的目录索引,是检索用户比较 习惯的形式。
2.后组式检索语言:指表述文献主题概念的标识在检索之前未固定组 配,而是在检索时根据实际需要按组配规则临时组配的检索语言,如单元词 语言、叙词语言均属此类。这种语言采用概念分析和综合的原理,可实行多 途径、多因素检索乃至精确检索,相当灵活,检索效率较高。但是,标识明 确性不强,造成检索用户使用不习惯。
第三节 分类检索语言
分类语言是以号码为基本字符,以科学分类为基础,用表示文献学科性 质的分类号来表达文献主题概念的检索语言。
分类是人们认识事物的一种思维方式,把相同与不同的事物加以区分,
形成不同的类别。 “物以类聚”是人们长期以来对多种事物,包括文献信息进行识别的方
法。所谓类的概念,是许多具有共同属性的事物的集合,同类的事物就称为
“一类”,类的特点是具有可分性。 分类语言是建立在文献信息的可分性基础上的。 一、文献分类
文献分类是按照文献所载知识信息的学科属性,对文献进行类别的划
分,进一步根据文献信息内容之间的内在联系组织成科学的分类体系。其目 的在于使主题属性相同的文献信息集中在一起,便于检索与利用。
文献分类是在学科分类的基础上进行的,文献是人类知识的记录,学科 内容是它的基本属性。学科分类,就是要依据对学科基本特征的分析,确立 正确的学科分类原则,在此基础上对各门学科进行区分和排列,建立起符合 现代科学发展的实际分类体系。但是,学科分类又不等同于文献分类。首先, 文献分类所依据的分类法是不同的人编制的,而从事分类工作的人员在对文 献进行分类时观点也有差异;其次,文献分类除了主要根据其学科内容外, 还要考虑其它的特征,如:文献的类型、体裁、文种、文献涉及的时代、区 域等等。此外,还要考虑不同信息单位的性质、任务以及各类型读者的需要, 考虑文献内容从不同角度来利用等因素。因此说,学科分类是文献分类的基
础,它们不完全等同。 文献的分类体现在分类表上,分类表是由一系列分类号集合而成。分类
号是文献信息概念的具体标识符,有文字型(如汉字、罗马字母等)、数码 型(如阿拉伯数码、罗马数码等)和上述两种组合而成的混合型之分。它能 反映事物的派生、隶属与平行等关系,便于检索者了解文献知识的全貌。
二、分类法的结构 分类法是由许多类目根据一定的原则组织起来,通过标记符号来代表各
级类目和固定其先后次序的分类体系。一部完整的分类法一般由以下几个部 分组成。
1.编制说明。主要说明该分类法的编制过程,所依据的编制原则、类目 设置和编制的理由,对各类分类问题的技术处理和使用,标引方法等。
2.类目表。是分类表的主体部分。主要包括:①大纲,是基本大类的一 览表;②简表,是一个基本类目表,它是整个类目表的构架;③详表,即主 表,详细列出大小类目、类号和注释;④辅助表,也称复分表,是一组标准 目次表,用以对主表中列举的类目进行细分。
3.索引。是该分类法的类目名称索引,按字顺排列,以供查询,帮助不 熟悉分类法的读者使用。
4.附录。收录按类检索时经常要查阅的一些参考资料。
三、国内外常用分类法介绍
(一)我国常用的分类法
1.《中国图书馆图书分类法》
《中国图书馆图书分类法》简称《中图法》,是我国图书信息界最常用、 普及范围最广的一部大型文献分类法。它是北京图书馆等组织全国力量编辑 而成,其编制目的是为了实现全国文献资料统一分类编目。《中图法》由 5 大部类、22 个大类、6 个总论复分表、30 多个专类复分表、4 万余条类目组 成了一个完善的分类体系。部类的设置采用五分的办法。为体现整部分类法 的指导思想,把“马克思主义、列宁主义、毛泽东思想”作为一个基本类列 于首位,“哲学”、“社会科学”、“自然科学”分别按其知识的逻辑关系 列为第二、第三、第四部类,最后一个部类为“综合性图书”,收录一些内 容涉及面广、类无专属的文献。
标记制度采用汉语拼音字母与阿拉伯数字相结合的混合小数层累制,以
字母的顺序反映大类序列,对类目的排列采用不同的字体和行、格等形式来 表示类目之间的关系。
2.《中国人民大学图书馆图书分类法》 该分类法简称《人大法》,由中国人民大学图书馆编制。《人大法》是
我国新中国成立之后诞生的第一部科学性、实用性较强的图书分类法。它由
4 大部 17 大类、9 个复分表和两个附表组成,用 1~17 的数码表示 17 个基本 大类;对两位一类的数码标识,采用在号码数字后加小圆点,如“11.历史·革 命历史”的方式,这种类号的等级排列层次分明,能从数位上看出类目间的 相关性和一致性。
3.《中国科学院图书馆图书分类法》 该分类法简称《科图法》,由中国科学院图书馆编制,目前,中国科学
院系统的绝大多数图书信息部门均采用此分类法。
《科图法》由 5 大部 25 大类组成,主表分两册出版,上 册为《马克思
列宁主义毛泽东思想、哲学、社会科学》,下册为《自然科学、综合性图书》。 其标记制度采用阿拉伯数字顺序排列制,故类目、类号的等级性不甚明确。
(二)国外图书分类法
1.《杜威十进分类法》 又称《十进制图书分类法》或杜威法,是由美国图书馆学家威尔·杜威
所创制的。 杜威法是一部在国际上出现最早、流行最广、影响最大的图书分类法。
它根据培根关于知识体系的分类,采用十进制的等级分类体系,把所有学科 分成 9 大类,分别标以 100~900 的数字;9 大类表示 9 个专门的主题范畴, 各类中的类目均按照从一般到特殊,从总论到具体的组织原则,对不能归入 其中任何一类的综合性文献资料列入第 10 类,即总论类,以下依次逐级分
类,形成一个层层展开的等级体系。
2.《国际十进分类法》 该分类法是由比利时学者鲍尔·奥特勒在《杜威十进分类法》的基础上
修订补充而成,从 60 年代末期起被称为世界文献信息的国际交流语言。
《国际十进分类法》由主表、辅助表及辅助符号 3 大部分组成。它把知 识分为十大门类,大类划分沿用了杜威法的基本大类结构。详表有近 20 万个 类目,是世界上现有各种分类法中类目设置最多的一个。它的基本大类设置 如下:
0 总表
1 哲学
2 宗教、科学
3 社会科学、经济、法律、行政
4 语言
6 应用数学、医学、工业、农业
7 艺术
8 语言学、文学
9 地理、传记、历史 该分类法类目的明细度比其它分类法高,是目前展开得最广的一部分类
法。其标记制度采用等级分明的阿拉伯数字结合多种辅助符号,列举与组配
混合式结构。通过对事物整体概念的逐层分析,对特定概念进行组配,使之 较好地反映多主题、复合主题的文献信息,提供了多种检索途径。
第四节 主题检索语言
主题检索语言的主要特征是以语词为概念标识,标识词按字顺排列,并 用“参照系统”等方法辅助显示概念之间的相互关系。
用主题词作为文献信息标识有以下优点:
1.直观性强。主题词来源于自然语言中,标识比较直观,符合人们的辨 识习惯,主题词在词表中按词的字顺排列,其用法如同使用字典、词典,容 易掌握,易于利用。
2.专指性高。用作主题词的语词标识经过了全面严格的规范化处理,标 识与概念严格对应,标识所表达的概念具有唯一性,故语词对概念的描述具 有较强的专指性。
3.灵活性好。主题检索语言的主要特征便是通过词与词之间的概念组配 来揭示文献中的各类主题,尤其是后组式的组配原则,便于人们按照检索需 要,自由组配检索概念,具有很大的灵活性。
4.网罗性高。一个主题词表达一个事物的概念,若干个主题词合乎逻辑 的组配,因此可以形成高度专指的概念特征,用于标引文献时,即可达到高 度的概念网罗度。
主题检索语言的优点在于检索人员不必从知识体系的角度去判断所需文 献属于什么学科,只要根据课题研究的对象,直接用能表征、描述文献内容 的主题词去查检,而且同一篇文献可用多个主题词来标引,因此扩大了检索 途径。
常用的主题检索语言主要有标题词语言、叙词检索语言、引文检索语言。 一、标题词语言 标题词语言是一种最早出现的按主题来标引和检索文献的传统检索语
言。它是以标题词作为文献内容的标识和检索依据。标题词一般分为主标题 和副标题两级,标题词在编表时一一列举,而主标题和副标题已固定地组配 在一起,间或在标引时再补充组配,所以标题词语言主要是一种先组式的信 息检索语言。
标题法的构成原理为以下四点:
(1)按主题集中文献;
(2)用经过规范化的语词直接标引文献主题;
(3)用参照系统间接显示主题之间的相互关系;
(4)用字顺序列直接提供主题检索途径。
1.标题词的构成。常用的标题词的类型有两种:
(1)单级标题:一个标题仅由一个名词术语构成,可以是一个单词,也 可以是一个词组。
(2)多级标题:即复合标题,一般采用在主标题后加破折号与副标题、
副副标题相结合。 一个标题词要求只代表一个概念,且必须能够直接而精确地表达文献所
论及或涉及的主题,以利于提高查准率。
2.标题词的参照系统。标题词是按字顺排列的检索系统,具有直接提供 检索途径的优点,但是具有同义关系和相关关系的标题词因字面不同就不能 集中在一起,从而造成同性质文献的分散,使相互间关系得不到明确的显示。 语义参照系统就是为克服这一缺点而设置的。
(1)“见”参照:不用的标题词见用的标题词,它是用来揭示同义词、 上位类、下位类的作用的。如“脚踏车见自行车”。脚踏车不是标题词,而 自行车是正式标题词。
(2)“参见”参照:用以指引检索者从一个采用的标题词去参见与之有 关的其它标题词,达到扩大检索途径的目的。这种参照可揭示标题词间的相 关关系和等级关系。参见前后的标题词均是正式标题词。
(3)注释:当有些标题词概念不十分明确或一形多义时,用圆括弧注释, 对该标题词作一简要说明。
3.标题词表的结构。标题词表是规范化的标题词词典,其体系结构一般 由下列三个部分组成:
(1)编制说明:说明该表的编制经过、收词范围、选词标准、规范化措
施、标题形式、参照系统、标引规则等。
(2)主表:是标题词表的主体,包括全部标题词和非标题词,并有参照 和注释,按字顺排列,是标引和检索时的主要依据。
(3)辅表:是主表的辅助用表,一般用于对主表中的标题词的限定、修 饰和复合主表中的标题词。辅表和主表各自分开,组成体系,在标引和检索 时相互组配,构成多种标题。
二、叙词检索语言 叙词检索语言是应用较广的主题检索语言之一,它以规范化的名词为基
础,吸收了多种检索语言的原理和方法而综合形成的一种主题法语言。叙词 语言是采用单元概念的规范化语词的组配来对文献主题进行描述的后组式标 引和检索语言,因此,可以说概念组配是它的主要特征。
(一)叙词的特性
1.直观性。叙词使用自然语言中的语词,标识比较直观,按字顺排列, 序列明确,方便检索人员了解和使用。
2.单义性。叙词都是经过规范化处理,以达到一个叙词与一个概念严格 对应的要求,故叙词概念明确,易于理解。
3.组配性。连词组配是叙词法的主要特征。叙词较好的检索功能主要来 自组配这一特性,检索人员在进行检索时,只要根据检索的需要,临时从词 表中选出相应的叙词,按照组配规则,任意组配检索概念,就可达到扩大或 缩小检索范围的目的。
(二)叙词的组配
1.组配的数学原理。组配标引是以现代符号逻辑运算为基础,而符号逻 辑又是以布尔逻辑代数为基础。布尔逻辑共有三种逻辑运算:
(1)逻辑积运算:又称逻辑乘运算,其符号为“AND”或“*”,主要
用于概念上具有交叉、限定关系的两个或多个叙词之间的运算。例如某文献 系统中含有叙词“医院”的文献有:2,4,5,6,8,17,21(数字表示文献 号,下同);含有叙词“信息管理”的文献有:2,3,5,9,16,17,20。 要求检索出“医院信息管理”的文献。则可用逻辑积运算表达:
“医院”AND“信息管理”=2,5,17 或者
“医院”*“信息管理”=2,5,17 用布尔逻辑运算图表达为图 2:
图 2 布尔逻辑图 从上图中可以看出,既含有叙词“医院”又含有叙词“信息管理”的文
献共有 3 篇,即两图相交的部分,文献号码为 2,5,17。 逻辑积运算的结果是使概念范围缩小。
(2)逻辑和运算:又称逻辑或运算,其符号为“OR”或“+”,是指两 个或几个可能相交,也可能不相交的概念的运算。
假定 A 及 B 二个叙词要进行逻辑和运算,即表示在要检索的文献系统中,
凡含有叙词 A 或叙词 B 的文献均命中。同时含有叙词 A 及 B 的文献也命中。 如上图:
“医院”=2,4,5,6,8,17,21 “信息管理”=2,3,5,9,16,17,20 则:“医院”+ “信息管理”
=2,3,4,5,6,8,9,16,17,20,21 可见,逻辑和运算是将几个叙词的文献篇数相加(重复者只计一次)。 逻辑和运算的结果是使概念范围扩大。
(3)逻辑差运算:又称逻辑非运算,其符号为:“NOT”或“一”,是 指二个具有从属关系的概念运算。假定 A 及 B 两个叙词要进行逻辑差运算, 则表示在含有叙词 A 的文献集合中去除含有叙词 B 的文献。
逻辑差运算的结果是使概念范围缩小。
2.组配原则
(1)应恰当地从各学科中选取组配能力强、代表基本概念的科技词汇作 叙词来进行组配。
(2)叙词组配是概念组配,而不是指单纯的字面组配。
3.叙词的概念组配种类
(1)概念相交:两个或两个以上具有概念交叉关系的同级叙词进行组 配,组配结果形成一个新的概念。
(2)概念并列:两个或两个以上具有概念并列关系的同级叙词进行组
配。
叙词检索语言所具有的概念组配的特性,使得在具体的检索过程中,可 随意扩检和缩检,从而体现了较大的伸缩性、灵活性和适应性,这也是叙词 检索语言的主要优点之所在。
三、引文检索语言
引文检索语言是一种新型的信息检索语言,它是利用文献之间的相互引 证关系而建立的一种自然语言,其标引词来自文献的主要著录项目。由于它 与传统的信息检索语言在内容特点、检索标识、词汇来源等方面有所不同, 因此引起了广大信息界及知识界的关注,并在检索实践中得到了越来越广泛 的应用。
(一)引文检索语言的产生和形成
根据引证关系编制信息检索工具源于 19 世纪 70 年代。1873 年美国出版 一种称作《谢波德引文》的“法律案例索引”,其方法是以一个案例名称作 为标识词,列出引用过该案例的其它一系列案例,一步步串联起大量相关的 案例,从而提供众多的办理此类案例资料。20 世纪 50 年代,美国人 E.加菲 尔德对这种索引法进行了较深入的研究,并编制了一种专利索引,证明“引 文法”的实用性和可行性。直到 1963 年美国《科学引文索引》编辑出版,报 道了 1961 年内出版的 613 种重要科学期刊发表的文献 113318 篇,及其引证
的 1370000 篇文献间的相互引证关系,从而获得巨大成功,也使得《科学引 文索引》成为世界上最主要的检索工具之一。
引文检索语言正是利用文献之间的“引证”与“被引证”的关系建立起 来的。文献大范围内以“引证”与“被引证”关系串联起具有一定相关程序 的“著者网络”和“文献网络”,以此原理出发,进而扩大并研究其中的关 系,并对其间的规律性加以阐述和证明,用于文献信息检索工作,即形成独 具特色的新型信息检索语言——引文检索语言。
(二)引文检索语言的特点
1.其主要检索标识为被引文献的著者姓名。著者姓名不仅是文献的外形 特征,说明某文献由某人撰写,而且从一定意义上说也是文献的内容特性, 即著者姓名也能够说明文献的学科属性。如某人因在某方面的成就而享誉该 领域,或者因其特殊的贡献,以其发明、创造等命名,故出现了一些行业中 的人名代学科、专业的现象,因此,著者姓名作为一种检索标识在西方图书 信息界已较普遍。
2.选词方便。引文检索语言的检索标识词来自文献本身,无需规范,也 无需词表。文献撰成时著者即署出姓名,加以标识,所以说文献的标识由著 者提供,与文献同时出现在加工标引人员面前,而且著者姓名一般不大变化, 具有较好的稳定性。由于它来自自然语言,可随时从文献中选取。
3.词汇丰富。引文检索语言源于“追溯法”,但优于“追溯法”。它不 是以单一文献为起点,而是以一定范围内出版的众多新文献一同多向追溯, 因而联系的文献多,著者多,标识词也多,检索时可随手从加工的文献中选 取。它检索面广,易于从较大的范围内发现同性质的文献信息。
(三)引文索引的组成部分 引文索引由三个来源相同的部分组成,但它们具有不同的排列方式。
1.引文索引。列出一段时间发表文献的全部被引文献,按被引文献的第
一著者排列,其下按时间先后列出各被引文献的出处,包括年份、刊名、卷 次、页次等,再在各条被引文献之下依次列出引证过它的全部文献。引证款 目以第一著者姓名的字顺排列,再列引证文献的出处,包括刊名、卷次、页 次、年份等。在引证文献和被引文献的出处部分均不列出篇名。
2.来源索引。是引文索引最基本的部分,因为从另两部分初步查到的线
索都要到此部分从篇名上加以核实。这一特点使其类似传统检索工具中正文 部分的作用。来源索引按引证著者姓名的字顺排,每个款目可包括姓名、文 种代号、篇名、刊名、卷次、期次、页号和发表年份。此外,还列出参考文 献的数量和第一著者的联系地址。
3.轮排主题索引。此部分是以文献篇名的关键词轮排主题索引,相当于
一般关键词索引,只是在配词时予以限定,以避免过于繁琐。其控制的方法 是限定一些词只能作配词而不能作为实词进行搭配,这就相对地减少了一些 词的轮排机会,保证索引体积不至臃肿,检出不至过泛,从而保证检索效率 的提高。
第四章 信息检索工具
信息检索工具又称文献信息检索工具,其目的是为科学研究活动提供文 献检索服务。因为它提供的不是有关数据、事实或资料性的信息,而是文献 信息的线索和指引,故又被称之为线索型检索工具。
第一节 信息检索工具的特点
检索工具是指用来存贮、报道和检索文献信息的工具,它是为了检索需 要而组织的文献信息检索性系统。它一方面是索引工作经过搜集、加工、标 引、组织文献的结果;另一方面又是寻检工具赖以进行的主要工作手段和条 件。
文献信息检索工具以各种原始文献为素材,在广泛收集并进行筛选后, 分析和揭示其外形特征和内容特性,给以书目性的描述和来源线索的指引, 形成一定数量的文献信息单元,再根据一定的框架和顺序加以排列或形成可 供查检的卡片或工具,或以图书的形式出版,或以期刊的形式连续出版,成 为向社会进行广泛报道的二次文献,使科研人员从中了解本专业学科或领域 的进展情况及科学技术发展的全貌。同时,还可以了解图书、期刊等各类文 献的出版情况及其在一些图书信息部门的收藏情况,易于利用。
概括起来,文献信息检索工具主要具有以下特点:
1.详细而又完整地记录所著录文献的线索,包括文献篇名、著者、来源 出处等项目,以便用户能利用这些线索找到有关文献。也就是说,文献信息 检索工具的收选内容是文献信息单元,不是经过浓缩加工后的知识单元,更 不是原始文献,它给予用户的是有关文献的信息线索,如用户欲获得所需的 知识,则还必须通过这些线索到所指引的一次文献中去浏览并加以选择;同 时,这些文献信息单元构成了检索工具的主体内容。
2.所提供的文献信息的线索准确可靠,内容丰富系统,其所收录的文献
信息来自于原始文献,且选题比较灵活实用,以用户需要为选材原则。
3.对所著录的文献,都标有可供检索的各种标识,如分类号、主题词、 文献序号、代号代码等等,以便用户利用这些标识来检索所需的文献。
4.在体例编排结构上,从实用易检出发,可以结合文字特点和学科特点
对所选的款目按分类排组或按主题、叙词、关键词等的字序排组,并利用“参 照”关联相关各个部分。此外,又辅以适宜的辅助工具,以便同主体的排列 相辅相成。
5.提供丰富的检索手段,即各种体系的索引,如分类索引、主题索引、 作者索引、代码索引等,以使用户能从各种途径方便地进行检索。
6.出版形式多样性,可以是图书、期刊、卡片、缩微品、磁带、磁盘、 光盘等,兼备对文献信息的揭示报道、存贮累积和检索利用的功能。
第二节 信息检索工具的类型
文献信息检索工具种类繁多,数量庞大,且表现形式各异,因此,可以 从不同的角度对文献信息检索工具进行分类。
一、按检索手段或设备划分
(一)手工检索工具 指以普通卡片目录和书本式文摘、索引等形式,以手工方法检索为基础
的文献信息检索工具。其历史悠久,至今在我国仍是最主要的检索方式。手 工检索,几乎不需要任何设备,查找方法简便灵活,检索费用低,但费时费 力,检索效率低,检索效果差。
(二)机械检索工具 指运用一定的机器设备来辅助检索文献信息的检索工具。主要有机器穿
孔卡片检索工具和缩微文献检索工具。 以穿孔卡片为载体的检索工具,是手工检索到机械检索的过渡。最早的
手检穿孔卡片检索工具出现于 1904 年,后来发展到边缘穿孔卡片、比孔卡片 到机械穿孔卡片等。但是自计算机检索出现后,穿孔卡片检索工具已逐渐不 再单独使用。
缩微文献检索工具又称光电检索工具,它是以文献缩微品作为文献库, 用一定的光电设备从中进行文献信息检索。一张缩微平片可以缩摄存贮几十 页至几千页的文献,且存贮时间较长,已普遍运用于一些珍贵文献的复制保 存。
(三)电子计算机检索系统 它是以磁性介质为载体,以计算机来处理和查找文献的一种电子化自动
化系统,由计算机、检索软件、文献数据库、检索终端及其它外用设备组成。
用户可以通过终端设备和通讯线路与相关检索系统联系,查找所需文献。电 子计算机检索的速度和效果都明显优于其它检索方式,目前在世界各国都已 得到了迅速发展。
二、按物质载体形式和种类划分
(一)书本式检索工具 书本式检索工具又可细分为期刊式、单卷式和附录式三种。
1.期刊式检索工具。它是在一个名称之下,定期连续刊行的一种检索工
具,具有期刊的特点,是目前查找科技文献的主要检索工具。其优越性在于 收录文献新,报道文献快,且能够比较完整系统地收选一个学科领域的有关 文献信息,便于回溯检索和全面了解该学科领域的发展状况;同时也便于装 订、保存、借阅、管理。
2.单卷式检索工具。这种检索工具大多是以一定的专题为内容而编印、
单独出版的。它收集的文献比较集中,往往积累了一段相当长时间的文献, 并以特定范围的读者作为对象。对于专题文献检索比较方便,有较高的使用 价值。
3.附录式检索工具。这种检索工具不独立出版,而是附于有关书刊之后, 但具有一定的参考价值。尤其是作为情报信息研究成果的综述、述评所附的 参考文献目录,往往是通过全面搜集大量文献进行精选而成,所以具有较大 的价值,也越来越受到人们的重视。
(二)卡片式检索工具 它是文献收藏单位揭示馆藏文献信息的常用检索工具,如图书馆目录,
它把每条款目写在或印在一张卡片上,然后按一定的方式将卡片一张张排列 起来,成为成套的卡片。一般包含主题目录、分类目录、篇名目录、著者目 录等。其优点是可以随时抽排,不断充实、更新,及时灵活地反映现有文献 信息。
其缺点是占有较大的馆藏空间,体积庞大,成本费用也比较昂贵,制作 费时费力等。
(三)缩微型检索工具 它是指计算机输出的缩微品,有平片与胶卷两种形式。由计算机将存贮
在计算机存贮器里的书目著录,按照人们指定的格式和排列系统进行输出, 一张普遍的缩微平片可包含 3000 多条书目著录,即能代替 3000 多张卡片。 其特点是存贮量大,体积小,成本低廉,易于保存。但它不像卡片式检
索工具那样可随时增减款目,需由计算机进行全套更新,所需费用较大。
(四)机读式检索工具 这是将书目著录按照一定的代码和一定的格式记录在特定载体上,专供
计算机“阅读”的检索工具。只有借助于计算机,才能对它进行检索。例如, 一盘规格为 2400 英尺的机读磁带,可记录 4000 万个字符,相当于每页 6000 字的文献 6600 页,而记录时间仅需 20~30 分钟,并可实现多种形式的输出, 如在计算机上显示出来,或用打印机打印,还可以存贮在个人磁盘中保存等。 其优点是查找文献迅速准确,检索效果好。
三、按收录的内容范围划分
(一)综合性检索工具
(二)专科性检索工具
(三)专题性检索工具
(四)单一性检索工具 四、按文献的著录方式划分
(一)目录
(二)题录
(三)文摘
(四)索引
(五)综述
第三节 信息检索工具的结构
文献信息检索工具收录的不是原始文献本身,而是有关原始文献的信息 和指引性线索,因此,检索工具对文献的揭示有其自己的特点,对文献的著 录和标引也有一定的方式,而且在体系结构上形成了比较固定的编排形式。
一、信息检索工具的文献著录及标引
文献的著录是对文献的外形特征进行确切的描述;文献的标引是对文献 的内容特性加以准确的标识。
(一)检索工具的文献著录方式
1.图书的著录。一般分为两种情况处理,一是如为整书著录则取书名、 著(译、编)者及各出版事项等;二是如为书中选出的章节著录,则以章节 名作为篇目名,再附以图书的出版事项以及该章节的起止页号等项加以著 录。
2.期刊文献的著录。著录内容包括:论文篇名、著者、著者工作单位、 刊名、年、卷、期、页号等,如属外文者则加译篇名,并将原文篇名加括弧 附于其后,并注明国别或文种。
3.会议论文的著录。可仿照图书章节的分析项目,即:论文篇名、著者、
会议录名称、会议日期、地点、起止页号、文种以及出版事项等;如为整本 的会议录,则仿图书处理,附著有关会议的事项。
4.科技报告的著录。一般著录报告的篇名、著者、工作单位、报告号、 年、月、日及文种。如系外文,则加译篇名,并在其后注出原文篇名。
5.学位论文的著录。要求著录论文题目、著者、导师姓名、大学系科名 称或机构名称、专业名称、学位级别、颁发学位日期、出版日期、页数、学 位编号、论文存贮符号等。
6.专利文献的著录。包括专利说明书题目、发明人、专利国别、专利号、 申请日期、公布日期等。
另外,还有政府出版物、标准文献、档案、产品样本等文献的著录,可 基本仿照以上文献的著录方式。
(二)检索工具的文献标引方式 文献的标引是对其内容的学科特性加以反映标识。一般处理的办法是采
用相关的分类表或词表作为依据,将文献的学科属性或其实际内容加以分析 鉴别,并作出标识,以便存贮于一定的检索系统,以待查检。这类标识可以 是类目、类号、主题词、叙词、单元词等,也可以是根据题目、文献的内容 摘要或文献全文中选出的能够代表其内容性质的重要词汇。这类的类表、词 表或词汇,连同其使用规范和注释等统称为信息检索语言,或称为文献语言, 本书上个章节已有介绍。
二、信息检索工具的结构
文献信息检索工具的结构同信息检索的效率和效果有很大关系。在长期 的工作实践中,其体系结构已趋于定型,一般由主体、辅助工具、使用说明 和附录四个部分组成。
(一)主体部分
主体部分是检索工具的主要部分和基础部分,由所收录文献的著录款目 组成,是存贮与检索文献的实体。其具体编排是将经过著录和标识的诸多文 献的条目依据所加的标识,把性质相同者集中,再按一定的体系原则组织起 来,而对于内容相近或相关的款目或标目未能置于相关位置者,则以“参照” 项目指引到所采用的标识款目处或标目处,以使主体部分成为一个具有内在 联系的有机整体。
(二)辅助工具
主要是指主体部分的附助索引。它是在文献检索工具中,从主体部分的 文献款目编排系统以外的角度,增加检索途径,扩大检索效果的辅助性手段。 如一些检索工具中附带的主题索引、著者索引、文献类型索引、分子式索引、 生物系统索引等。它不能离开主体部分而独立存在。
(三)使用说明 使用说明是检索工具的重要组成部分,主要包括前言和后记,用以说明
检索工具的编制目的、用途、收选文献的学科范围、时间范围、地域范围、 著录项目和格式、编排方法等。除文字性的说明外,一般从书中选出典型例 子加以解释和示范,以增加直观效果,便于理解和掌握,目的在于帮助用户 正确利用检索工具,提高检索效率。
(四)附录 附在检索工具后面的有关参考资料被称为附录。它多附于全书之后,数
目多少不等,但都是与书的内容有关,可供经常查检使用,如书中采用的符
号、缩略语、计量单位等。
第四节 检索工具的主要形式
一、目录
(一)目录的概念 目录是经过著录的一批相关文献,按照一定的次序原则编排而成的一种
揭示与报道文献信息线索的工具。目录多以图书的形式单卷出版或多卷连续 出版,提供广大读者使用参考。
目录的特点是以文献的自然出版形式,如整本书、整张图、整份资料为 著录单位存贮和供检索的。但由于目录只是描述出版物的基本特征,所以对 出版物内容揭示程度比较浅,例如图书馆目录,一般主要用来检索图书馆有 没有和有哪些自己所需要的图书、期刊等。
目录起源于早期图书馆用以揭示报道其藏书情况的卡片式目录,后经逐 渐发展演变成为当前常见的具有广泛内容和多种出版形式的书本式目录。现 代科学技术的发展推动了目录工作的实施,并不断演化形成了独立的检索工 具系列,在文献信息的检索中发挥着系统性回溯和报道新文献的重要作用。 随着计算机技术的广泛应用,文献工作标准化和协作化的发展,“缩微型” 目录和“机读型”目录的出现使目录工作发生了重大的变化,从而也推动了 目录工作的进一步发展。
(二)目录的类型
目录具有不同的类型,可以按照不同的标准加以区分。
1.按其收录文献的内容范围,可分为综合目录、专题目录、地方文献目 录、个人著述目录等。
2.按其收录文献的类型,可分为图书目录、期刊目录、资料目录等。
3.按其编制目的和社会职能,可分为登记目录、科学通报目录、推荐目 录、专题目录、目录之目录等。
4、按其反映文献收藏状况,可分为总目录、馆藏目录、联合目录等。
5.按其物质形态,可分为卡片式目录、书本式目录、机读型目录等。
6.按出版物的语种,可分为中文目录、西文目录、日文目录、俄文目录 等。
目录的类型还可以根据其它的方式加以划分,但在实践工作中常用的目
录工具主要有图书目录、期刊目录、专题目录、目录之目录等,下面分别对 这几种目录加以简介。
(1)图书目录:以图书为收选对象,又称为书目。此类目录因同图书馆 的藏书和出版业的出版目录关系密切,又可细分为馆藏目录、营业目录、推 荐目录和联合目录等,还可按收选的学科范围分为综合性书目、专题性书目、 专科性书目等。由于有些目录工程浩大,又多由政府指定的国家图书馆或出 版管理部门统一进行,这种系统而又完备的目录称之为国家书目。除回溯历 史上出版的图书外,对新书采用登记的办法加以法定的控制和掌握,所以当 前对于近期的国家书目也称作登记性书目。另外,各图书馆和出版部门又出 版以报道新书为特点的报道性书目或推荐性书目。
(2)报刊目录:以某个图书文献部门收藏或某些出版部门出版的期刊、 报纸为主要收选对象,形成综合性、专科性或专题性的目录。它也可以形成
某个国家、地区或某种文字的报刊目录,或者具有收藏性的馆藏报刊目录、 专科报刊目录,以向读者进行详细报道和提供检索使用。
(3)专科或专题文献目录:以期刊、图书、会议录中的某一专科或某一 专题内容为对象,适当增加专利文献、科技报告及单位论文等,也可加上整 本的有关图书或会议录等,形成某一专科领域的文献目录,或某一专题性质 的文献目录,以供读者集中了解本专业范围的最近文献,满足特定领域的文 献信息需求,具有较大的参考价值。
(4)目录之目录:又称为书目之书目或目录指南。它是多种检索工具汇 集在一起而编成的一种特殊的目录类型,以提供掌握各种目录的工具。读者 可以通过它了解到目前已出版的各种目录工具的性质和特点,以供选择使 用。国外很重视编制目录之目录,如美国的《世界书目之书目》、日本的《日 本书目之书目》等,都比较著名。
(三)目录的著录及编排 目录的著录款目通常包括以下各项:
(1)书名项或刊名项;
(2)著者项;
(3)出版项:包括出版者、出版地点、出版日期、版次等;
(4)稽核项:包括页数、图表、开本、装订形式、定价等;
(5)附注项:对上述各项的附注或说明;
(6)提要项、内容简介;
(7)业务注记:指图书馆在目录上做的业务记载,包括索书号、登录号、 分类号、主题词、存贮地点等。
目录的著录在于揭示所收录的文献的基本特征,以利于方便检索。而不
同的目录工具有不同的编排形式,能提供不同的检索途径。 在目录体系中,书名目录、著者目录、分类目录和主题目录是目录检索
工具提供的最常用检索途径。下面对其各自的排检方法加以简介。
1.书名目录
(1)中文图书:按书名字顺排检,具体方法有汉语拼音法、笔划法、部 首法等。
(2)外文图书:西文书名按字顺排检;日文书名有日语汉字和假名两种,
前者按汉字笔划排检,后者按假名字顺排检;俄文书名按字母顺序排检。
2.著者目录
(1)中国著者:按姓名字顺排检。
(2)外国著者:按姓在前名在后排检。而欧美人姓名排列习惯是名在前 姓在后,故编目时应将著者的名姓倒置,中间用逗号分开。
3.分类目录。分类目录是按分类法规定的图书、资料所属的学科、专业 内容对应的分类号编目,并按类号的顺序排列。
4.主题目录。主题目录是图书、资料的主题内容编排的目录,按主题词 字顺排列。
二、索引
(一)索引的概念 索引是将图书、期刊等文献中的一些重要的、有检索价值的知识单元,
如主题词、分类号、著者姓名、名词、公式、数据、事实、机构、论文篇名 等,根据需要一一分析摘录出来,并注明它们所在的页码和文献号,再按一
定的顺序编排组织起来,构成检索的种种途径,这种检索工具称为索引。 索引与目录相比较,在本质上是一样的,即是一种传递文献信息、揭示
和检索文献的工具。但索引在结构和功能上有自己的特点,主要表现为:
1.侧重揭示文献的内部特征。目录重在文献的宏观描述,对其外部特征 给予详细而精确的揭示。而索引则侧重文献的微观描述,对其内部的特定事 项或单元知识给予具体而深入的揭示,可从内容深度方面描述读者的要求。 这种检索深度是目录所不能达到的。
2.著录内容标明出处。索引的款目有指引项,以指示具体标目所含文献 信息在原文中的确切位置,这是索引区别于目录及其他检索工具的重要特 征。
3.揭示范围广,信息含量大。目录的著录对象仅限于图书及其外部特征, 而索引的著录范围涉及到书、刊、报等各类文献的各种信息,容纳了较丰富 的信息量。
(二)索引的类型 索引的出版数量大,种类繁多,且各具特色和功能。索引大体可以分为
几大类型:一是按文献外部特征编制的索引,有书、刊、篇名索引,著者索 引,文献序号索引等;二是按文献内容特征编制的索引,有分类索引、主题 索引、关键词索引等;三是按索引所反映和揭示的文献类型划分,有图书索 引、期刊索引、专利索引等;四是按标引语言来划分,有主题索引、分类索 引、著者索引、号码索引等。下面着重介绍几种常用的索引。
1.主题索引。主题索引是将文献中具有实质意义的词语或能揭示文献主
题概念的词语抽出来,经过规范化处理之后,再按字顺排列起来组织标识系 统,或在各主题词下面给出副标题词、文摘、文献出处,或在各主题下面给 出篇名性的说明语,或关键词性的说明语,然后在说明语的后面列出文摘号, 以这种方式编制的索引称为主题索引。
主题索引给检索者提供从研究课题的主题概念出发查找文献线索的途
径。主题索引又可分为以下几种:
(1)标题词索引:标题词是自然语言中比较定型的事物名称,是经过规 范化、用以表达文献主题内容的词、词组或短语。标题词索引就是以标题词 组织成的索引系统,它是最早的一种主题索引。通常,利用标题词索引,要 借助于该检索工具规定的标题词表,以便选准标题词进行检索,从而取得好 的检索效果。
(2)叙词索引:叙词又称主题词,是从文献中优选出来并经严格规范化
处理的词。它能表达文献内容特征,词间有严密的语义关系,又具组配性能, 叙词索引即是按叙词字顺排列而成的。它也是一种概念组配索引,通过叙词 间的概念组配表达文献主题和信息提问。使用叙词索引时要利用叙词表,以 正确选择检索词。叙词索引特别适用于电子计算机检索。
(3)关键词索引:它是由文献中具有实质意义的词(即关键词)按字顺 排列而成的。一篇文献被抽出的若干关键词,每个都轮流排在首位,因而从 各个关键词着手,都能查到该篇文献。但由于关键词系自然语言,又未经规 范化,各词之间也无语法关系,因此容易出现漏检、误检现象。
(4)单元词索引:单元词是经过规范化的、能表达文献主题的最小概念 单元的词,是不能再加分解的独立词汇。它是一种概念组配索引,即通过最 基本的词汇(单元词)的组配来表达复杂的概念。检索时,根据提问,把有
关的概念单元组配起来进行查找。但由于单元词本身存在的缺点,如强调词 的单元化,仅是词的字面上的分解和组配,有的词无法单元化,无参照系统 来反映单元词间的关系等,因而大型索引及检索系统一般不采用单元词,而 采用功能更强的叙词,所以单元词索引已经较少应用了。
2.著者索引。著者索引是以文献署名的姓名(注:欧美人按名在前姓在 后)的字顺排列,并在著者名字后面列出文摘号,以这种方式编制的索引称 为著者索引。
著者包括个人著者、团体著者、专利发明人、专利权所有人等,因此著 者索引也就包括个人著者索引、团体著者索引、专利发明人和专利权所有人 索引等。著者索引为检索者提供从已知著者姓名入手查找文献线索的途径和 方法。
3.分类索引。分类索引是将文献内容所属的类号按隶属关系排列起来, 并列出与分类号相应的类名,以这种方式编制的索引就称为分类索引。它是 以科学体系分类为基础,按照一定的观点和原则,结合文献的特点,采用概 念划分方法,将文献组成具有展开、隶属关系的索引体系。
分类索引给检索者提供从学科分类角度查找文献线索的途径。利用分类 索引时,需先熟悉和了解该索引的分类方法,才能取得较好的检索效果。
三、文摘
(一)文摘的概念 文摘是以简明扼要的文字摘述文献的主要内容和原始数据,向用户报道
最新研究成果,传递文献信息和查询文献线索的一种工具。它著录文献外部
特征,更着重描述文献的内容,是原文浓缩后的产物,是系统报道、积累、 检索一次文献的主要检索工具,是检索工具的主体,二次文献的核心。
文摘是随着文献的急剧增加而产生的。由于科学技术的发展,文献数量
大增,读者在有限的时间内难以逐一阅读原文,而传统的检索工具又不能及 时地报道、揭示最新的文献内容,因此,文摘应运而生,并越来越得到人们 的重视。
与其它检索工具相比,文摘主要具有如下特点:
1.浓缩性。文摘是对原文的高度浓缩,它以凝炼的文字表述完整的信息, 以最小的篇幅提供最大的信息量,使文摘在一定程度上起到原始文献的作 用。
2.客观性。文摘是对原始文献的简要的真实的复述,它忠实于原文的本
来面貌,客观准确地摘录它的内容要点,不做说明解释,更不进行引申评论。
3.检索性。文摘不仅有规范化的编制系统,标引和著录格式,还具有引 导性和检索性。文摘注明文献的出处,提供检索原文的线索,并且提供检索 用的辅助索引,如主题索引,著者索引、年度累积索引,使读者从不同的角 度检索刊物中的每一篇文摘。
(二)文摘的作用 概括起来,文摘具有以下几个方面的作用:
1.报道最新科学文献,使读者及时了解本专业最新文献出版情况和研究 进展。
由于文摘所摘录的是经过筛选的某一学科或某一专业领域最新最有学术 价值的文献,并把相关论题集中一处,因而通过一组文摘,能获悉该学科或 专业领域的学术概况及最新进展。特别是首次文摘,能使最新科研成果及时
公之于世,时效性强。
2.可以帮助读者判断检索的文献是否合乎需要。文摘能够简明扼要地揭 示文献的主题内容,因此,读者在不需要阅读原文的情况下,就可真实地了 解该文献的内容,明确其基本要点,从而较容易地判断该文献是否为自己所 需。
3.可以帮助读者消除语言上的障碍。一般读者不可能掌握多种语言,而 文摘性检索工具收录的文献都译成一种常用的文种,即利用这一常用的文种 就可以阅读到大量的文献,从而在一定程度上消除读者的语言障碍。
4.可以帮助读者对一些无法找到的文献有大致的了解。阅读了文摘大体 上就掌握了文献的主要内容,这就使读者有机会大致了解自己难以获得的相 关文献。
5.可以节省阅读时间。由于文摘是对原文献主要内容的描述,每一条文 摘实际是一篇高度浓缩、信息完整的文献,所以读者阅读文摘的时间则远远 要少于阅读原始文献所花费的时间。
6.引导读者查找原文。文摘具有引导性及检索性,读者可利用文摘对原 文献出处的注明,掌握其来源和线索,并据此查阅对自己具有参考价值的原 始文献。
(三)文摘的重要类型
文摘的类型有许多种,但最常用的还是按照文摘编写方式及其对文献的 揭示程度来划分的三种主要类型:指示性文摘、报道性文摘和简介性文摘。
1.指示性文摘。指示性文摘是把原文的主题范围、目的、方法指示给读
者,不直接摘录原文的论点和数据。它主要适用于那些篇幅过长、内容较散 的文献,如泛论性或评论性的文献等,一般不涉及具体的技术问题。其字数 一般在 100 字左右,简短扼要,起到题解作用。
2.报道性文摘。这类文摘是在对原文献进行深入的语义和逻辑分析的基
础上进行高度浓缩而形成的。它概括地叙述原文献所有或部分重要信息,包 括研究对象和目的、观点和方法、主要结论、全部论据及其价值等。报道性 文摘所含信息量大、参考利用价值高,在一定程度上能够取代原始文献。该 类文摘的篇幅一般在 300~500 字之间。
3.简介性文摘。该类文摘仅仅著录文献的外表特征,涉及文献的内容性
质浅,或仅提供简单的说明性和注释性的文字。 四、综述及述评
综述、述评属于三次文献范畴,是检索工具和非检索工具之间的一种文
献,具有一定的存贮、报道和检索功能。 综述是综合、评述的简称,以述为主,述中有评,是作者研究了某一课
题大量有关文献后对该课题在一段时间内发展情况所做的精练的综合叙述与 分析。它是几十或几百篇文献信息的高度浓缩,能够比较全面而又深刻地反 映某一专题的发展、水平、动向,具有指导意义和较高的参考价值。
述评是以评为主,评述相兼,要求更高的一种文体。它以较小的篇幅就 某课题现状、进展进行描述、评论,并提出方向性或指导性意见,具有较高 的权威性。
综述和述评都是由本学科领域的专家或权威人士撰写,是具有重要价值 的文献。它所附的大量参考文献又是查找该学科领域重要文献的线索,可以 使读者对该学科领域作进一步的了解和深入研究。
综述、述评一般发表于该学科、专业领域的核心期刊中,也有以书、刊 形式加以集中出版,以供读者系统查阅。
第五章 中外文检索工具举要
第一节 中文文献检索工具概况
科学技术的发展和文献的迅速增长推动了文献检索工作的进步,也促进 了文献信息检索工具的加速出版和检索体系的建立,从而为广大科研工作者 快速有效地查找文献信息提供了便捷的途径。
我国的文献检索体系的建设基本上是以建国后开始的,并经历了四个不 同的发展阶段,逐步形成了比较完善的检索刊物体系。
一、我国文献检索体系建设的发展阶段
1.1949~1961 年,是从无到有的发展阶段。这个阶段经历了两个“从无 到有”的转变。
第一个“从无到有”是从没有文献到开始组织力量翻译出版前苏联文摘 杂志。1956 年,中国科技情报所成立,当年便组织人员翻译出版了前苏联的 文摘杂志中的两个分册,即《机械制造文摘》和《冶金文摘》。到 1961 年, 翻译出版的前苏联文摘增加到 50 种(分册),约占前苏联出版杂志的二分之 一。同时,铁道科学研究院出版了《铁道文摘》,主要翻译的是英、美、德、 日、荷等国铁道运输方面的文摘。
第二个“从无到有”是 1958 年我国开始出版题录性的索引刊物《期刊论
文索引》(后改名为《科技文献索引》),主要报道国外期刊论文,从而实 现了从没有索引到有少量的主题索引。此期主要是翻译出版国外的检索刊 物,报道速度十分缓慢,且选题也不尽切合国情需要。因此,在 1961 年,国 家科委成立了“中国国外科学技术文献编译委员会”,负责组织协调全国的 科技文献编译报道工作,并决定“由全部翻译苏联文摘逐步过渡到自编世界 各国的文摘”,进一步促进了我国检索刊物的发展。
2.1962~1966 年,是从翻译为主向“自编本”过渡,我国检索刊物体系
已具雏形的稳步发展阶段。 此期检索刊物的出版编辑工作基本上是有组织、有计划的,编辑单位主
要有中国科技情报所及其重庆分所和各地方专职情报所。这一阶段,我国先
后出版了《中国机械文摘》、《中国化学化工文摘》,以及报道国外文献的
《科技文献索引》等刊物。到 1965 年,已出版自编的检索刊物 30 个分册。 这些检索刊物,除报道我国的科技文献外,也报道美、英、法、德、日、苏 等国的科技文献,每期报道量为几百至一千多条左右。到 1966 年 6 月,全国 出版的检索刊物已达 59 种,112 个分册,其中题录性的有 29 种,29 个分册, 年报道量 40 多万条;文摘性的有 30 种,83 个分册,年报道量 35 万条。科 学技术文献出版社计划出版 27 种文摘的年度主题索引。除此之外,还出版有 专题性、单卷本的文摘、题录等检索工具。
可见,这个时期我国的检索刊物体系已初具规模。
3.1967~1976 年,是从有到无的倒退阶段,我国文献检索刊物的编辑工 作基本停顿。
这个阶段,我国绝大多数文献检索刊物相继停刊。其间,虽有少数检索 刊物复刊,但缺乏组织和统一规划,有的出出停停,有的则复而又停,造成 检索刊物质量较低,缺乏价值。
4.1976 年至今,是高速发展阶段。1977 年 7 月,在石家庄召开了“全国
科技情报检索刊物协作会议”,议订了“关于建立健全我国科技文献情报检 索刊物体系的意见”和“1979~1985 年全国科技文献编译出版规划”(草案), 开始了有计划、有组织、有领导地统一建立我国检索刊物体系。首先有组织 地创办了报道国内文献资料的《中文科技资料目录》,共 22 个分册。1979 年,中国科技情报学会编辑出版委员会,在山东淄博市召开了学术会议,会 上决定成立“中国科技文献检索刊物总编辑部”,下设 10 个分编辑部,统一 规划、统一选题、统一编辑、统一标引,统一出版发行各种检索刊物。到 1985 年,我国公开发行的检索刊物已达 106 种。
目前,我国已经基本形成了一个较完整的检索刊物体系,并逐步走向计 划化、标准化和协调化,具备如下特点:①出版形式和内容有了统一规划;
②学科覆盖面越来越广,专业范围越分越细;③标引工作和著录格式日趋标 准化;④检索手段和检索途径逐渐完善;⑤一批专门报道国内文献的文摘刊 物出现;⑥报道量持续增长;⑦编辑单位由专职信息机构部分转向专业信息 机构,提高了检索刊物的内在质量;⑧电子计算机技术广泛应用。
二、我国文献检索工具体系
可用图 3 展示我国的文献报道与检索体系:
第二节 中文图书检索工具
图书是最常见的文献类型之一。检索中文图书,主要利用一些综合性书 目和各图书馆的藏书目录。常用的图书目录主要有以下几种。
一、《全国新书目》
《全国新书目》由中国版本图书馆编制、中华书局出版的查找国内出版 的图书的总目录。它是根据全国出版单位向版本图书馆缴呈的出版物样本编 成的目录,它比较系统地反映了我国图书出版的全貌,是检索国内图书的主 要检索工具。
《全国新书目》以月刊的形式出版,按月报道我国已出版的最新图书。 它的编排方法采用分类编排,类目包括:马克思列宁主义、毛泽东思想;哲 学;社会科学总论;政法;军事;经济;文化;科学;教育;语言;文学;
艺术;史地;自然科学;工业技术;环境科学等 22 个类目。它所分类的类目 较粗,查找时需在大类下逐条查找。其著录的内容包括大类名称、小类名称、 书名、著者、出版社、出版年月、页码、开本、定价等。
二、《全国总书目》
《全国总书目》是《全国新书目》的累积本,由国家版本图书馆编辑出 版,全面系统地报道全国当年出版的各种图书。和《全国新书目》相比,它 的功能在于累积检索,而《全国新书目》的功能在于及时报道出版的新书。 二者可以互相取长补短,选择使用。
《全国总书目》由分类目录、专题目录和附录三部分组成。 分类目类是《全国总书目》的主体部分,其类目设置同《全国新书目》
一样,共分 22 个大类,大类之下再分成小类。其收录对象全部是中文出版的 图书。
专题目录包括技术标准目录;少年儿童读物目录;中小学、师范学校、 业余学校教学用书目录;少数民族文字图书目录等。
附录部分包括报纸、杂志目录;出版者一览表;书名索引三个部分。 检索全国出版的中文图书时,可以通过分类目录查找,也可以在知道书
名的情况下,利用附录中的书名索引查找图书。可以说,《全国总书目》是 查找全国出版的中文图书最全面、最主要的检索工具。
三、《科技新书目》
《科技新书目》由新华书店北京、上海发行所主办、北京发行所编辑出 版,主要报道京、沪、津、渝等地出版的科技图书信息。它编入的科技图书 占国内出版的科技图书的 70%左右,包括新书预告、征订书介绍、存书介绍、 重要图书出版消息等栏目。
《科技新书目》是为了通报即将出版的图书信息,提供图书订购的依据。
虽然它属于非检索类刊物,但通过它可以了解国内科技图书的出版动态,为 读者提供检索的线索。
四、《外文新书通报》
《外文新书通报》是检索外文图书的检索工具,报道馆藏的外文新书。 有中国科学院图书馆、北京图书馆、安徽省图书馆、江苏省图书馆等单位编 辑的不同版本。中国科学院图书馆为报道最新馆藏的外文图书,编辑出版了
《外文新书通报》,1973 年创刊,主要报道西文、俄文、日文的社会科学、
自然科学和工程技术方面的图书。 另外,外文图书的检索工具还有《上海市外文新书联合目录:自然、技
术、科学部分》,由上海图书馆编辑出版,报道上海市有关图书情报单位所 收藏的外文原版图书,包括西文、俄文、日文等文种。
第三节 中文期刊资料检索工具
期刊资料是极其重要的信息源。据估计,来自科技期刊的信息占整个信 息来源的 65%。目前,世界上出版的科技期刊有 45000 多种,每年发表的期 刊论文达 300 万篇以上,而我国出版的中文期刊杂志在 1988 年就达 5865 种, 其中科技期刊 2877 种,因此,科技期刊的检索工具已成为科研人员进行科学 研究的重要工具。下面对常用的期刊资料检索工具加以简介。
一、《全国报刊索引》
《全国报刊索引》由上海图书馆编印;1951 年创刊,月刊。其前身为山 东省图书馆编印的《全国主要期刊重要资料索引》。从 1955 年起由上海报刊 图书馆(现为上海图书馆)接办,1956 年改名为《全国主要期刊资料索引》,
在 1966 年以后停刊,1973 年 10 月复刊,改为现名。
1980 年,《全国报刊索引》分为自然科学技术版(科技版)和哲学社会 科学版(哲社版)。它是根据当月的报纸和当月收到的期刊中的重要资料编 辑出版的。该索引收录国内公开和内部发行的全国性、专业性的报纸 149 种, 中文期刊达 3000 余种,成为报导和检索国内中文报纸和期刊论文的重要工
具。
《全国报刊索引》(哲社版)采用分类编排,共分 11 个大类:马列、毛 泽东思想;哲学;社会科学总论;政治;法律;军事;经济;科学文化;语 言文学;文学;艺术;历史;地理等,大类以下再分为二级类、三级类。在 同一类资料中,编排原则采用先动态资料后论文资料;动态资料中又采用先 国内后国外;国内动态资料先中央后地方编排。
科技版的《全国报刊索引》报道了国内发行的 3193 种中央期刊和 3 种报 纸上发表的科技资料,也采用分类编排,它包括 10 个大类:自然科学总论; 数理科学和化学;天文学;地球科学;生物科学;医药卫生;农业科学;工 业技术;交通运输;航空航天;环境科学等,大类下再分二级类、三级类。 它的著录项目有文献篇名、著者姓名、文献出处、出版年份、期号、页码等。
《全国报刊索引》全面系统地报导了国内报刊文献,为科技人员和图书
情报人员掌握国内文献提供了方便的条件。但它所提供的检索途径却只限于 分类的一种,尚缺辅检工具,是其不足之处。
该索引每年 1 月和 7 月附有“引文报刊一览表”,可以查找文献的出处。
二、《中文科技资料目录》
《中文科技资料目录》是在 1977 年石家庄“全国科技情报检索刊物协作 会议”的推动下,通过统一协调和有关单位的努力,由一些专业情报所联合 编辑出版的、报道国内科技文献的一套题录性刊物,最多时达到 22 个分册(详 见表 2)。
表 2 《中文科技资料目录》 22 个分册
期
成为本站VIP会员VIP会员登录,
若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。