第1章 信息概论
1.1 信息与信息资源
1.1.1 信息及其相关术语
1.信息
(1)概念。自20世纪40年代申农(C.E.Shannon)和维纳(NorbertWie?ner)分别提出信息论和控制论以来,人们对信息的认识可谓众说纷纭。不同领域的专家学者从不同的学科角度,作出了不同的解释。哲学家认为信息是认识论的一部分;物理学家认为信息是熵的理论;通信工作者把它看成是不定度的描述;数学家���为它是概率论的发展;情报学家则认为信息是生物及自控系统与外界交换的一切内容。在本书中,信息主要是指信息资源中所包含的事物事件的事实、知识或思想,即信息载体中传递的内容,信息系统传输和处理的对象。
(2)属性。虽然各学科对信息的理解不同,但信息有一些共同的属性。①客观性。世间一切事物都在运动,信息正是由于事物的运动而产生,所以信息作为对事物属性的反映,也是客观存在的,可以被识别、存储、转换和传递。②可处理性。信息可以通过一定的手段进行处理。人脑就是*佳的信息处理器可以进行决策、设计、研究、写作、改进、发明、创造等多种信息处理活动。计算机也具有信息处理功能。③传递性。任何信息都可以在信源与信宿之间通过载体进行传递,语言、表情、动作、报刊、书籍、广播、电视、电话等都是信息的载体。④时效性。信息具有时间价值,及时把握和正确运用信息可能会产生更大的价值。一些信息可能会随时间的推移逐渐失去价值,但也有可能在一段时间后的其他方面显现出价值。信息的时效性与其具体内容和环境条件有关。⑤共享性。信息能够共享是信息区别于物质和能量的*主要特征,即同一内容的信息可以在同一时间、同一地域被多个使用者同时分享,其分享的信息内容和信息量,不会因为分享者的多少而受影响,原有的信息内容和信息量也不会因此损失或减少。
2.知识我国《辞海》(1989年版)对知识的解释为:“是人类认识的成果或结晶。
其实质是指人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中*有价值的部分。”人类在利用自然、改造自然的社会实践中,主要依靠搜集来自于客观世界的信息,并将其加以概括与总结,来取得再活动的新知。人们在实践经验的基础上发挥主观能动性,对所掌握的信息加以系统化、完备化,就形成了人类的知识。因此,可以说知识来自于信息,知识是信息的一部分。知识一经产生,就以声像信息、实物信息、文献信息的形式传播。
3.文献
《中华人民共和国**标准――文献著录总则》(GB3792.11983)定义文献是:“记录有知识的一切载体。”《文献情报术语国际标准(草案)》(ISO/DIS5127)定义文献是:“在存储、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存储有信息或数据的载体。”
由上述定义可以看出,构成文献的四个基本要素为:构成文献内核的知识信息;记录知识信息的符号,包括文字、公式、图表、编码、声像、电磁信息等;记录知识信息的技术,包括书写、印刷、刻录等;负载知识信息的载体,包括多种天然材料和人工材料。四个基本要素缺一不可。
总而言之,信息无处不在,是生产知识的原料;信息中被人类认识并系统化的部分成为知识;文献是存储、传递知识信息的载体。
1.1.2 信息资源
信息资源是经过人类选取、组织、序化的有用信息的集合。俗话说“独木难成林”,同样,一条或几条信息也构不成信息资源。只有当信息达到一定的丰度和凝聚度时,才能成为信息资源。信息资源是经过人类选择的、对人类有用或能满足人类需求的那部分信息的总和或集合。有用性是一切资源的本质属性,信息资源也不例外。与非信息资源相比,信息资源*显著的特征就是有序性。对水资源、石油资源、矿产资源等自然资源来说,无所谓有序无序,只要具备一定的丰度和凝聚度,值得人们开采、获取即可。信息资源却不然,无序的信息不仅无法利用,还会造成信息通道的“栓塞”,阻碍信息的传播、交流、开发和利用。因此,组织、序化的信息才能成为信息资源,而没有控制的、未经组织的信息将不能成为资源。
1.2 文献信息资源
1.2 文献信息资源
1.2.1 概述
信息资源的类型很多,要想获得对信息资源检索与利用的主动权,就必须了解信息资源的各种类型,理解它们在内容和形式上的差异,掌握它们在生产应用和科技开发方面的各自价值。对于高校师生、科研人员与工程技术人员,信息资源主要指文献信息资源。
按照不同的标准,文献信息资源可以分为不同的类型。
1.2.2 类型与特点
1.按文献信息资源的存储载体来划分
(1)印刷型。以纸张为载体,通过手写、铅印、油印、胶印、影印、复印等手段,将文字固化在纸张上所形成的文献。它是传统文献的基本形式,也是目前文献的主要形式,包括各种图书资料、连续出版物(期刊、报纸等)、学位论文、专利、标准、会议文献、政府出版物及其复印品等。优点是可以直接读取,便于阅览和流通,价格便宜,传递范围广。缺点是过于笨重,存储密度低,体积大,难以实现现代化利用。
(2)缩微型。以感光材料为载体,以印刷型文献为母体,采用光学摄影技术,将文字、图形、图像按规定比例缩小记录的文献形式,如缩微卡片、平片、胶卷等。该类文献的优点是信息存储密度高,体积小,平均可以节约存储空间95%以上,易于传递,并且保存期较长,不易损坏和变质。缺点是必须借助缩微阅读机阅读,不便携带。
(3)声像型。以磁性材料或感光材料为存储载体,借助特定的设备采用磁录技术和光录技术直接记录声音信息和图像信息所形成的文献,如录音带、录像带、唱片、幻灯片等。该类文献的特点是存储信息密度高,用有声语言和图像传递信息,直观性强,易于接受,在传递信息知识方面有着不可替代的优势,但需要借助一定的设备才能阅读。
(4)电子型。以数字化形式,把文字、图像、声音、动画等多种形式的信息,以计算机输入方式存储在光、磁等非印刷型介质上,利用计算机及现代通信方式提供信息的一种新型文献。电子出版物内容丰富,类型多。按信息存储介质划分,主要有软磁盘与光盘两大类;按出版物类型划分,主要有电子期刊、电子图书、电子报纸、电子名录、电子地图、各种联机信息库、光盘数据库、磁带、
软盘等产品;按媒体的信息结构组织形式划分,主要有文本型出版物、超文本出版物、多媒体出版物、超媒体出版物等。电子出版物的问世是信息时代的重要标志,极大地提高了信息的传递速度,加速了社会信息化的进程。此类文献的优点是信息容量大、出版周期短、易更新、易复制、方便检索、具有可交互性、可共享。缺点是阅读需要借助一定的设备,其长期保存问题以及版权问题等还没有得到解决。
2.按文献信息资源的出版类型来划分
(1)图书(Book)。图书是将已有的科研成果与知识进行全面系统的概括和论述,通过文字、图画或其他符号,书写或印刷于纸张上的具有完整装帧形式的非连续出版物。图书是文献中*古老、*重要的一类。图书可以分为三类:一是教科书、科普读物和一般生产技术图书,属于阅读学习型图书;二是参考工具书,如字典、辞典、手册、年鉴、百科全书等;三是科学著作,反映某一学科或专题研究的各类学术性成果,具有较高的学术价值。图书的内容一般比较全面、系统、理论性强,而且图书的阅读不受时空和设备的限制,比较方便。但是编辑出版周期较长,对于新知识新技术的报道有一定的滞后。对于要获取某一专题较全面、系统的知识,或对于不熟悉的问题要获得基本了解的读者,可以**参阅图书。图书的著录特征(外部特征)有:书名、作者、版次、出版社、出版年、国际标准书号(InternationalStandardBookNumber,ISBN)、图书定价等。
(2)期刊(Periodical)。期刊,又称杂志(Journal/Magazine),是指采用固定名称,定期或不定期出版,并汇集多位著者论文的连续出版物。期刊的特点是,每种期刊都有固定的名称和版式,有国际标准连续出版编号(InternationalStandardSerialNumber,ISSN),有专门的编辑机构编辑出版,与图书相比,它报道文献速度快、学科广、数量大、时效性较高。期刊按内容可以分为学术型和休闲型两种。学术型期刊上刊载的论文大多数是原始文献,包含许多新发现、新技术、新成果、新动向,在学术研究信息来源方面占有重要地位,约占全部学术研究信息来源的65%~70%。期刊的著录特征有:刊名、出版单位、年/卷/期、国际标准连续出版物编号(InternationalStandardSerialNumber,ISSN)。
(3)报纸(Newspaper)。报纸是指每期版式基本相同的、以报道新闻及其评论为主的一种连续出版物。报纸能以*快的速度报道世界各地发生的*新事件和科技研究中产生的*新成果,一般以新闻为主。相比于期刊,它的出版周期更短,信息传递更及时。根据报纸的出版周期,分为日报、隔日报、三日报、周报、旬报等。
(4)专利(Patent)。专利,此处具体指专利说明书,是指专利申请人向本国或外国的专利主管部门提出申请保护某项发明时所呈交的一份详细的技术说
明,经专利主管部门审查,公开出版或授权后的文献。专利说明书在内容上具有广泛性、详尽性、实用性、新颖性、**性。专利涉及的学科领域广、数量大,也是技术信息的一个主要来源。
(5)会议文献(ConferenceArticle)。会议文献是指在国内外各种学术会议上宣读和交流的论文、报告和其他有关资料。会议文献有三类:一是会前文献,指会议日程预报和会议论文预印本;二是会中文献,指会议的开幕词、讲演词、讨论和决议等;三是会后文献,指会议结束后的正式出版物,如会议录和论文集。会议文献大多是某学科领域的新发现、新观点、新方法、新成果,在学术会议上**发表,可靠性较高、内容专深新颖、出版发行较快,往往具有一定的先导性和启发性。因此会议文献具有较高的学术参考价值,是一种重要的文献信息资源。
(6)学位论文(Dissertation)。学位论文是指高等院校或科研机构的学生(本科生、硕士研究生、博士研究生)为获得相应学位资格,在导师指导下完成的科学研究、实验成果的研究论文(包括博士论文、硕士论文和学士论文)。学位论文都是就某一专题进行研究所作的总结,对问题的论述比较详细、系统,具有一定的**性,对科研有一定的参考价值,尤其是博士学位论文。学位论文一般不公开出版,仅由学位授予单位和**指定单位收藏。现在可以通过“CNKI中国**博硕士学位论文全文数据库”和“万方中国学位论文数据库”来查找国内学位论文。
(7)科技报告(ScientificandTechnicalReport)。科技报告是指**政府部门和科研生产单位关于某项研究成果的总结报告,或是在科研活动的各个阶段撰写的反映科研活动的技术内容和经验的特种文献。科技报告自20世纪20年代产生以来发展迅速,已成为继期刊之后的第二大报道科技*新成果的文献类型。它比期刊论文内容详尽、可靠,出版周期短、报道速度快,能反映一个**或某一学科领域的科研水平,有些报告涉及**技术或国防问题等,一般控制发行,所以是一种****的信息资源。科技报告各篇单独成册,统一编号由主管机构连续出版。在世界的科技报告中,以美国的四大报告*为**,即PB(PublishingBoard)报告、AD(ASTIADocuments)报告、NASA(NationalAeronauticsandSpaceAdministration)报告和DOE(DepartmentofEnergy)报告。
(8)标准文献(StandardLiterature)。标准文献是指经过公认的权威当局批准的一整套在特定范围或领域内必须执行的规格、规则、技术要求等规范性文献。有单行本和汇编本(图书形式)两种出版发行方式。标准文献具有计划性、协调性和法律约束性的特点,可促使产品规格化、系列化和通用化,对提高生产水平、产品质量,节约原材料,推广应用研究成果,促进科技发展等有着十分重要的作用。通过标准文献还可了解各国经济政策、技术政策、生产水平、资源状
况和标准水平。标准按性质可划分为技术标准和管理标准。技术标准按内容又可分为基础标准、产品标准、方法标准、**和环境保护标准等。标准按适用范围可划分为国际标准、区域性标准、**标准、专业(部)标准和企业标准,按成熟程度可划分为法定标准、**标准、试行标准、标准草案等。
(9)政府出版物(GovernmentPublication)。政府出版物是指政府部门及其专门研究机构发布或出版的文献,分为行政性和科技性两大类。行政性文件包括政府报告、会议记录、法令、条约、决议、规章制度、调查统计资料等;科技性文件包括科研报告、科普资料、科技政策、技术法则等。其特点是具有正式性和权威性,通过政府出版物可以了解**的有关科技、经济发展政策以及有关研究状况,有助于正确地确定科研方向,选择课题。
(10)
产品样本(ProductSampleBook)。产品样本也称作产品目录、产品说明书、产品手册等,是厂商对定型产品的性能、构造、原理、用途、规格、使用方法、操作规程等所做的具体说明。产品样本的特点是技术上较成熟、数据可靠、图文并茂、形象直观,有助于了解有关领域的生产动态和发展趋势,是进行技术革新、开发新产品、设计、订货等方面不可缺少的信息源,也是广大消费者了解产品的途径。
(11)
技术档案(TechnicalArchive)。技术档案是指在生产建设和技术部门的技术活动中形成的对具体事物对象的真实记录材料,包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、试验和工艺记录等。技术档案是生产建设和科技工作的重要文献。技术档案一般由参与该技术活动的单位收藏,通常为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。
3.按文献信息资源的加工层次来划分
(1)零次文献信息资源。未经过任何加工整理、也未形成正式文本、仅供在一定范围内使用的信息资源,如手稿、日记实验记录、设计草图、论文草稿、谈话记录、会议记录、内部档案、听取经验交流、演讲等。零次文献信息资源是研究者本人及其著作的重要参考源,具有零散性、新颖性和表象性。
(2)一次文献信息资源。一次文献又称原始文献(简称原文,现多称全文),是作者以自己的经验和研究成果为依据而撰写的、未经加工的原始文献(不论其载体形式或出版类型如何)。包括大部分期刊论文、科技报告、专利文献、会议文献、学位论文、专著等。特点是具有新颖性、创造性、价值性和分散性。一次文献信息资源数量庞大、种类繁多,是*基本的信息资源,是科技文献的主体,也是信息检索和利用的主要对象。
(3)二次文献信息资源。按一定的方法对一次文献信息资源进行整理、加
工、提炼、组织,使之有序化而便于存储、检索的系统。它主要包括目录、题录、索引、文摘、数据库等信息检索工具。在这些检索工具中,一次文献信息资源被加工成条目(或称为记录),并按一定的方式组织起来,从而可以提高检索一次文献信息资源的速度和效率。二次文献信息资源具有汇集性、综合性、系统性和检索性的特点。
(4)三次文献信息资源。围绕某个专题或出于特定目的,根据二次文献信息资源提供的线索,选用大量一次文献信息资源的内容,经过筛选、分析、综合、浓缩等深度加工而形成的文献。它主要包括各种综述、述评、进展报告、教科书、字典、词典、手册、年鉴、百科全书等,可分为综述研究类和参考工具类两种类型。三次文献信息资源是再生性科研文献信息资源,内容成熟,系统性和综合性较强,文后附有大量参考文献。
综上所述,从零次文献信息资源、一次文献信息资源到二次文献信息资源、三次文献信息资源,是一个从分散到集中、从无序到有序、从片面到全面的文献加工过程。每一工程所含知识信息的质和量都不同,对人们利用知识信息所起的作用也不同。从信息检索的角度看,零次文献信息资源是生成一次文献信息资源的主要素材,一次文献信息资源是检索和利用的主要对象,二次文献信息资源是信息检索工具,三次文献信息资源是一次文献信息资源研究的成果。
1.3 电子信息资源
1.3.1 概念
电子信息资源是信息资源的一种,是电子化的信息资源,即以电子数据的形式,把文字、图形、图像、声音等多种形式的信息存放在光、磁等非印刷型介质上,以电信号、光信号的形式传输,并通过相应的计算机和其他外部设备再现出来的一种信息资源。
1.3.2 类型
电子信息资源可分为两大类:模拟信息资源和数字信息资源。模拟信息资源是通过广播、电影、电视、录像等以模拟信号来传递的信息资源。数字信息资源是通过电子计算机等以数字信号来传递的信息资源。目前所说的电子信息资源主要是指数字信息资源。
数字信息资源按不同的标准可分为若干类型。
1.按信息载体划分
(1)电子出版物信息资源。电子出版物是把文献以电子数据的形式存储在光