《情报学基础教程(第二版)》是为学习情报学的大学生、研究生及科技情报、社科情报、图书情报工作人员编写的一部通用基础教材,内容覆盖情报理论与方法、情报管理与服务各相关领域,在统一的定量化情报学理论内核和方法基础上简明扼要地阐述了情报源、情报组织、情报检索、情报分析、情报技术、情报服务等情报学核心分支的基本知识和新近发展。
《情报学基础教程(第二版)》可以作为本科生和研究生的教材,也可供同等学力人员申请硕士学位者学习参考。 情报学基础教程-(第二版)_叶鹰武夷山_科学出版社_
第1 章
情报学经验规律
本章提要:
本章概述布拉德福定律、洛特卡定律、齐夫定律三大定态规律和文献增长律、文献老化律两类动态规律,并引介其统一机理。主要知识点:
1.布拉德福定律、洛特卡定律、齐夫定律三大定态经验定律;
2.文献增长律、文献老化律两类动态经验规律;
3.情报学经验规律的统一机理。
经验规律是学科赖以建立的基石,也是定量化研究的起点。情报学在经验规律方面已有一定积累,其基础主要由下列信息计量规律(Rousseau ,2010a)奠定。考虑到有专门的文献计量学或信息计量学教程(Egghe and Rousseau ,1990;王崇德,1990;丁学东,1993;邱均平,2001),本章在此对诸定律仅作简要介绍。
1.1 布拉德福定律
布拉德福定律是描述专业论文在期刊中分布情况的经验规律,由英国**文献学家布拉德福(S.C.Bradford)于1934年提出。
1.1.1 基础数据和规律表述
布拉德福毕业于英国伦敦大学,所学专业是化学,1922年获科学博士学位。但他热爱图书馆工作和图书馆事业,1925~1937年曾长期担任英国南肯辛顿科学图书馆馆长。在工作中他发现一个学科的专业论文常分散发表在各种期刊上,于是他以应用地球物理学和润滑专业为实例,研究了期刊论文分布的情况,提出了一个描述文献分散的经验定律。布拉德福采集的1929~1932年应用地球物理学原始数据如表1-1所示。
情报学基础教程
表1-1 布拉德福原始数据
期刊数 相关论文数 累积期刊数 累积论文数
1 93 1 93
1 86 2 176
1 56 3 235
1 48 4 283
1 46 5 329
1 35 6 354
1 28 7 392
1 20 8 412
1 17 9 429
4 16 13 493
1 15 14 508
5 14 19 578
1 12 20 590
2 11 22 612
5 10 27 662
3 9 30 689
8 8 38 753
7 7 45 802
11 6 56 868
12 5 68 928
17 4 85 996
23 3 108 1065
49 2 157 1163
169 1 326 1332
资料来源:Bradford ,1950;Garfield ,1980
如果将以上数据分成3个区域:分区期刊数相关论文数每刊年载相关论文数
c9(nc)429>4159(n1)4991-42258(n2)4041
则近似有
nc:n1:n2=1:a:a2,a≈5 显然这只是一条近似规律。用文字表述就是:如果将期刊按其刊载某专业论文数量的多寡以递减顺序排列,则可分出一个核心区和相继的几个区域,当每区刊载的论文量相等时,核心期刊数nc和
第1章 情报学经验规律
外围一区期刊数n1、外围二区期刊数n2成nc∶n1∶n2=1∶a∶a2 关系。其中a称为布拉德福常数。
若以累积期刊数n或其对数为横坐标、累积相关论文数R(n)为纵坐标,一般可作出如图1-1所示的分布曲线。
后来布鲁克斯(B.C.Brookes )用公式将该曲线对应的布拉德福定律表述为
αnβ (1 ≤ n ≤ nc )R(n)=
klg (n/s),,(nc≤n≤N)
(1-1)其中,R(n)为相关论文累积数;N是期刊总数,n为期刊等级排序后的序号;α是n=1对应的R(n);β,k,s为参数。曲线右上端的弯折称为格鲁斯(Q.V.Groos )下降。
1.1.2 改进和扩展
布拉德福1934年提出上述经验规律后,并未引起人们注意。1948年,其专著?文献学?(Documentation)出版,在第9章中全文收录了1934年的发现,才引起另一位英国文献学家维克利(B.C.Vickery )的重视。维克利对之进行研究后,将外围区扩展到多个区域,并**用“布拉德福分散定律”命名这一经验规律(Vickery BC and Vickery A ,1987)。
把期刊按照刊载某学科相关论文的数量排列,可得到专门登载该学科论文的核心区期刊和若干外围区期刊,当各区所含该学科相关论文相等时,各区期刊数成nc∶n1∶n2∶.=1∶a∶a2∶.(a>1)(1-2)其中,a是布拉德福常数。并有一个改进称为维克利推论:nc∶(nc+n1)∶(nc+n1+n2)∶.=1∶b∶b2∶.(b>1)(1-3)其中,b叫做维克利系数。1977年,苏联情报学家斯莫里科夫(И.А.Смольков)对布鲁克斯的公式描述进行研究后,提出用一个统一的方程来表述布拉德福定律:
其中,K、β、q1、q2均为参数R。(n)=Klg (q1 n + q2 e -βn ) (1-4)
1.1.3 应用提示
布拉德福定律的主要用途是确定核心期刊,以指导期刊订购和期刊利用,并由此扩展到核心馆藏维护、核心检索工具选择等。有人认为布拉德福定律可以看作是社会科学中普遍存在的“二八律”的一种表现,即20%的核心期刊上刊载了80%的重要论文。
此外,布拉德福定律也应用于考察专著的分布等。上海交通大学王国龙等通过对
情报学基础教程
SCI 和SSCI 引用期刊的研究,发现影响因子(IF :Impact Factor )的分布也符合布拉德福定律① 。
1.2 洛特卡定律
洛特卡定律是描述作者与其发表论文数量之间关系的经验规律,由美国统计学家洛特卡(A.J.Lotka)于1926年提出(Lotka ,1926)。
1.2.1 基础数据和规律表述
洛特卡出生在波兰,曾留学法国、德国、英国,后在美国工作,出任过美国统计学会理事长。他的原创性研究是对物理学和化学两大学科中科学家们发表论文的情况进行的统计分析。对于物理学,他使用德国奥尔巴赫(Aürbach)?物理学史一览表?(Ge-schichtstafelen der Physik )的人名索引,对其中作者(总计1325位)进行统计分析,依次列出发表1篇、2篇和多篇论文的作者数;对于化学,他采用?化学文摘?(Chem-icalAbstracts,1907―1917)十年累积索引中的姓氏对以A 、B 开头的6891位作者进行了统计,分别列出发表1篇、2篇、3篇直至346篇论文的作者数。结果发现物理学1325位作者中,发表1篇论文的为784人,占59.2%;化学A 字母姓氏作者1543人,发表1篇论文的为890人,占57.7%;B 字母姓氏作者5348人,写1篇论文的为3101人,占57.98%。于是他提出作者的百分比分布(科学生产率的频率分布)应符合如下公式:
f(x)=xca (1-5)
其中,f(x)是发表x篇论文的作者占作者总数的百分比(作者频率),常数a>1(经验研究表明1.8
表1-2 洛特卡原始数据片段
论文数 统计数据 作图数据
撰写人数/人 实际比例/% 计算比例/% 数据点个数 斜率
1 784 59 .17 60 .79 13 -2 .0411
2 204 15 .40 15 .20 14 -2 .0533
3 127 9 .58 6 .75 15 -2 .0182
4 50 3 .77 3 .80 16 -2 .0255
①王国龙,李佩.SCI 源期刊与JCR .上海交通大学学报,2003(增刊):287-290;王国龙.SSCI 源期刊概述.中国索引,2004,2(2):20-25
续表
论文数 统计数据 作图数据
撰写人数/人 实际比例/% 计算比例/% 数据点个数 斜率
5 33 2 .49 2 .43 17 -2 .0210
6 28 2 .11 1 .69 18 -2 .0953
7 19 1 .43 1 .24 19 -2 .1385
8 19 1 .43 0 .95 20 -2 .0786
9 6 0 .45 0 .75 21 -2 .0726
10 7 0 .53 0 .61 22 -1 .9887
11 6 0 .45 0 .50 23 -1 .9989
12 7 0 .53 0 .42 24 -1 .9946
13 4 0 .30 0 .36 25 -1 .9754
14 4 0 .30 0 .31 26 -1 .9490
15 5 0 .38 0 .27 27 -1 .8485
. . . . . .
资料来源:邱均平,1988
基于这些数据绘制的log f(x)~log x直线如图1-2所示。
既然大部分数据点(尤其是前13~25个点)获得的斜率都接近-2,故洛特卡定律近似平方反比律:
f(x)=c 2 (1-7)
x其中c是常数。
由于1=n ∑=∞1 f(n)=∑∞n=1nc 2= c π62 , 故c = π62 ≈
60.79%,f(1)=1c 2= c , 进而有cf (1)
f (2) = 22 = 22 (1-8)
. cf (1)
f(n)=n2= n2 (1-9)
也就是说,发表1篇论文的作者约占作者总数的60.79%,发表2篇论文的作者是发表1篇论文作者数量的1/4..发表n篇论文的作者是发表1篇论文作者数量的1/n2。
洛特卡定律描述了作者人数与其发表论文量之间的关系,**揭示了作者与发表论文数量之间存在的规律。后经研究,发现物理学等学科领域的作者与论文数量之间的关系基本符合平方反比律,而生物、工程、计算机等领域则不符合平方反比律。一般来
情报学基础教程
说,人文科学、社会科学中,a值将变大;规模较大、科研合作程度较高的学科中,a值会变小。
1.2.2 改进与扩展
虽然洛特卡定律早在1926年就提出,但直到1949年才被称为“洛特卡定律”。后来,不少学者深入探讨了洛特卡定律的形成机理和改善表达,**科学家普赖斯(D.Price)就在洛特卡定律基础上进一步研究了科学家人数和科学论文数量之间的关联,在?小科学,大科学?一书中提出了“普赖斯定律”:科学家总数是杰出科学家人数的平方(或者说杰出科学家人数是科学家总数的平方根)。普赖斯定律的另一定量表达是:杰出科学家发表了全部科学论文的50%。
设nmax 为杰出科学家中*高产作者发表论文数,m为杰出科学家中*低产作者发表论文数,R为杰出科学家人数与全体科学家总数之比,普赖斯还推导出以下两式:
m = 0.749
nmax (1-10)
R = 0.812/
nmax (1-11) 也就是说,杰出科学家中*低产作者发表论文数是*高产作者发表论文数平方根的0.749倍;杰出科学家人数与全体科学家总数之比是杰出科学家中*高产作者发表论文数平方根倒数的0.812倍。比利时**信息计量学家L.Egghe 更进一步在洛特卡定律基础上发展出洛特卡信息计量学(Egghe ,2005),该学说具有较高的理论价值。
1.2.3 应用提示
洛特卡定律主要用于研究“科学生产率”,可用于预测发表不同篇数论文的作者数量和特定学科的论文总量,或根据作者数量估计科学论文数量等。为合理评价洛特卡定律的适用性,美国情报学家科依尔(R.C.Coile)于1977年提��用K-S (Kolmogorov-Smirnov )检验法对其进行鉴定,其步骤为
(1)设A 为统计的作者总数,计算K-S 值:K-S =1.63/A。
(2)计算*大偏差值D:D=max |F0(x)-Sn(x)|;其中F0(x)为累积作者频率理论值,Sn(x)为累积作者频率观察值。
(3)比较D与K-S :若D
K-S ,则抽样分布不符合洛特卡定律。
科依尔用该方法检测了洛特卡?物理学史一览表?和?化学文摘?的原始数据,发现?物理学史一览表?的数据符合洛特卡定律,而?化学文摘?的数据则不完全符合洛特卡定律。科依尔还用该方法对美国国会图书馆的MARC 作者统计数据和伊利诺依大学图书馆学院卡片目录作者统计数据进行了检验,结果发现美国国会图书馆的MARC 作者统计数据不符合洛特卡定律,而伊利诺依大学图书馆学院卡片目录作者统计数据则完全符合洛特卡定律。K-S 检验法从此成为检验洛特卡定律适用性的有效方法。
国内也有不少洛特卡定律研究成果,如福建农林大学张贤澳围绕洛特卡定律发表过
《普通高等教育“十一五”**级规划教材:情报学基础教程(第2版)》特色: 理论与实践相结合:由国内知名学者和专家组成的作者队伍使《普通高等教育“十一五”**级规划教材:情报学基础教程(第2版)》在理论结合实践方面独具特色。 基础与前沿相贯通:《普通高等教育“十一五”**级规划教材:情报学基础教程(第2版)》既全面阐述了情报学基础理论与方法,又密切联系学科前沿进展,在贯通基础与前沿方面独具特色。 传承与创新相融会:本书在全面传承学科知识的同时,在理论体系和学科体系的完善方面进行了开拓和创新。