首页 > 论文期刊知识库 > 文献计量研究问题

文献计量研究问题

发布时间:

文献计量研究问题

文献计量学是以几个经验统计规律为核心的。例如:表征出科技文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐普夫定律(1948);确定某一学科论文在期刊中分布的布拉德福定律(1934)等。文献计量学一直围绕这几个定律,沿着两个方向发展:其一是验证与完善这些经验定律;其二是扩大与推广这些经验定律的实际应用。目前,文献计量学应用十分广泛。微观的应用有确定核心文献,评价出版物,考察文献利用率,实现书情报部门的科学管理。宏观的应用有设计更经济的情报系统和网络,提高情报处理效率,寻找文献服务中的弊端与缺陷,预测出版方向,发展并完善情报基础理论等。由于存在影响文献情报流的人为因素,很多文献问题尚难以定量化。特别是由于文献系统高度的复杂性和不稳定性,不可能获得足够的、有效的信息,来揭示文献的宏观规律。文献计量学的发展有赖于数学工具和统计学技术的支持,移植或利用更有效的数学工具和统计学方法,将是其重要的发展方向。

文献计量学的理论中国早在数年前就提出“科教兴国”的战略口号,邓小平同志也说“科技是第一生产力”,江泽民同志“三个代表”重要思想更是强调“共产党人必须是先进文化的代表”,而学术期刊是科技及先进文化的载体,面对世界经济日趋一体化的趋势,面对信息通讯技术及信息处理现代化方式日臻完善的今天,作为载体的学术期刊就应先行一步,高瞻远瞩这是形势使然。科学技术研究的最终结果主要表现在发表科技论文、科技成果获奖和取得社会与经济效益三个方面。科技论文一般指在专业学术刊物上公开发表、具有一定学术水平的研究性论文,它是科技活动和科技成果的主要表现形式,是科学研究最直接产出形式之一。科技论文的数量和质量,一定程度上反映了科学研究的成果和效率,特别是论文的水平,是评价一个国家、一个单位以及科研人员科技能力和水平的一项重要指标。通过对科技论文的定量分析进而对科技产出能力和科技水平进行整体评价,国内外管理人员进行了许多有益的研究和尝试,如利用模糊数学模型分析等方法。其中,文献计量学分析方法是近年来广泛应用的定量分析方法之一。文献计量学是一门新兴学科。它从定量的角度出发,采用数学、统计学等计量方法,通过对文献特征的统计分析,来研究文献体系的分布、结构、数量关系和定量管理,进而探讨文献的变化规律和科学管理。近几年来,文献计量学的研究成果被广泛应用于情报学以外的科学技术领域中,其中一个重要方面就是将文献计量学指标用于科学技术生产效率的评价,使决策者可以对科技研究进行有效的定量化管理。简单的文献计量学指标,例如出版著作数、发表论文数、被引用次数等等,已经被广泛应用于部门中作为考核、奖惩、晋升职工的评估依据。这些简单指标的组合,就可以评价大学、研究所、工业公司以至整个国家的科技水平与影响能力。在近10年中,文献计量学得到了很大的发展,取得了许多成果,各方面更趋成熟,研究层次更趋深入,定量化描述的手段与方法也日益改善。同时寻求更系统全面的数据集合,更现代化的文献数据处理手段,最终有效地指导文献情报工作。近几年来,文献计量学的应用范围不断拓宽,应用研究的力度明显加大,特别是在科技管理与决策中的应用越来越受到有关领导部门和研究者的重视。国外对此十分重视,例如,美国、英国、匈牙利、印度等许多国家不仅把文献计量指标作为科学计量学指标体系中的重要组成部分,而且还从管理的高度,认为它是衡量一个国家科学文化水平乃至综合国力的一种重要途径和有效方法。早在20世纪60年代,美国就开始编制《科学引文索引》(SCI)。这一大型索引的出版和发行,为文献计量学研究提供了一种多功能的有力工具,一定程度上解决了文献计量学应用所必需的大量数据,有效地推动了文献计量学的全面发展,被誉为文献计量学史上具有划时代意义的研究成果。可以说,没有SCI就没有现代的文献计量学。我国著名学者赵红洲、蒋国华等人曾经利用文献计量方法,排出了我国主要大学发表论文的名次,并以“学术榜”的名义在报纸上公布后,引起了社会各界的强烈反响,并受到国家科委、中国科学院和国家自然科学基金会领导的高度重视。从1987年起,国家科委为了从一个侧面评价我国学科发展、科技投入产出情况及科研机构和科技人员的成就,委托中国科技情报研究所(今改名为中国科技信息研究所)利用ISI的三套出版物,对我国学者从1983年以来发表的论文情况进行统计分析。接着,国家科委专门下达资助课题,要求中国科技信息研究所进行更大范围、更系统的文献信息统计分析,对我国科技水平在世界上所处的地位以及主要大学、科研院、所的科学生产能力和学术水平作出客观评价,并逐步形成制度,每年召开一次新闻发布会,公布有关统计结果。中国科学院文献信息中心从1998年起也逐年出版《中国科学计量指标:论文与引文统计》(简称《指标集》)。集内有100多项统计指标,运用科学计量学和文献计量学的有关方法,对我国科技论文的产出力和影响力及其分布情况从总体上进行了客观的描述。该书的内容包括:统计源概貌,机构研究计量统计,国家重点实验室和部门开放实验室研究计量指标,地区研究计量指标,科技基金计量指标,合作研究计量指标,人才研究计量指标,文献评价计量指标。近几年来,国家自然科学基金会连续资助了6项文献计量学和科学计量学方面的研究课题,促使其研究上规模、上档次、上水平,从而有力地推动了文献计量学的深入发展。由于文献计量指标的评价功能与其它社会评价指标的功能是一致的,而且其研究成果和计量数据可以为有关部门的管理和决策提供定量依据与支持,因而越来越受到有关领导和管理部门的广泛重视。这一重要进展表明,文献计量学的某些内容和方法正在由课题研究向事业化方向发展,成为国家科技文化事业的一个组成部分。这有利于文献计量学冲破传统的局限,增强其渗透力和辐射力,大步进入“科技圈”、“管理圈”、“决策圈”,在更大的范围内充分发挥其作用,从而进一步得到社会各界的承认和重视。这是90年代以来文献计量学研究和应用发展的显著特点与趋势之一。国内外地学文献统计分析系统国内外地学文献统计分析系统建立的背景文献计量学的应用是建立在大量数据的基础上的,因此必须利用计算机等现代化手段建立正规的文献信息计量工具,为应用提供大规模数据的获取渠道和来源,必须依托较为适宜的文献数据库才能进行。目前国内文献计量学研究大多利用SCI为数据源进行统计研究,但在本研究进行项目调研中发现SCI创建时间较短,在可追溯性方面不如一些历史悠久的传统检索工具(如地质学方面有200多年收录史的GeoRef),虽然SCI收录5000多种期刊,但由于其专业覆盖面很广,故每个学科的收录数量都不够。并且SCI对各学科的重视程度不同,所以各科学间的数据不具备可比性。此外SCI中没有“分类号”一项,不能按学科进行分类检索,因此用它进行某学科的统计就很困难,一些文献统计项目为了用SCI进行各学科综合统计研究不得不花费大量人力对原始数据重新进行分类等加工、录入,这一点可反映出数据源选定的是否得当在很大程度上影响着统计工作的结果和效率。可以认为利用SCI对国内外地球科学进行分学科和领域论文分布及其变化趋势分析,论文使用的分析测试方法统计分析,论文研究的区域分布统计分析,论文提出的新理论和新方法无法满足要求,因此,本项目组自行设计并完成了国内外地学文献统计分析系统。国内外地学文献统计分析系统国内外地学文献统计分析系统应用数据库技术和公共查询系统技术实现对地学文献数据的存储、查询、分析、输出,实现地学文献的信息化管理。(1)系统运行环境:服务器:WINDOWS NT及其以上平台,PIII 800、RAM/256M、Disk/20G;客户机:DINDWOS 9X或WINDOWS NT及其以上平台,PII 350、RAM/64M、Disk/9G;网络:互联网;数据库:MS-SQL 2000。(2)系统结构:国内外地学期刊统计分析系统的设计采用了三级B/S体系结构,三层结构包括客户机、应用服务器、Web服务器、数据库服务器。这种方式又称瘦客户机系统,在客户机端没有或者有很少的应用代码。客户机负责数据结果的显示和用户请求的提交。应用服务器和Web服务器负责响应和处理用户的请求。而数据库服务器负责数据的管理工作。所有的空间数据和应用程序都放在服务器端,客户端只是提出请求,所有的响应都在服务器端完成。其中,Web服务器位于系统的中间,是原型系统的枢纽与核心部分,是系统设计和实现的关键。系统结构如图1所示。系统前端是Client/Brower,中间是Web Server,后端是Sql Server。图1 国内外地学文献统计分析系统应用的结构图(3)系统总体功能:数据库管理:实现数据输入与维护、查询、显示输出等,系统也提供Web环境下的数据管理,数据信息可在远程或本地进行编辑、浏览、维护。系统可进行文献计量统计初评估、总评估:依据文献查询结果进行学科、主题、作者、研究单位、研究区域等相关度的统计和分析。数据交换功能:系统可通过转换工具将数据转换为其它标准格式,如2709等国标数据。系统具有完整的桌面管理和帮助系统。(4)系统构成框图(图2)与主要功能图(图3)。图2 国内外地学文献统计分析系统的构成框图(5)系统的开发和应用环境:在中文WIN2000下利用SQL2000、ULTRADEV、VBSCRIPT进行开发。国内外地学文献统计分析系统数据源选定国内外地学期刊统计分析系统建库主要收集和利用《GeoRef检索系统》(以下简称GeoRef)、《中国地质文献库及检索系统》(以下简称GDS)作为数据源,GeoRef是中国地质图书馆在1982年开始引进的美国地质调查所信息中心所建的地学文献数据库,该数据库收录了北美地区自1785 年以来的和世界上其它地区自1933年以来的地质文献,包含了地球科学领域国际上公认的5000余种期刊、会议资料等,总共约220万余条,其收录范围覆盖了地球科学近40 个类目,是目前国际最权威的地质学文献检索数据库。GDS由中国地质图书馆所建,收录1985 年至今的400 余种期刊、专著、论文集和国际会议中文资料,累积文献量达20 余万条,收录范围基本覆盖了地球科学、土地科学等40个类目,是我国地球科学和土地科学研究领域最大型的检索系统,是国内最权威的地质学文献数据库。选取上述两个数据库作为本系统数据源的主要原因是:①GDS的基本结构和选刊原则等诸多方面与GeoRef接轨,建库依据了文献计量学的结果;②两种数据库均有较为严格选刊标准,收录文献的种类较多,即将国家级单位主持的地球科学类专业杂志悉数收录,也将一些地方主办、流通区域有限因而影响较小的地球科学杂志收录;③两种数据库收录时间较长,GeoRef已有200年数据,GDS的数据年限已有近19年,非常适合于我们对多年来地球科学论文情况进行分析;④两种数据库的分类系统设立既遵循了地球科学的学科分类,又是从检索文献的实际需要出发,并且GDS是参考了GeoRef的类目名(表1、表2)。所以根据GeoRef和GDS得到的分析结果应该是代表国内外地球科学研究水平。不足之处是两种数据库都缺少引文分析。图3 国内外地学期刊统计分析系统的主要功能示意图表1 GeoRef数据各学科使用代码列表表2 GDS数据各学科使用代码列表续表国内外地学期刊统计分析实例国内外地学期刊统计分析是利用国内外地学文献统计分析系统,检索提取科技人员和研究机构发表论文数量的统计数据,进行科技人员群落及研究机构的学术榜的测定;检索提取分类统计数据,进行相关学科的学科体系演变和发展趋势分析。国内研究机构论文数量的统计分析国内外地学期刊统计分析系统框架结构中的选项有:题目、作者/单位、刊名、出版社、出版年、卷、页、文献索取号、语言、载体形态、关键词、分类号、文献识别号、记录状态、文献类型、目录级别、文献载体、ISSN号、ISBN号、会议、版次。如想了解我国近年来各研究机构发表论文的情况,通过系统选择框架结构中“出版年”,输入“年代(1997、1998、…2001)”,检索出各年代收录的全部文献,再选择系统框架结构中的“作者/单位”输入、并通过Excel运算处理,即可得到如下的统计数据(表3)。表3 国内外地学期刊统计分析系统1997~2001年收录国内研究机构论文数量国内外学科结构统计分析利用国内外文献统计分析系统对GeoRef数据库100年、GDS数据库15年期刊论文进行学科的统计分析,数据采集的方法是利用分析系统框架结构中的“分类号”进行检索,GeoRef数据库的检索式:分类号的字段代码、GDS数据库的检索式:选择检索系统框架结构中的“分类号”,输入分类代码,采用上述方法我们采集了国外100年、国内15年的分类数据,编制了国际地质科学体系学科结构的百年演变图及国内地质学科体系学科结构近20年演变图(详见第一章)。中外综合性期刊地学论文对比研究(1)《科学通报》、《中国科学(D辑)》、《Nature》和《Science》的地学学科结构的统计分析《Nature》和《Science》分别是英国和美国主办的世界顶尖的综合性科学杂志,所发表的地学文章一般都反映了地质科学研究的一些重要进展。而《中国科学(D辑)》、《科学通报》也可以算是我国顶尖的综合性科学杂志,4种杂志的学科结构,反映了近年来地质科学基础和前沿研究领域及其变化趋势。比较4种期刊可知,第四纪地质学方面的论文数都居于其它学科之上,说明近年来对第四纪地质与全球变化科学研究日趋重视。词频统计结果也表明与其相关的术语出现最多,如“第四纪”、“新生代”、“全新世”等。因为第四纪从时间上离人类活动的历史最近,因此研究第四纪地质、环境、气候变化等,无不与我们人类的生存这个重大问题密切相关。《Science》和《Nature》上关于宇宙地质(或球外地质)的论文排名在前5位,比在《中国科学》《科学通报》上的排名要靠前。球外地质实际上也是一个涉及到未来人类居住环境的重要科学问题,当然它还反映了我们对地球起源等根本问题的不懈探索。之所以国内这方面的论文还比较少,其原因可能是多方面的,主要可能与国家经济实力、技术设备水平有关,其次是对人类环境问题的关注程度。另一方面,从统计结果中可以清楚地看出,在国外两著名期刊上关于经济地质(包括矿产、能源等)方面的论文数量较少,而国内两大期刊在油气地质、金属矿床两类论文数量均名列前茅,这与我国是发展中国家,对矿产、能源的需求量大有关。另外,地质找矿仍然在我国地质工作中占相当大比重,这方面的成果(论文)也就很多。(2)《Nature》和《Science》国别分布的统计分析从表4、表5可看出,前10位除中国之外都是当今世界上经济最发达的国家,尤其是美国更是遥遥领先,英、法、德为第二梯队,明显落后于美国。这表明只有经济上相对强大了,科技的发展才能得到有力支持。中国自20世纪90年代以来,经济发展较快,也很重视科技对社会生产力的推动作用,因而加大了对科技的投入,之所以能够跻身前10强,说明我国在地学领域已取得了一些领先水平的研究成果。表4 在《Science》1996~2001年发表地学论文数前10位的国家图4反映了过去20多年以来我国在国际著名期刊上发表地学论文的情况,论文数量总体上呈上升趋势,尤其近6年以来迅速攀升,表明我国地学研究在某些方面已经受到国际上的重视。表5 在《Nature》1996~2001年发表地学论文数前10位的国家图4 近年来我国学者在《Science》、《Nature》上发表的地学论文数量变化曲线(3)《中国科学(D辑)》、《科学通报》、《Nature》和《Science》机构分布的统计分析对《中国科学(D辑)》、《科学通报》、《Nature》和《Science》4种期刊1996~2001年每一年不同单位发表论文数的多少进行了排序,从图5、图6看,在《Nature》上大学、研究所、国际组织、公司和其他分别占58%、28%、15%、11%、2%;《Science》上大学、研究所、国际组织、公司和其他分别占47%、27%、4%、05%、24%,大学所占比重最大,其次为研究所。这与《中国科学(D辑)》、《科学通报》情况完全相反(表6、表7)。从表6、表7中可以看出,我国发表地学论文最多的单位是研究所,其次才是大学或学院。按发表论文的多少进行排序的结果表明,中科院地质所、地球物理所及其所属各实验室发表论文数最多,其次为地科院、地震局、海洋局等所属研究所。中科院论文数遥遥领先于其它研究所。大学中学术论文数量较多的是中国地质大学(武汉)、中国地质大学(北京)、南京大学、北京大学、西北大学、同济大学(排名未分先后)。图5《Nature》1996~2001年发表地学论文机构分布图6《Science》1996~2001年发表地学论文机构分布表6《中国科学D辑》1996~2001年发表论文作者单位分类统计表7《科学通报》1996~2001年发表论文作者单位分类统计中外期刊地学论文研究领域的对比分析根据选定的国内外地学期刊统计分析系统数据源,采集和分析了16000多个数据,从而对矿物学、地球化学、岩石学、古生物地史学及地层学、构造地质学、矿床地质学、地球物理学、第四纪地质学与全球变化、环境地质学、工程地质学、能源地质学、行星与宇宙地质学、海洋地质学、地质年代学、地质观测技术等研究学科和领域进行了专题调研,反映了研究领域的变化趋势(详见学科分述部分)。

文献计量研究

这个也要看具体要求,对综述类论文参考文献的数量不同杂志有不同的要求,一般以30篇以内为宜,以3-5年内的最新文献为主。扩展资料:文献(拼音wénxiàn),汉语词语,意思为有历史意义或研究价值的图书、期刊、典章。出自《论语·八佾》。

人们对文献定量化的研究, 可以回溯到 20世纪初。1917年FJ科尔和NB伊尔斯首先采用定量的方法,研究了1543~1860年所发表的比较解剖学文献,对有关图书和期刊文章进行统计,并按 国别加以分类。1923 年EW休姆提出“文献统计学”一词,并解释为:“通过对书面交流的统计及对其他方面的分析,以观察书面交流的过程,及某个学科的性质和发展方向。”1969年文献学家 A普里查德提出用文 献计量学代替文献统计学,他把文献统计学的研究对象由期刊扩展到所有的书刊资料。目前,文献计量学已成为情报学和文献学的一个重要学科分支。同时也展现出重要的方法论价值,成为情报学的一个特殊研究方法。在情报学内部的逻辑结构中,文献计量学已渐居核心地位,是与科学传播及基础理论关系密切的学术环节。现在全世界每年发表的文献计量学学术论文约为400~500篇。

文献计量学研究

文献计量学是以几个经验统计规律为核心的。例如:表征出科技文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐普夫定律(1948);确定某一学科论文在期刊中分布的布拉德福定律(1934)等。文献计量学一直围绕这几个定律,沿着两个方向发展:其一是验证与完善这些经验定律;其二是扩大与推广这些经验定律的实际应用。目前,文献计量学应用十分广泛。微观的应用有确定核心文献,评价出版物,考察文献利用率,实现图书情报部门的科学管理。宏观的应用有设计更经济的情报系统和网络,提高情报处理效率,寻找文献服务中的弊端与缺陷,预测出版方向,发展并完善情报基础理论等。由于存在影响文献情报流的人为因素,很多文献问题尚难以定量化。特别是由于文献系统高度的复杂性和不稳定性,我们不可能获得足够的、有效的信息,来揭示文献的宏观规律。文献计量学的发展有赖于数学工具和统计学技术的支持,移植或利用更有效的数学工具和统计学方法,将是其重要的发展方向。

文献计量学的理论中国早在数年前就提出“科教兴国”的战略口号,邓小平同志也说“科技是第一生产力”,江泽民同志“三个代表”重要思想更是强调“共产党人必须是先进文化的代表”,而学术期刊是科技及先进文化的载体,面对世界经济日趋一体化的趋势,面对信息通讯技术及信息处理现代化方式日臻完善的今天,作为载体的学术期刊就应先行一步,高瞻远瞩这是形势使然。科学技术研究的最终结果主要表现在发表科技论文、科技成果获奖和取得社会与经济效益三个方面。科技论文一般指在专业学术刊物上公开发表、具有一定学术水平的研究性论文,它是科技活动和科技成果的主要表现形式,是科学研究最直接产出形式之一。科技论文的数量和质量,一定程度上反映了科学研究的成果和效率,特别是论文的水平,是评价一个国家、一个单位以及科研人员科技能力和水平的一项重要指标。通过对科技论文的定量分析进而对科技产出能力和科技水平进行整体评价,国内外管理人员进行了许多有益的研究和尝试,如利用模糊数学模型分析等方法。其中,文献计量学分析方法是近年来广泛应用的定量分析方法之一。文献计量学是一门新兴学科。它从定量的角度出发,采用数学、统计学等计量方法,通过对文献特征的统计分析,来研究文献体系的分布、结构、数量关系和定量管理,进而探讨文献的变化规律和科学管理。近几年来,文献计量学的研究成果被广泛应用于情报学以外的科学技术领域中,其中一个重要方面就是将文献计量学指标用于科学技术生产效率的评价,使决策者可以对科技研究进行有效的定量化管理。简单的文献计量学指标,例如出版著作数、发表论文数、被引用次数等等,已经被广泛应用于部门中作为考核、奖惩、晋升职工的评估依据。这些简单指标的组合,就可以评价大学、研究所、工业公司以至整个国家的科技水平与影响能力。在近10年中,文献计量学得到了很大的发展,取得了许多成果,各方面更趋成熟,研究层次更趋深入,定量化描述的手段与方法也日益改善。同时寻求更系统全面的数据集合,更现代化的文献数据处理手段,最终有效地指导文献情报工作。近几年来,文献计量学的应用范围不断拓宽,应用研究的力度明显加大,特别是在科技管理与决策中的应用越来越受到有关领导部门和研究者的重视。国外对此十分重视,例如,美国、英国、匈牙利、印度等许多国家不仅把文献计量指标作为科学计量学指标体系中的重要组成部分,而且还从管理的高度,认为它是衡量一个国家科学文化水平乃至综合国力的一种重要途径和有效方法。早在20世纪60年代,美国就开始编制《科学引文索引》(SCI)。这一大型索引的出版和发行,为文献计量学研究提供了一种多功能的有力工具,一定程度上解决了文献计量学应用所必需的大量数据,有效地推动了文献计量学的全面发展,被誉为文献计量学史上具有划时代意义的研究成果。可以说,没有SCI就没有现代的文献计量学。我国著名学者赵红洲、蒋国华等人曾经利用文献计量方法,排出了我国主要大学发表论文的名次,并以“学术榜”的名义在报纸上公布后,引起了社会各界的强烈反响,并受到国家科委、中国科学院和国家自然科学基金会领导的高度重视。从1987年起,国家科委为了从一个侧面评价我国学科发展、科技投入产出情况及科研机构和科技人员的成就,委托中国科技情报研究所(今改名为中国科技信息研究所)利用ISI的三套出版物,对我国学者从1983年以来发表的论文情况进行统计分析。接着,国家科委专门下达资助课题,要求中国科技信息研究所进行更大范围、更系统的文献信息统计分析,对我国科技水平在世界上所处的地位以及主要大学、科研院、所的科学生产能力和学术水平作出客观评价,并逐步形成制度,每年召开一次新闻发布会,公布有关统计结果。中国科学院文献信息中心从1998年起也逐年出版《中国科学计量指标:论文与引文统计》(简称《指标集》)。集内有100多项统计指标,运用科学计量学和文献计量学的有关方法,对我国科技论文的产出力和影响力及其分布情况从总体上进行了客观的描述。该书的内容包括:统计源概貌,机构研究计量统计,国家重点实验室和部门开放实验室研究计量指标,地区研究计量指标,科技基金计量指标,合作研究计量指标,人才研究计量指标,文献评价计量指标。近几年来,国家自然科学基金会连续资助了6项文献计量学和科学计量学方面的研究课题,促使其研究上规模、上档次、上水平,从而有力地推动了文献计量学的深入发展。由于文献计量指标的评价功能与其它社会评价指标的功能是一致的,而且其研究成果和计量数据可以为有关部门的管理和决策提供定量依据与支持,因而越来越受到有关领导和管理部门的广泛重视。这一重要进展表明,文献计量学的某些内容和方法正在由课题研究向事业化方向发展,成为国家科技文化事业的一个组成部分。这有利于文献计量学冲破传统的局限,增强其渗透力和辐射力,大步进入“科技圈”、“管理圈”、“决策圈”,在更大的范围内充分发挥其作用,从而进一步得到社会各界的承认和重视。这是90年代以来文献计量学研究和应用发展的显著特点与趋势之一。国内外地学文献统计分析系统国内外地学文献统计分析系统建立的背景文献计量学的应用是建立在大量数据的基础上的,因此必须利用计算机等现代化手段建立正规的文献信息计量工具,为应用提供大规模数据的获取渠道和来源,必须依托较为适宜的文献数据库才能进行。目前国内文献计量学研究大多利用SCI为数据源进行统计研究,但在本研究进行项目调研中发现SCI创建时间较短,在可追溯性方面不如一些历史悠久的传统检索工具(如地质学方面有200多年收录史的GeoRef),虽然SCI收录5000多种期刊,但由于其专业覆盖面很广,故每个学科的收录数量都不够。并且SCI对各学科的重视程度不同,所以各科学间的数据不具备可比性。此外SCI中没有“分类号”一项,不能按学科进行分类检索,因此用它进行某学科的统计就很困难,一些文献统计项目为了用SCI进行各学科综合统计研究不得不花费大量人力对原始数据重新进行分类等加工、录入,这一点可反映出数据源选定的是否得当在很大程度上影响着统计工作的结果和效率。可以认为利用SCI对国内外地球科学进行分学科和领域论文分布及其变化趋势分析,论文使用的分析测试方法统计分析,论文研究的区域分布统计分析,论文提出的新理论和新方法无法满足要求,因此,本项目组自行设计并完成了国内外地学文献统计分析系统。国内外地学文献统计分析系统国内外地学文献统计分析系统应用数据库技术和公共查询系统技术实现对地学文献数据的存储、查询、分析、输出,实现地学文献的信息化管理。(1)系统运行环境:服务器:WINDOWS NT及其以上平台,PIII 800、RAM/256M、Disk/20G;客户机:DINDWOS 9X或WINDOWS NT及其以上平台,PII 350、RAM/64M、Disk/9G;网络:互联网;数据库:MS-SQL 2000。(2)系统结构:国内外地学期刊统计分析系统的设计采用了三级B/S体系结构,三层结构包括客户机、应用服务器、Web服务器、数据库服务器。这种方式又称瘦客户机系统,在客户机端没有或者有很少的应用代码。客户机负责数据结果的显示和用户请求的提交。应用服务器和Web服务器负责响应和处理用户的请求。而数据库服务器负责数据的管理工作。所有的空间数据和应用程序都放在服务器端,客户端只是提出请求,所有的响应都在服务器端完成。其中,Web服务器位于系统的中间,是原型系统的枢纽与核心部分,是系统设计和实现的关键。系统结构如图1所示。系统前端是Client/Brower,中间是Web Server,后端是Sql Server。图1 国内外地学文献统计分析系统应用的结构图(3)系统总体功能:数据库管理:实现数据输入与维护、查询、显示输出等,系统也提供Web环境下的数据管理,数据信息可在远程或本地进行编辑、浏览、维护。系统可进行文献计量统计初评估、总评估:依据文献查询结果进行学科、主题、作者、研究单位、研究区域等相关度的统计和分析。数据交换功能:系统可通过转换工具将数据转换为其它标准格式,如2709等国标数据。系统具有完整的桌面管理和帮助系统。(4)系统构成框图(图2)与主要功能图(图3)。图2 国内外地学文献统计分析系统的构成框图(5)系统的开发和应用环境:在中文WIN2000下利用SQL2000、ULTRADEV、VBSCRIPT进行开发。国内外地学文献统计分析系统数据源选定国内外地学期刊统计分析系统建库主要收集和利用《GeoRef检索系统》(以下简称GeoRef)、《中国地质文献库及检索系统》(以下简称GDS)作为数据源,GeoRef是中国地质图书馆在1982年开始引进的美国地质调查所信息中心所建的地学文献数据库,该数据库收录了北美地区自1785 年以来的和世界上其它地区自1933年以来的地质文献,包含了地球科学领域国际上公认的5000余种期刊、会议资料等,总共约220万余条,其收录范围覆盖了地球科学近40 个类目,是目前国际最权威的地质学文献检索数据库。GDS由中国地质图书馆所建,收录1985 年至今的400 余种期刊、专著、论文集和国际会议中文资料,累积文献量达20 余万条,收录范围基本覆盖了地球科学、土地科学等40个类目,是我国地球科学和土地科学研究领域最大型的检索系统,是国内最权威的地质学文献数据库。选取上述两个数据库作为本系统数据源的主要原因是:①GDS的基本结构和选刊原则等诸多方面与GeoRef接轨,建库依据了文献计量学的结果;②两种数据库均有较为严格选刊标准,收录文献的种类较多,即将国家级单位主持的地球科学类专业杂志悉数收录,也将一些地方主办、流通区域有限因而影响较小的地球科学杂志收录;③两种数据库收录时间较长,GeoRef已有200年数据,GDS的数据年限已有近19年,非常适合于我们对多年来地球科学论文情况进行分析;④两种数据库的分类系统设立既遵循了地球科学的学科分类,又是从检索文献的实际需要出发,并且GDS是参考了GeoRef的类目名(表1、表2)。所以根据GeoRef和GDS得到的分析结果应该是代表国内外地球科学研究水平。不足之处是两种数据库都缺少引文分析。图3 国内外地学期刊统计分析系统的主要功能示意图表1 GeoRef数据各学科使用代码列表表2 GDS数据各学科使用代码列表续表国内外地学期刊统计分析实例国内外地学期刊统计分析是利用国内外地学文献统计分析系统,检索提取科技人员和研究机构发表论文数量的统计数据,进行科技人员群落及研究机构的学术榜的测定;检索提取分类统计数据,进行相关学科的学科体系演变和发展趋势分析。国内研究机构论文数量的统计分析国内外地学期刊统计分析系统框架结构中的选项有:题目、作者/单位、刊名、出版社、出版年、卷、页、文献索取号、语言、载体形态、关键词、分类号、文献识别号、记录状态、文献类型、目录级别、文献载体、ISSN号、ISBN号、会议、版次。如想了解我国近年来各研究机构发表论文的情况,通过系统选择框架结构中“出版年”,输入“年代(1997、1998、…2001)”,检索出各年代收录的全部文献,再选择系统框架结构中的“作者/单位”输入、并通过Excel运算处理,即可得到如下的统计数据(表3)。表3 国内外地学期刊统计分析系统1997~2001年收录国内研究机构论文数量国内外学科结构统计分析利用国内外文献统计分析系统对GeoRef数据库100年、GDS数据库15年期刊论文进行学科的统计分析,数据采集的方法是利用分析系统框架结构中的“分类号”进行检索,GeoRef数据库的检索式:分类号的字段代码、GDS数据库的检索式:选择检索系统框架结构中的“分类号”,输入分类代码,采用上述方法我们采集了国外100年、国内15年的分类数据,编制了国际地质科学体系学科结构的百年演变图及国内地质学科体系学科结构近20年演变图(详见第一章)。中外综合性期刊地学论文对比研究(1)《科学通报》、《中国科学(D辑)》、《Nature》和《Science》的地学学科结构的统计分析《Nature》和《Science》分别是英国和美国主办的世界顶尖的综合性科学杂志,所发表的地学文章一般都反映了地质科学研究的一些重要进展。而《中国科学(D辑)》、《科学通报》也可以算是我国顶尖的综合性科学杂志,4种杂志的学科结构,反映了近年来地质科学基础和前沿研究领域及其变化趋势。比较4种期刊可知,第四纪地质学方面的论文数都居于其它学科之上,说明近年来对第四纪地质与全球变化科学研究日趋重视。词频统计结果也表明与其相关的术语出现最多,如“第四纪”、“新生代”、“全新世”等。因为第四纪从时间上离人类活动的历史最近,因此研究第四纪地质、环境、气候变化等,无不与我们人类的生存这个重大问题密切相关。《Science》和《Nature》上关于宇宙地质(或球外地质)的论文排名在前5位,比在《中国科学》《科学通报》上的排名要靠前。球外地质实际上也是一个涉及到未来人类居住环境的重要科学问题,当然它还反映了我们对地球起源等根本问题的不懈探索。之所以国内这方面的论文还比较少,其原因可能是多方面的,主要可能与国家经济实力、技术设备水平有关,其次是对人类环境问题的关注程度。另一方面,从统计结果中可以清楚地看出,在国外两著名期刊上关于经济地质(包括矿产、能源等)方面的论文数量较少,而国内两大期刊在油气地质、金属矿床两类论文数量均名列前茅,这与我国是发展中国家,对矿产、能源的需求量大有关。另外,地质找矿仍然在我国地质工作中占相当大比重,这方面的成果(论文)也就很多。(2)《Nature》和《Science》国别分布的统计分析从表4、表5可看出,前10位除中国之外都是当今世界上经济最发达的国家,尤其是美国更是遥遥领先,英、法、德为第二梯队,明显落后于美国。这表明只有经济上相对强大了,科技的发展才能得到有力支持。中国自20世纪90年代以来,经济发展较快,也很重视科技对社会生产力的推动作用,因而加大了对科技的投入,之所以能够跻身前10强,说明我国在地学领域已取得了一些领先水平的研究成果。表4 在《Science》1996~2001年发表地学论文数前10位的国家图4反映了过去20多年以来我国在国际著名期刊上发表地学论文的情况,论文数量总体上呈上升趋势,尤其近6年以来迅速攀升,表明我国地学研究在某些方面已经受到国际上的重视。表5 在《Nature》1996~2001年发表地学论文数前10位的国家图4 近年来我国学者在《Science》、《Nature》上发表的地学论文数量变化曲线(3)《中国科学(D辑)》、《科学通报》、《Nature》和《Science》机构分布的统计分析对《中国科学(D辑)》、《科学通报》、《Nature》和《Science》4种期刊1996~2001年每一年不同单位发表论文数的多少进行了排序,从图5、图6看,在《Nature》上大学、研究所、国际组织、公司和其他分别占58%、28%、15%、11%、2%;《Science》上大学、研究所、国际组织、公司和其他分别占47%、27%、4%、05%、24%,大学所占比重最大,其次为研究所。这与《中国科学(D辑)》、《科学通报》情况完全相反(表6、表7)。从表6、表7中可以看出,我国发表地学论文最多的单位是研究所,其次才是大学或学院。按发表论文的多少进行排序的结果表明,中科院地质所、地球物理所及其所属各实验室发表论文数最多,其次为地科院、地震局、海洋局等所属研究所。中科院论文数遥遥领先于其它研究所。大学中学术论文数量较多的是中国地质大学(武汉)、中国地质大学(北京)、南京大学、北京大学、西北大学、同济大学(排名未分先后)。图5《Nature》1996~2001年发表地学论文机构分布图6《Science》1996~2001年发表地学论文机构分布表6《中国科学D辑》1996~2001年发表论文作者单位分类统计表7《科学通报》1996~2001年发表论文作者单位分类统计中外期刊地学论文研究领域的对比分析根据选定的国内外地学期刊统计分析系统数据源,采集和分析了16000多个数据,从而对矿物学、地球化学、岩石学、古生物地史学及地层学、构造地质学、矿床地质学、地球物理学、第四纪地质学与全球变化、环境地质学、工程地质学、能源地质学、行星与宇宙地质学、海洋地质学、地质年代学、地质观测技术等研究学科和领域进行了专题调研,反映了研究领域的变化趋势(详见学科分述部分)。

文献计量研究方法

文献计量学是以几个经验统计规律为核心的。例如:表征出科技文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐普夫定律(1948);确定某一学科论文在期刊中分布的布拉德福定律(1934)等。文献计量学一直围绕这几个定律,沿着两个方向发展:其一是验证与完善这些经验定律;其二是扩大与推广这些经验定律的实际应用。目前,文献计量学应用十分广泛。微观的应用有确定核心文献,评价出版物,考察文献利用率,实现书情报部门的科学管理。宏观的应用有设计更经济的情报系统和网络,提高情报处理效率,寻找文献服务中的弊端与缺陷,预测出版方向,发展并完善情报基础理论等。由于存在影响文献情报流的人为因素,很多文献问题尚难以定量化。特别是由于文献系统高度的复杂性和不稳定性,不可能获得足够的、有效的信息,来揭示文献的宏观规律。文献计量学的发展有赖于数学工具和统计学技术的支持,移植或利用更有效的数学工具和统计学方法,将是其重要的发展方向。

文献研究法是指通过阅读、分析文献得出对主、客观事物认识的研究方法。这种研究方法通常不与研究对象进行直接的接触,而是通过文献来间接地对研究对象的本质和规律进行研究。它包括文献计量学法、引文分析法等。简单地说,文献是记录知识的一切载体(GB3792.1—83,文献著录总则)。它由文献信息、文献载体、符号系统和记录方式四部分组成。从不同的角度,可以将文献分为不同的类型:从出版或加工的形式,可以将文献分为图书、期刊、专利文献、标准文献、会议文献、产品样本、档案文献、“灰色”文献等;从文献加工层次,可以将其分为一次文献、二次文献、三次文献。随着现代技术的飞速发展,文献的数量和质量都在不断提高,为人们利用这种方法展开研究活动提供了一个很好的基础。 (1)应适当选择所需的文献。现在是一个信息膨胀的时代,大量的文献都可以为我们提供相应的信息。我们要从大量的文献当中找到适合研究目标的文献,特别是要注意选取第一手的原始材料、相对权威的信息源、完整和系统的文献材料。对于历史文献要注重进行考据工作,要去伪存真,去粗取精,不能泥古守旧。如法国学者乔治勒费尔(1874—1956)为撰写《法国革命时期的诺尔郡农民》一书,查阅了1066份公证人记录和大量的其他文献,编制了200多页统计图表,深入论证了大革命时代诺尔郡的农村状况。(2)应恰当确定某类文献中所要观察的项目。文献中含有大量的信息,我们要确定所要观察的是哪些项目,这样才能避免其他信息的干扰。如我们要研究某类学术期刊的作者情况,只要从文献中找到相关著者的信息即可,没必要对其他的信息进行采集。这样可以提高研究工作的效率,保证想获得的信息不被其他的信息污染。(3)应列出观察项目的分布表。为了在观察时做到心中有数,我们通常要在调研文献前确定一些标准,对观察所要获取的项目确定下来,以此来指导以后的观察活动。如以与《红楼梦》相关的文献为对象展开研究,可以根据文献推出的年代为总线,把各个时代的文献根据文献的种类、作者、发表时间、主要观点、发文和语种、作者所在地区、作者所在的工作机构、文献的题名等项目为观察内容。通过对信息的分类、汇总、统计,可以发现《红楼梦》的研究现状及其发展趋势。(4)应归纳、统计和分析有关的事实、术语、数据等。由于人们研究的角度不同,研究者的认识不同,对于一些事物往往会有不同的解释,从而形成许多种概念。如对于某个概念,在不同的年代,由于人们认识水平的不同,各个学科的学者都会从各自的研究出发提出各种不同的定义。文献研究就是要以众多的定义作为研究的基础,对它们进行归纳、分析,找出其共同点。(5)应在分析的基础上得出有关的观点、结论等。通过对大量文献的研究,我们可以得到许多目的性很强的数据。在这些数据的基础上,我们要利用类比、归纳、统计等方法,从普遍的事实和数据中找到共性的内容,然后运用逻辑的方法对其进行一定的抽象,最终形成一定的理论观点或结论。《南京大学在西方图书馆学,中国本土化过程中的贡献》[2]这篇文章通过对大量文献的调研、分析和汇总,发现了南京大学在开设图书馆学相关课程、创办最早的图书馆学专业、创办最早的图书馆学期刊、筹建中国图书馆协会、培养图书馆学专门人才等方面都有很大的成就。它在西方图书馆学中国本土化的过程中起到了重要的作用。

文献计量研究概念

文献计量法是借助文献各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的定量分析方法。_南追ㄊ茄芯空咄ü樵摹⒓稹⒓庸ふ碛泄匚南?,从而正确地探索所要研究的教育问题的一种教育研究方法。

计量数据源、计量对象。无论是文献计量还是替代计量学,都是为科研学术进行评价服务、人才选择考核等不同评价场景提供参考依据,其根本区别体现在两方面:1、文献计量学是基于引文分析的计量,所以计量数据来自于引文数据,数据存量有限。替代计量学数据来源除了引文数据外,还包括网络书签、文献管理软件、推荐评论等社交网络和开放数据平台等所有用户在网络系统留下的数据。2、通过计量数据的来源可知,文献计量学评价的主要是对象的期刊或发表的论文,对期刊论文的学术影响力较小。而替代计量可以通过对所有来源数据计量评价,对网络的数据影响力更加全面、细致。

  • 索引序列
  • 文献计量研究问题
  • 文献计量研究
  • 文献计量学研究
  • 文献计量研究方法
  • 文献计量研究概念
  • 返回顶部