更全的杂志信息网

大数据与中国科技期刊发展研究现状综述

更新时间:2009-03-28

2017年12月8日,中共中央总书记习近平在主持中央政治局就实施国家大数据战略的第二次集体学习时强调[1],“大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民”。最早提出大数据时代到来的全球知名咨询公司麦肯锡称数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。早在2014年8月18日,中央全面深化改革领导小组第四次会议就审议通过了《关于推动传统媒体和新兴媒体融合发展的指导意见》,强调要“推动媒体融合发展,强化互联网思维,将技术建设和内容建设摆在同等重要的位置,积极运用大数据、云计算等新技术,发展移动客户端、手机网站等新应用新业态,不断提高技术研发水平,以新技术引领媒体融合发展、驱动媒体转型升级。”[2] 大数据作为一个时代、一项技术、一个挑战和一种文化,正在走进并深刻影响着我们的生活[3]。2015年8月国务院印发了《促进大数据发展的行动纲要的通知》,从国家层面提出全面推进我国大数据发展和应用,加快建设数据强国。

作为我国科学技术成果记载、展示和传播重要平台的科技期刊也不可避免地要应对“大数据”技术革命与技术创新带来的传媒业整体发展环境和模式的变化。我国科技期刊出版业因为起步较晚,一直落后于发达国家出版业。这次大数据浪潮,既是挑战,也是机遇。有学者在2014年就提出“大数据时代的到来将造就全新意义上的中国学术期刊”[4]。那么实际情况如何呢?笔者拟通过梳理和分析 2013―2017年中国知网中以大数据和科技期刊为主题的学术论文,希望以此来窥探中国科技期刊在这一次革命性浪潮中已经开展了哪些研究,取得了哪些成就,并进一步深入研究指出下一步中国科技期刊学术研究应重点关注并践行的领域和方向。

手术室建立疼痛管理小组,由4名麻醉师和6名手术室护士组成。组长由麻醉师担任,小组成员对术前评估情况和术后回访信息定期进行整理归纳,收集并保存疼痛相关资料,为日后医疗科研提供真实数据,同时设立专人对相关资料进行保管。积极撰写科研论文,在工作中收集和总结经验,开展疼痛科研论文写作讲坛,积极开展科研和护理品管圈活动,以科研带动临床,更好地服务于患者。

监督执纪四种形态是应对管党治党宽、松、软问题的崭新理论与科学方法,为党的监督执纪工作指明了方向、提供了遵循。从贯彻落实这个层面看,需要在思想认识、责任担当、方法措施上跟上中央要求,切实把握运用好监督执纪“四种形态”。

1 2013―2017年中国科技期刊界大数据研究现状

截至2018年3月12日,在中国知网以“大数据和科技期刊”为检索词,共检索到138篇文献,去除部分非论文性文献,与主题相关的有效文献为97篇。根据知网计量可视化分析,可以看到:中国科技期刊学界最先关注大数据是在2013年,一共有4篇论文发表。从2013—2017年,随着全球大数据研究热的持续升温,我国科技期刊界在这方面的研究成果也呈逐年增长趋势。具体数据:2013年4篇,2014年23篇,2015年24篇,2016年23篇,2017年23篇。这些学术成果主要以期刊论文为主,其次是相关的国际国内学术会议论文集。具体资源类型分布如图1所示。

  

图1 2013―2017年科技期刊大数据研究成果资源类型分布图

在基金资助方面,科技期刊大数据研究得到的基金资助较少,97篇研究成果中只有2篇获得基金资助。相关基金资助研究情况如图2所示。

  

图2 2013―2017年科技期刊大数据研究基金资助分布图

《中国科技期刊发展蓝皮书(2017)》显示:我国的科技期刊总体上还停留在“小、散、弱”的小作坊时代,集团化建设缓慢,市场化程度低,难以获得规模经济效益。“总体而言,我国科技期刊大而不强、多而不优,刊物的学术质量还有较大的提升空间,办刊能力建设亟待加强”。对中国科技期刊的发展特点及趋势,蓝皮书给出了七个方面的研判,对大数据挑战而言,笔者认为“理性、科学和指标多元化是中国科技期刊评价未来趋势,加强办刊能力建设是中国科技期刊未来工作重中之重,集群化是中国科技期刊未来发展重要手段,依托融合出版、提供知识服务是中国科技期刊未来发展方向”[6]应该是科技期界在当前要研究的重点方向和领域。具体来说:

  

图3 2013―2017年科技期刊大数据研究成果来源分布图

科技期刊在国家创新体系中占据了不可替代的位置,其出版不仅仅是关系到科技期刊本身的生存与发展,更是事关国家的全球科技竞争力和文化软实力。在大数据时代,“学术创新模式、学术研究范式、知识形态、知识获取、知识交流及处理机制都发生了改变,学术期刊的生存和发展环境已经发生了天翻地覆的变化”[7]。在这样一场革命性的变革浪潮中,单靠数千家“小、散、弱”的科技期刊自身是无法实现华丽转身的,必须引起全社会的高度重视,从国家层面进行顶层设计,并提供相应的制度和政策保障。

  

图4 2013―2017年产出科技期刊大数据研究成果的机构分布图

  

图5 2013―2017年科技期刊界大数据研究成果作者分布

通过对上述研究成果主题的分析,可以得到如下信息:有48篇论文主要论述科技期刊在大数据时代面临的机遇和挑战以及数字化转型;23篇论文论及科技期刊编辑在大数据时代面临的挑战、转型和相应编辑素养的养成;论及数据收集、挖掘及安全的有 6篇;平台建设 4篇;选题策划2篇;期刊传播6篇;作者队伍建设1篇;经营策略1篇;影响力和品牌建设2篇,其他4篇。

科技期刊出版工作流程分为组稿、同行评议、编辑出版和传播,牵涉的人有作者、编委、编辑、同行评议专家以及读者,出版主体有作为主管单位的各级新闻出版主管部门、作为主办单位的各类行业学会或者高校以及各种类型的出版单位(在我国大多数的科技期刊出版单位仍然还是单个的编辑部)。大数据带给科技期刊出版业的革命性变革不仅仅是对出版的各个流程、各个主体或者参与的人有着单方面的简单影响,更重要的是带来全行业的颠覆性变革。应对这场革命性的变革,仅仅在某个环节或者某个方面做一些变动是远远不够的,需要从思维模式到工作流程以及上上下下、方方面面统筹规划推进,才能抓住机遇,不错失发展良机。下面我们就具体来看看当前中国科技期刊界大数据研究存在的问题。

2 中国科技期刊界大数据研究存在问题分析

从以上量化数据和分析可以看出:中国科技期刊界在一定程度上看到了大数据浪潮对我国科技期刊发展的影响,也认识到科技期刊发展面临的机遇和挑战,部分出版类主流媒体也跟进了这个时代浪潮,发表了一些优秀的研究成果。但是从这些分析图表也不难看出:我们当前的研究还存在很大的问题,主要表现在以下几个方面:

文本类档案多采用文本信息抽取的方法进行特征提取。文本信息抽取如图3,是从文本数据中抽取特定信息(如名词短语、地名、时间、人名等)的一种技术。档案数据需要抽取的特征具有比较强的特定性,主要需求是识别出档案中的人名、地名、机构名、时间等,适合采用词性标注的方式进行抽取。常用的模型有:条件随机场、隐马尔科夫模型、最大熵马尔科夫模型。这些都是文本信息抽取的具体实现方式,首先需要从训练数据中学习模型结构,其次根据模型对待抽取的档案文本进行识别即词性标注。

(1) 大数据时代科技期刊的发展必须引起全社会的高度重视,应从国家层面进行顶层设计,当前应加强相应的制度制定和政策保障研究。

第三,研究主题过多集中在总论大数据带给中国科技期刊界的机遇和挑战方面,未深入到具体的行业顶层设计和应用案例探索。张硕等在《大数据时代科技期刊数字化发展探析》一文中提出大数据的发展历程,“第一个阶段2011年,主要是技术研发、概念推广、解决方案推广和商业模式尝试;第二阶段 2012—2015,主要是生态环境完善、行业应用案例增多、用户认可程度高、基于大数据应用的业务创新加快;第三个阶段:2016年到现在,大数据解决方案成熟、大数据应用渗透社会各行业、数据驱动决策和信息社会智能化程度大幅提高。”[5]从这个历程来看,我国科技期刊界在这一次大数据浪潮中已经明显有些滞后了。事实上,我国大多数科技期刊编辑出版单位还在传统纸质的“投稿—编辑—出版—发行”的闭路系统中运行。所谓数字化也只是简单地将出版后的纸质内容上传给大型数据库,这些都与大数据的时代更加广泛、深入的数字化,全社会范围内的数据互联互通,在数据密集型科学环境下形成的用于超大规模数据的采集、存储、分析及知识再发现的信息处理范式相去甚远。

第四,在研究内容方面未对数据资源和数据安全给予足够的关注和深入研究。大数据时代数据已经成为国家基础性战略资源。如何积累挖掘数据,如何分析应用数据,如何保证我国出版数据的安全等问题本应是大数据研究论题的核心和重点,但是从已发表的成果来看,仅有 4篇论及数据资源,这远远不够。事实上,在科技期刊出版领域,我们已经面临着巨大的数据安全隐患。据《中国科技期刊发展蓝皮书(2017)》统计我国 SCI论文流入流出情况:“2007—2016年中国机构在SCI收录中国科技期刊发文数仅占中国SCI论文总数的9%;同期中国SCI期刊发表论文的总被引次数仅占中国全部论文总被引次数的4%,在一定程度上说明中国作者把大部分优秀论文发表在国外SCI收录的期刊上了。”[6]大量的优质科研成果发表在国外,数据资源也掌握在国外大型出版集团手里。如何改变这种现状,值得我们科技期刊界人深思,并及时采取有效措施。

3 大数据时代,中国科技期刊重点研究方向探析

研究成果来源分布如图3所示。从图3可以看到,主流编辑出版类媒体如《中国科技期刊研究》《编辑学报》以及《科技与出版》对科技期刊大数据研究有一定程度的重视,但是重视程度远远不够,所占比例仅为30.5%。

第二,研究机构和作者非常分散,不具有持续性和聚合性。同一作者对这个问题进行持续研究的较少,最多的也只发表了 3篇文章,大部分只是粗浅地研究一下,发表一篇论文,然后就不再关注;机构方面也非常分散,同一机构发表过4篇学术论文的只有2家。科技期刊主管部门和主办单位在这场革命性变革中还未从学术研究的角度介入,也未从制度建立、政策扶持以及国家科技期刊出版体系等方面来统筹规划和思考,并未切实地参与到这场变革中。研究主体主要停留在科技期刊界编辑人员的自说自话。

图4为2013—2017年产出科技期刊大数据研究成果的机构分布图。2013—2017年科技期刊界大数据研究成果作者分布如图5所示。从图4和图5可以看出,科技期刊大数据研究的机构和作者分布非常分散,鲜有机构和作者对此领域进行持续的关注和研究,大多数都是发表一两篇论文后就不再关注。

三是资金方面:各级政府可以设立专项基金加大对科技期刊大数据转型研究和试点的资助,推动研究和实践。

二是政策方面:建议在国家层面制定系统的科技期刊战略发展规划,可以考虑搭建一个以科技期刊为纽带的“国际科技研究和学术论文大数据发布平台”;或者以行业或者学科为单位成立国家级科技期刊论文大数据发布平台。尤其是要重点改革创新科研评价体系,学者们应加强政策研究和科研评价体系多元化的研究。

第一,研究成果总量较少,得到的基金资助也很少,这和中国科技期刊的总体体量不匹配。截至2016年底,中国科技期刊总数达5 020种,但在大数据方面的研究成果连续5年还不到100篇,其中只有2篇研究成果得到基金资助,说明中国科技期刊界大部分的从业人员还未对此问题引起足够的重视。较少的基金资助既说明相关主管主办单位对于科技期刊大数据转型并不关注,同时也不能保证此研究领域的持续健康进行。

一是体制层面:建议打破当前主管、主办和出版三级办刊体制,成立国家专门的科技期刊管理部门,打破条块和地域分割,集中所有优质办刊资源。大数据时代“学术成果的发表不再是学术期刊的专属,以往学术期刊的优势会被淡化,现行的以编辑部为单位各自为政的‘闭门办刊’模式会被摈弃,刊与刊的边界正趋于模糊,大数据将推动学术期刊整体转型”[7]。当前我国科技期刊的主管、主办和出版单位较为分散,共有1 375个主管单位,4 381个出版单位。平均每个出版单位出版1.15本期刊,仅出版1种期刊的出版单位有4 205家,占期刊总数的83.75%。反观国际大型出版集团,爱思维尔旗下的ScienceDirect数据库就集聚了2 000多家期刊。当前应该加强如何优化我国科技期刊主管主办体制的研究,提出切实有效可行的体制改革策略,全面推进科技期刊资源的集群化发展。

(5)完善项目库的建设。项目库是预算管理的基础和支撑,对项目库实行常年开放和滚动管理。一是强化项目库约束。未纳入项目库管理的项目,原则上不予安排预算资金。二是做好日常项目编报和管理。对于经论证通过的项目,应及时纳入项目库,成熟一个,编报一个,并依据“轻重缓急”排序。一旦学校有专项资金到达,财务部门就可以依据到达的资金额度和项目排序安排预算,改变以往临时申报、评审、立项的做法,大大提高资金的下达效率。

总之,在积极应对大数据对期刊的变革方面,作为大数据发展的主导力量,政府方面应给予足够的支持和重视,包括提供项目资助、组织相关力量解决大数据在期刊应用方面的关键技术,从而为科技期刊数据化发展提供强有力的基金和技术支持。

——这是电影《俄罗斯方舟》中我印象最为深刻的一句台词,倘若我记忆没太大出入的话,也是电影最后一句台词。索科洛夫这部电影,一般是很难从电影爱好者之外的人口中听到的。它其实名气也并不小,因为这片子有一个异常显眼的特点:它非常极端地使用了“一镜到底”的拍摄——电影从头到尾只有一个超级长镜头。而影片也没有什么情节,无非是两个迷失的幽灵在行走穿行里经过了俄罗斯大地上的百代盛衰。文艺导演亚历山大·索科洛夫并没有说故事,电影是没有什么情节可言的。但是在最后喧嚣退场之后,再怎么不理解电影语言的人,都能读出一个很明确的主题:

(2) 树立数据意识,尤其要重视数据挖掘技术和数据安全研究。

3.2 睡眠模式评估 睡眠日记是使用最为广泛的儿童睡眠模式基础评估手段。标准化睡眠日记记录的信息包括儿童就寝时间,入睡潜伏期,夜醒次数和时间,中睡眠时间,白天小睡时间以及持续时间长度等。两周的基础睡眠日记记录对于评估儿童基础睡眠模式是必要而有效的。基于睡眠日记信息,医务工作者能够清晰的勾画出儿童的睡眠模式。

大数据时代,最重要的资源就是数据。数据已成为国家基础性战略资源[8]。建立用“用数据说话、用数据决策、用数据管理、用数据创新”的办刊机制和模式显得极其重要和迫切。“在数据驱动的智能时代,需要一股自上而下的力量。政府、行业组织及大型出版集团需要建立数据平台,进行数据标准化处理”[9]。科技期刊拥有的数据不仅仅事关科技期刊本身的发展,也关系着国家科研安全。如何把海量的科技期刊数据转化为现实的生产力,如何尽快实现科技期刊转型升级,提升我国科技期刊的国际竞争力,阻止优秀科研成果外流,刻不容缓,事关国家安全。学界应花大力气研究数据挖掘技术和数据安全。

(3) 加强大数据时代编辑人才培养体制和机制研究。

中国科技期刊要顺利实现在大数据时代转型与发展,关键是要具有大数据出版意识,掌握大数据挖掘技术,并能熟练分析运用数据结果的既懂专业又懂技术的专业编辑队伍。“编辑必须充分认识到自己作为旁观者、参与者和引领者的三重角色担当,学习并运用大数据技术搭建读者、作者和审稿人三者之间的良性互动框架,以读者需求为导向,退出个性化服务,积极探索以学术期刊为纽带的大数据全产业链和新业态发展路径”[10]。懂专业、懂数据,会分析的复合型人才培养刻不容缓。如何培养,从哪些方面来培养,培养的体制、机制和模式,这些都值得深入研究。

因此,语音、词汇、语法这三个因素都会制约母语在第二语言习得中的迁移。母语中的语音、词汇、语法,如果与第二语言相同部分越多,越有利于母语的迁移,可能会产生正迁移。相反,如果母语中的语音、词汇、语法与第二语言相同部分越少,就越不利于母语迁移,可能会产生负迁移。

参 考 文 献

[1] 习近平.实施国家大数据战,略加快建设数字中国[EB/OL].(2018-03-15)[2017-12-09].http://www.xinhuanet.com/2017-12/09/c_1122084706.htm.

[2] 关于推动传统媒体和新兴媒体融合发展的指导意见[EB/OL].[2018-03-10].http://www.gapp.gov.cn/news/1656/223719.shtml.

[3] 徐宗本.用好大数据须有大智慧[N].人民日报,2016-03-15(7).

[4] 周小华.“大数据”时代中国学术期刊的转型与发展机遇[J].科技与出版,2014(4):102-104.

[5] 张硕,韩纪富,史海英.大数据时代科技期刊数字化发展探析[J].科技视界,2015(33):109-110.

[6] 中国科技期刊发展蓝皮书(2017)[M].北京:中国科学出版社,2018:214-216.

[7] 周小华.大数据时代中国学术期刊的创新发展[N].中国社会科学报,2014-12-23.

[8] 国务院关于印发促进大数据发展行动纲要的通知[EB/OL].(2018-03-10)[2015-08-31].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

[9] 肖东发,卞卓舟.2013年出版产业十大关键词解读[J].编辑之友,2014(1):9-13.

[10] 邵玉娴.大数据时代学术期刊的变革及编辑工作的转型[J].编辑学报,2014(增刊1):152-155.

 
郭毅,迟蕾,何先刚
《科技期刊发展与导向》2018年第00期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息