更全的杂志信息网

网络叙词表研究与应用综述

更新时间:2009-03-28

0 引言

随着网络时代的到来,人们的生活方式逐渐呈现出变化的态势。与此同时,人们获取信息的方式也在发生改变。但互联网的迅速发展与大数据时代的降临,加速了许多新兴技术的发展,同时也催生了海量信息,越来越多的用户在信息查询时发生了“迷航”现象。无论作为信息管理者还是作为一个普通的信息使用者,我们都迫切需要有功能良好的网络信息组织工具,对目前杂乱的网络信息进行有效的组织。所以,如何对这些杂乱无序的网络信息进行有效的组织和整合,使其变为一种能够满足用户需求的资源,成了我们面临的最大难题。

(二)切实维护社会稳定,进一步深化平安建设。平安不是单纯的社会治安,而是立足于经济、政治、文化、社会、生态五位一体的“平安”。要认真贯彻落实平安中国建设工作会议精神,牢固树立“大平安”理念,不断深化平安建设。围绕发展抓平安,把平安建设放到整个经济社会发展大局来谋划,坚持一手抓平安社会建设,一手抓经济转型发展。围绕民生抓平安,把人民群众满意作为衡量和检验平安建设成效的根本标准,切实维护人民群众利益,满足人民群众日益增长的需求。围绕创新抓平安,创新思路、手段和机制体制,保持常创常新,焕发创建活力,把平安建设持续向前推进,不断提升工作水平。

1 叙词表及网络叙词表的概念及关系

1.1 叙词表及网络叙词表的概念

马张华[1]在《信息组织》一书中对叙词表的概念进行了界定:该表是一种将标引人员或用户使用的自然语言转换成规范化的系统语言的术语控制工具;按照其结构,叙词表是一种概括特定知识领域并由词义相关、语义相关的术语组成的可以不断补充的规范化词典。此外,叙词表在我国的国家标准中的定义为:将文献、标引人员或用户的自然语言转换成规范化语言的一种术语控制工具;它是概括各门或某一学科领域并由语义相关、簇性相关的术语组成的可以不断补充的规范化的词表。

网络叙词表目前在学术界尚没有形成统一的定义,司莉等[2]对其的界定是指遵循传统叙词表的结构与原理,使用超链接显示概念及其间关系,借助Web浏览器进行访问,用于网络信息资源标引、浏览、检索与导航的一种概念语义工具。陈红艳等[3]也持相同观点,认为网络叙词表是以传统叙词表构建原理和原则为准则,通过定义词汇的范围和含义,运用等同、等级、相关等关系揭示词汇之间的关系,并用超链接的方式予以显示;借助Web浏览器介质进行访问。国外学者Névéol[4]认为,网络叙词表功能强大,能够将领域专家知识和语义信息联系在一起。

此外,还有一些学者也对叙词表、网络叙词表的定义提出了自己的见解,但通过比较可以发现,这些定义大同小异,在此就不再过多地列举与赘述。

1.2 叙词表及网络叙词表的关系

乍一看这张照片,你或许以为这是法拉利、兰博基尼和阿斯顿·马丁车主随意将爱车停靠在港口边,共同到街角的咖啡店享受一段午后时光的场景。

针对网络叙词表构建与设计方面的研究,目前国外主要从词表设计方法、框架、实现方法、叙词表构建与维护的软件及管理系统等方面进行研究。如:Mcculloch[8]从叙词表构建中的词汇选择、标准、构建软件等多个方面,对网络环境下的叙词表构建提出具体指导意见。Nielsen[9]通过对选择词汇的各种方法进行分析与比较,说明了面向叙词表设计的任务要求。Glenda[10]分析了MultiTes,Tree Tree,WebChoir 3种常用的专业编制叙词表软件,为用户在编制叙词表方面如何选择软件提供指导。此外Shiri等[11]对叙词表的特征及功能进行了研究,在叙词表如何增强网络用户检索的方法、策略上提出了具体措施及意见。我国针对该领域的研究也一直在稳步向前,中国科学技术信息研究所2009年起开始进行相关研究,已建立了《汉语主题词表》服务系统,并通过可视化等新兴技术,为广大用户提供服务。

2 国内外研究现状

2.1 国外网络叙词表现状调查

司莉等[2]从 Taxonomy Warehouse网站上按类别选取了108个外文网络叙词表,她在研究的过程中逐一打开这些网站,从其应用形式、学科主题范围、编制语种、使用方式与应用范畴等5个方面进行统计分析。研究发现,网络叙词表目前所呈现的应用形式分为独立与嵌入式两种;并且在其主题上呈现出多元化、综合化特征;此外她还发现,词表界面的友好性、易用性以及交互性,会对用户使用词表的心理与行为产生影响。陈红艳等[3]也用了相似的方法从国外网站上选取了40个网络叙词表,并从词表的主题范围、语种、网站界面、应用4个方面,对其构建现状特征进行分析,发现目前这些词表的学科主题内容、编制语种及使用对象呈逐步扩大的趋势,词表功能及应用空间得到了扩展。

2.2 网络叙词表的构建及设计策略

国外对网络叙词表构建的实践研究起步较早。Taxonomy Warehouse网站[7]对其收录的网络环境中所使用的各种本体、叙词表、分类表、术语表进行了统计,共674部。这些网络叙词表被主要应用于网页、搜索引擎、网络数据库等网络信息资源的组织与优化。

此外,司莉等[12]还就网络叙词表的界面设计策略问题提出了自己的见解。她通过对国外网络叙词表进行全面调查的基础上,对叙词表的网站内容、叙词表的浏览界面与方式、叙词表的检索界面与方式、检索结果显示这几个方面进行了归纳总结。她认为,目前网络叙词表网站的内容设计上仍存在不少缺陷,如:词表界面内容较单一;词表内容设计不够规范等。并从满足用户多样化需求的角度,提出了完善策略。

闻一多的唐诗研究始于李杜是毋庸置疑的。熊佛西曾当面问过他:“你为什么从杜甫李白入手呢?——是否你对于他们特别喜爱?”闻一多“毫不犹豫地回答说:‘也许是的,不过主要的原因还不在此’”。[3]74美国留学时期,是闻一多诗歌创作的高峰期。当时他与梁实秋通信,屡次谈到《李白之死》的创作。

对于叙词表及网络叙词表之间的关系问题,目前没有专门的文章对其进行研究。通常是通过对传统叙词表及网络叙词表的优劣对比,从网络叙词表及传统叙词表在网络环境中的运用这一角度进行说明的。陈红艳[5]认为:网络叙词表作为一种新型语义工具,是叙词表在网络环境下的新形式和新发展。她的文章从构建目的、构建方式、使用群体、载体形式、格式类型几个角度分析了二者之间的差异。此外,贾君枝[6]也分析了传统叙词表往往具有仅揭示词汇之间的各种联系、仅显示静态语义关系、更多地体现为线性关系等缺陷,并以此为基础,以期在网络叙词表中解决这些问题。

结果显示,随着三棱、莪术提取物质量浓度的增加,其对SW620细胞的抑制率也相应升高。不同质量浓度三棱、莪术提取物作用后的细胞增殖抑制曲线见图1。根据该曲线求算得三棱提取物IC30为3.24 μg/mL,IC50为4.69 μg/mL;莪术提取物IC30为11.27 μg/mL,IC50为16.81 μg/mL。

2.3 本体模式下的网络叙词表

在信息科学领域比较有影响力的本体定义包括Bot1997年提出的:本体是被共享的概念模型的一个形式化的规范说明。李景等[13]认为,本体是一个关于一些主题的清晰规范的说明。它是一个规范的、已经得到公认的描述,它包含词表(或称名称表、术语表),词表中的术语全是与某一学科领域相关的,词表中的逻辑声明全部是用来描述那些术语的含义和术语间关系的。

对于本体模式下网络叙词表的发展问题,唐爱民等[14]探讨了本体模式下构建网络叙词表的优越性。他认为,叙词表及本体有部分共性,如:两者都包含词(概念、类)间关系;两者都具有等级结构,并通过等级关系及词(概念、类)间关系将词(概念、类)组织起来。在本体模式下构建网络叙词表将为创建者们节省大量的时间及精力。邓盼盼等[15]则是对网络叙词表在本体模式下的发展问题提出了自己的看法。她认为构建网络叙词表的目的在于服务信息标引和检索,这一点同很多知识组织体系一样。孙倩等[16]则是从网络叙词表与本体的区别和联系这一角度揭示出叙词表与本体都试图通过词汇概念来描述某一领域的复杂知识关系,从而简化不同用户知识共享的方法的特征[17]。但与此同时,叙词表与本体之间也存在着些许差异:例如:二者在逻辑表达形式、组织结构、内容要素以及语义关系上存在区别;知识点在叙词表中的分布是线性的,而本体中的分布却是网状的;我们也可以认为,叙词表是一个词汇库,而本体则是一个知识库。由于本体自备知识底层、有完备的知识组织体系,可实现智能查询等功能,而基于叙词表的检索系统是不具备这些功能的[18]

2.4 网络叙词表的未来发展

在对现有网络叙词表进行统计分析的基础上,还有学者对其未来的发展趋势进行了总结。司莉等[2]认为更好地实现人机交互,是网络叙词表的发展方向。在具体的研究中要利用可视化、本体等技术,使其更加智能,能够满足语义网环境下知识组织与管理的功能需求;其次,网络叙词表须重视人性化设计以及“拟人化”服务,才能更好地发挥其功能与效果。并将其未来发展方向最终总结为包括更新方式更加智能化、可视化、本体转化在内的5点。曹树金等[19]是从宏观、微观两个角度提出对网络叙词表的优化。他认为在宏观层面,应该建立多语种索引及网状结构,使用户在查看一个叙词时可以关注到其他主题的信息;在微观层面,应采用分面分析、建立参照系统的方式对其进行优化。

3 结语

本文通过文献调研的方法对目前国内外网络叙词表的研究与应用进行了梳理,发现近年来,我国围绕叙词表及网络叙词表的研究展开了许多国家社会科学基金项目,并取得了显著成效,从根本上有效推动了我国网络叙词表的研究。但概览全局,总体而言目前国内对于网络叙词表的研究还大多停留在理论的层面。今后应该多从技术实现的角度对网络叙词表进行研究,促进我国的网络叙词表蓬勃发展。

参考文献

[1]马张华.信息组织[M].北京:清华大学出版社,2008.

[2]司莉,柴源,周李梅,等.国外网络叙词表的现状调查及发展趋势[J].图书馆杂志,2011(7):22-26.

[3]陈红艳,司莉.网络叙词表构建的现状调查与分析[J].图书馆理论与实践,2008(5):33-36.

[4]NÉVÉOL A,SOUALMIA L F,DOUYÈRE M,et al.Using CISMeF MeSH“Encapsulated”terminology and a categorization algorithm for health resources[J].International Journal of Medical Informatics,2004(1):57-64.

[5]陈红艳.面向用户的网络叙词表构建关键问题研究[J].河南图书馆学刊,2016(7):131-133.

[6]贾君枝.FrameNet叙词表与传统叙词表语义关系比较研究[J].情报理论与实践,2006(5):605-607.

[7]TaxonomyWarehous[EB/OL].(2016-01-05)[2018-03-15].http://www.taxonomywarehouse.com/default.Aspx.

[8]MCCULLOCH E.Thesauri:practical guidance for construction[J].Library Review,2005(7):403-409.

[9]NIELSEN M L.A framework for work task based thesaurus design[J].Journal of Documentation,2001(6):774-797.

[10]GLENDA B.Thesaurus construction software part 1 and 2[EB/OL].(2016-01-06)[2018-03-15].http://www.willpowerinfo.co.uk/thesbibl.htm.

[11]SHIRI A,REVIE C.Usability and user perceptions of a thesaurus-enhanced search interface[J].Journal of Documentation,2005(5):640-656.

[12]司莉,陈红艳.网络叙词表用户界面设计策略[J].现代图书情报技术,2008(5):14-20.

[13]李景,钱平.叙词表与本体的区别与联系[J].中国图书馆学报,2004(1):38-41.

[14]唐爱民,真溱,樊静.基于叙词表的领域本体构建研究[J].现代图书情报技术,2005(4):1-5.

[15]邓盼盼,常春.本体模式下网络叙词表的发展[J].情报理论与实践,2013(4):99-101.

[16]孙倩,万建成.基于叙词表的领域本体构建方法研究[J].计算机工程与设计,2007(20):5054-5056.

[17]张继东,余以胜.利用叙词表构建本体的方法研究[J].图书情报知识,2006(4):82-85.

[18]真溱.电子叙词表——结构性置标语言应用实例[J].图书馆杂志,2001(8):9-13.

[19]曹树金,郭菁.网络叙词表的组织结构及优化模式研究[J].图书情报工作,2005(3):31-35.

 
陈翔
《江苏科技信息》 2018年第11期
《江苏科技信息》2018年第11期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息