更全的杂志信息网

用户动态相关性判断探析

更新时间:2009-03-28

0 引言

动态相关性研究一直是面向用户相关性研究中的一个课题。动态相关性研究可以追溯到20世纪60年代,Goffman[1]以及Rees等[2]最早提出关于相关性判断动态性。其后,有关该项研究逐渐发展了起来,到20世纪80年代中后期,该方向的研究引起了学者们的重视。一般来说,动态相关性指的是对于同一个用户的感知如何随时间改变。对相关性判断的动态性研究可为信息检索系统的建设和服务提供相应措施。

1 相关研究

用户的相关性判断标准并不是固定的,其会随着多种因素改变。关于动态相关性研究早在1964年,Goffman[1]就通过数学计量理论,证明了相关性不仅仅是信息请求和每个单个文档之间的关系,相关性作为一种测量方式,文献之间的相关性也应该纳入考虑的范围。Rees等[2]认为对于单一用户而言,其相关性判断与时间有关。Cuadra等[3]通过实证研究发现,Kochen[4]在其专著中指出文献呈现次序会影响用户的行为。在20世纪80年代以前,关于相关性的动态本质的研究非常少,但也可以看出相关性判断与时间和文献呈现的次序有关。

1.1 用户动态相关性判断

从20世纪80年代开始到90年代,对于相关性判断动态性的研究逐渐增多,呈现明显地上升趋势[5],这一时期的研究主要可分为5个主要方面。

1.1.1 文档次序效应

通过美国社会学家科塞的社会冲突理论,我们可以得知社会群体之间的冲突是关于价值观、信仰以及对于稀缺的地位、权利和资源的分配上的争斗。冲突具有可以提高团结、权威等的正功能和一定的负功能。

动态相关性与心理、认知相关性密切关联。心理相关性是动态的,其基本假设为“检索者认知状态是随着每个相关引文的发现而变化与演进的”。

Swanson[11]指出文档的相关性依赖于用户所看到的其他的文档。Parker等[12]基于实证研究,验证用户是否因文献呈现次序不同而产生偏见进而影响相关性判断的结果,研究结果显示,当检索获得文献数量大于或等于15篇时会产生次序效应。Spink等[13]对44个初始检索用户的相关判断进行了审查发现,被判断为“部分相关”的项目数量与用户的改变正相关,研究结果表明在信息检索过程中,部分相关项目与用户信息问题或信息问题的变化之间存在关系。

对文献次序效应研究较多的是Eisenberg和Barry[7-8]。他们以美国雪城大学80名学生为对象,评估了多种量表在相关性判断研究中的应用,结果虽对于文献呈现次序对相关性判断的影响并未作过多说明,但其随机排序所得各文献的相关性评分值成为其后续实验研究的基础。同年,验证了刺激次序对相关性判断的影响,结果显示文献呈现次序确实会影响相关性判断的结果,即产生次序效应,并认为产生赌注现象的原因可能在于判断者将其对第一篇文献的评分作为判断后面文献的参考点,受此参考点的影响,判断者通常会避免基于第一篇文献极高或极低的评价,因而使排序的文章容易产生被全面低估或全面高估的情形。二人对赌注现象再次进行研究[9],发现文献的3种排序方式所得的相关性评分结果,两两之间皆呈显著差异,二人通过以上研究提出了呈现顺序效果的实证证据[10]

可得出4种典型负荷分布状况时,LGJ-240架空裸导线的最大允许供电半径随中压线路负荷的变化趋势,具体情况如图5所示。

1.1.2 动态相关性本质

1.1.3 基于认知的相关性判断

Meadow[14]强调了用户与中介和信息检索系统交互时,请求的改变妨碍了对相关性的测量。Katzer等[15]批判了用户在信息检索系统交互期间其信息需求的不改变的假设。在此基础上他们草拟了用于评估信息检索系统的方法。Ottaviani[16]基于不规则理论提出了一种基于分形几何的新模型,用于相关文档的聚类。它反映了交互式在线搜索者使用的相对简单的迭代搜索过程,用户与信息检索系统交互过程中获得的信息迫使他改变他的问题,而后,新的信息被接受,问题将会又一次改变。这个模型表明使用动态搜索策略形成的集群表现出不同的拓扑,不可分解并且从混沌过程中产生。

19世纪60年代始,封建阶级中的有识之士提出“师 夷长 技 以 制 夷”[1]256、“中 学 为体,西 学为用”[2]234的主张,开工厂,开矿山,修铁路,兴办军事工业……掀起了轰轰烈烈的洋务运动。从文化的结构看,这些都属于物质层面的改革,没有触及社会制度,所以,中日甲午一场大海战,宣告了洋务运动的破产。

Brookes[6]发现虽然IRS的文献检索是相似的,但对于文档的相关性判断不可避免地会受到之前所看到的文献所影响。因此他假设后面文档的效用可以被先前文档减少而不是增强。

1.1.4 测量相关性的时间点

Regazzi[17]根据不同类型、水平、专业和评估背景,32名法官评价16个酒精研究文件,包括4个不同的检索主题、4个文档引用和主题的摘要。发现了主题和文件顺序对关键文件和信息特征的重要性有重大影响。Schamber[18]将相关性的观点归结为主题的、面向用户的、多维的、认知的以及动态的等多重维度,提出相关性决定于内部认知、外部情境因素的动态判断过程。Froehlich[19]也提出用户信息查寻行为的动态性和流动性的观点。Harter[20]基于Sperber和Wilson相关性理论的动态性相关的概念,提出真实相关性判断仅在读取整个文档之后才发生。他认为相关性的必要条件是“必须能改变人的知识状态”,这一点与布鲁克斯方程的观点不谋而合。随着时间的改变,用户的认知结构、知识状态在改变,从而使其相关性判断程度也在变化[21]。并发现,新的检索问题获得的回报是递减的,其部分原因是由于新颖性的减少。Wang[22]基于实证研究的发现,用户在评价每一篇文档的相关性时所使用的相关性判断标准,以及判断标准所基于的“文档信息元素”都不同。Tong等[23]基于田野调查,观察用户在线搜索和文档检索期间的相关性评估过程。并利用心理模型的概念分析被试者信息需求感知的构成,并发现认知变化存在于被试者对搜索记录的评估到文档信息审查的每个阶段,相关性判断是意义构建、学习和感觉构建的过程。

从绝对数值来看,长三角各地级市之间总体基本公共服务均等化水平较高。长三角总体基本公共服务的基尼系数在0.2上下波动,在2011年后接近于0.1。2011年后,各项基本公共服务的基尼系数逐渐下降,可见“十一五”期间长三角的基本公共服务均等化进程取得了成效。结合基本公共服务发展水平看,基本公共服务水平发展与均等化两者间是并行不悖的,在基本公共服务投入水平上升的同时,城市间均等化水平也在提高(见图1、图8)。

医院的资产是开展医疗服务的物质基础,主要有货币资金、库存物资、固定资产和无形资产等。资产业务是医院内部人员腐败和舞弊行为发生的高风险领域,医院一般都建立了基本的防御体系,但仍需要借助信息化加强内部控制,进行精细化的管理。

Bruce[24]描述了一个框架来观察用户对于影响相关性判断的一些参数的重要性的时间演变。他提出了3个关键时间点:用户有问题的时间,从开始请求到最后查询的时间间隔以及用户解决他的问题的时间。Spink等[25]通过实证研究发现,用户的相关性标准随着会话时间而变化。Smithson[26]以21名准备论文的学生为对象,测量了3种相关性:在线检索结束时、研究项目结束时以及通过检查被试最终学位论文中的引文,发现每个主题的相关性判断在不同的时间点上有根本的改变。

1.1.5 数学模型的提出

Bookstein[27]基于统计决策理论明确地提出了一个数学模型,将文献之间的相互影响纳入到模型之中,而不是将各文献独立起来单独思考。Tiamiyu等[28]提出了一个数学模型,并将文献之间依赖性考虑进来。他们定义了一个“总相关函数”,其将相关性分配给了一组文档,而不仅仅是总结该组的每个单个文档的相关性,而是考虑“可替换性”与“互补性”在文档中的关系。

2 结语

总体而言,自20世纪80年代后期以来,相关性研究的重点可以看出从系统的角度转向以用户为中心的角度。以用户为中心的相关性研究集中在如何从用户的角度和用户相关性判断的使用标准。这些研究结果表明,相关性是一个动态的过程,用户根据许多标准判断相关性。尽管从系统的角度转向以用户为中心的研究,关于相关性和相关性判断的基本思考很少改变,即它是一个主观的个人过程。Mizzaro[29]通过7个不同方面讨论了相关性的整个历史,其中对相关性的动态性进行了详细的综述。发现已经注意到主观性问题,但却没有提出解决方案,基于此,文档是否与检索主题或搜索者的信息需求相关,完全由搜索职责的判断决定,这种判断被认为是搜索者的心理或认知过程。

参考文献

[1]GOFFMAN W.On relevance as a measure[J].Information Storage&Retrieval,1964(3):201-203.

[2]REES A M,SARACEVIC T.The measurability of relevance[J].Comparative Systems Laboratory Technical Report,1966(7):22.

[3]CUADRA C A,KATTER R V.Opening the black box of“relevance”[J].Journal of Documentation,1967(4):291-303.

[4]KOCHEN M.Principles of information retrieval[M].Melville:Principles of information retrieval,1974.

[5]MIZZARO S.Relevance:the whole history[J].Journal of the Association for Information Science and Technology,1997(9):810-832.

[6]BROOKES B C.Measurement in information science:objective and subjective metrical space[J].Journal of the Association for Information Science and Technology,1980(4):248-255.

[7]EISENBERG M.Magnititude estimation and the measurement of relevance[D].Syracuse:Syracuse University Syracus,2015.

[8]EISENBERG M,BARRY C.Order effects:a preliminary study of the possible influence of presentation order on user judgement of document relevance[J].Proceedings of the American Society for Information Science,2015(8):80-86.

[9]EiSENBERG M,BARRY C.Order effects:a study of the possible influences of presentation order on user judgment of document relevance[J].Journal of the American Society for Information Science,2016(39):293-300.

[10]EISENBERG M.Measuring relevance iudgments[J].Information Processing&Management,2014(4):373-389.

[11]SWANSON D R.Historical note:information retrieval and the future of an illusion[J].Journal of the Association for Information Science and Technology,1988(2):92-98.

[12]PARKER L M P,JOHNSON R E.Does order of presentation affect users’judgment of documents[J].Journal of the Association for Information Science and Technology,1990(7):493-494.

[13]SPINK A,GREISDORF H.Users’partial relevance judgements during online searching[J].Online Information Review,2013(5):271-280.

[14]MEADOW C T.Relevance[J].Journal of the American Society for Information Science,2013(36):354-355.[15]KATZER J,SNYDER H.Toward a more realistic assessment of information retrieval performance[J].Proceedings of the American Society for Information Science,2015(8):80-85.

[16]OTTAVIANI J S.The fractal nature of relevance:a hypothesis[J].Journal of the Association for Information Science and Technology,1994(4):263-272.

[17]REGAZZI J J.Performance measures for information retrieval systems:an experimental approach[J].Journal of the Association for Information Science and Technology,1988(4):235-251.

[18]SCHAMBER L.A reexamination of relevance:toward a dynamic,situation definition[J].Information Processing&Management,1990(6):755-775.

[19]FROEHLICH T J.Relevance reconsidered:Towards an agenda for the 21st century:introduction to special topic issue on relevance research[J].Journal of the Association for Information Science and Technology,1994(3):124-134.

[20]HARTER S P.Psychological relevance and information science[J].Journal of the Association for Information Science and Technology,1992(9):602-615.

[21]李亚琴,孙建军,杨月全,等.基于信息检索用户的相关性行为研究进展[J].情报科学,2014(5):157-160.

[22]WANG P.A cognitive model of document selection of real users of information retrieval system(doctoral dissertation)[D].Maryland:University of Maryland,1994.

[23]TANG R,SOLOMON P.Toward an understanding of the dynamics of relevance judgment:an analysis of one person’s search behavior[J].Information Processing&Management,1998(3):237-256.

[24]BRUCE H W.A cognitive view of the situational dynamism of user-centered relevance estimation[J].Journal of the Association for Information Science and Technology,1994(3):142-148.

[25]SPINK A,GREISDORF H,BATEMAN J.From highly relevant to not relevant:examining different regions of relevance[J].Information Processing&Management,1998(5):599-621.

[26]SMITHSONS.Informationretrievalevaluationinpractice:a case study approach[J].Information Processing&Management an International Journal,1994(2):205-221.

[27]BOOKSTEIN A.Information retrieval:a sequential learning process[J].Journal of the Association for Information Science and Technology,1983(5):331-342.

[28]TIAMIYU M A,AJIFERUKE I Y.A total relevance and document interaction effects model for the evaluation of information retrieval processes[J].Information Processing&Management,1988(4):391-404.

[29]MIZZARO S.Relevance:the whole history[J].Journal of the Association for Information Science and Technology,1997(9):810-832.

 
王莹莹
《江苏科技信息》 2018年第11期
《江苏科技信息》2018年第11期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息