大数据技术参考文献

发布时间：2024-06-15 05:27:18

大数据技术参考文献

写论文的时候，通常要求大家以后写十篇左右的参考文献。参考文献的要求应该和你写的题目有关。你写的是会计论文，后面的参考文献是体育论文，是完全不行的。下面和小编一起来了解论文怎么查参考文献？论文参考文献通常需要10~15个左右，有些学校需要两个英文参考文献。参考文献通常有自己独特的格式，参考文献主要分为期刊和论文。许多学生不知道如何查看这些参考文献，其实并不难。最简单的方法就是直接从查重报告上抄下来。小编推荐的查重系统是Paperfree，将论文上传到该系统进行查重，通常等待15-30分钟左右，会有详细的查重报告。本查重报告将列出本文引用的一些参考文献，因此您只需将本查重报告上的一些参考文献原封不动地复制到您的论文中。这种查找参考文献的方法是最简单方便的，可以原封不动的复制，也可以保证参考文献的格式不会出错。另一种方法是在早期写论文时阅读大量的参考文献，许多学生会记录这些参考文献的名称。您还可以阅读以前做的阅读笔记，并将这些参考文献摘录到论文中。

首先我由各种编程语言的背景——matlab,R,java,C/C++,python,网络编程等我又一定的数学基础——高数，线代，概率论，统计学等我又一定的算法基础——经典算法，神经网络，部分预测算法，群智能算法等但这些目前来讲都不那么重要，但慢慢要用到Step 1：大数据理论，方法和技术大数据理论——啥都不说，人家问你什么是大数据时，你能够讲到别人知道什么是大数据大数据方法——然后别人问你，那怎么实现呢？嗯，继续讲：说的是方法（就好像归并排序算法：分，并）。到目前外行人理解无障碍大数据技术——多嘴的人继续问：用的技术。这阶段只是基础，不涉及任何技术细节，慢慢看慢慢总结，积累对“大数据”这个词的理解。Step 2：大数据思维Bang~这是继Step 1量变发展而来的质变：学了那么久“大数据”，把你扔到制造业，你怎么办？我想，这就是“学泛”的作用吧，并不是学到什么具体东西，而是学到了对待事物的思维。----------------------------------------------------------------------以下阶段我还没开始=_=，不好误导大家Step 3：大数据技术基础Step 4：大数据技术进阶Step 5：打实战Step 6：大融合

[期刊论文]数据科学与大数据技术专业的教材建设探索期刊：《新闻文化建设》 | 2021 年第 002 期摘要：随着大数据时代的到来,信息技术蓬勃发展,国家大力推进大数据产业的发展,鼓励高校设立数据科学和数据工程相关专业。在趋势的推动下,许多高校成立了数据科学与大数据技术专业。本文通过研究数据科学与大数据技术专业的发展现状,探索新专业下人才培养的课程设置及教材建设等问题,同时介绍高等教育出版社在数据科学与大数据技术专业教材建设方面的研发成果。关键词：数据科学与大数据技术专业；课程设置；教材建设链接：-journal-cn_detail_thesis/html---------------------------------------------------------------------------------------------------[期刊论文]数据科学与大数据技术专业课程体系探索期刊：《科教文汇》 | 2021 年第 002 期摘要：该文阐述了数据科学与大数据专业的设置必要性、专业的培养目标和知识能力结构,最后探索了数据科学与大数据专业的技术性课程体系设置方法希望该文内容对数据科学与大数据技术专业的培养方案制订和课程体系构造具有一定的指导意义和参考价值关键词：数据科学；大数据技术；课程体系链接：-journal-cn_science-education-article-collects_thesis/html---------------------------------------------------------------------------------------------------[期刊论文]数据科学与大数据技术专业实验实践教学探析期刊：《长春大学学报（自然科学版）》 | 2021 年第 001 期摘要：近些年各种信息数据呈爆炸式增长,在这种背景下,国家在2015年印发了关于大数据技术人才培养的相关文件,每年多个高校的大数据相关专业获批数据量的增长对数据处理的要求越来越高,各行业涉及信息数据的范围越来越广,对大数据专业人才的需求越来越多为了应对社会需求,如何科学地规划数据科学与大数据专业的本科教育,尤其在当前注重实践操作的背景下,如何制定适合的实验实践教学方案,更好满足社会需求关键词：数据科学；大数据；实践教学链接：-journal-cn_journal-changchun-university_thesis/html

大数据论文参考文献

"大数据"是一个体量特别大，数据类别特别大的数据集，并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?大，指代大型数据集，一般在10TB?规模左右，但在实际应用中，很多企业用户把多个数据集放在一起，已经形成了PB级的数据量；其次是指数据类别(variety)大，数据来自多种数据源，数据种类和格式日渐丰富，已冲破了以前所限定的结构化数据范畴，囊括了半结构化和非结构化数据。接着是数据处理速度（Velocity）快，在数据量非常庞大的情况下，也能够做到数据的实时处理。最后一个特点是指数据真实性（Veracity）高，随着社交数据、企业内容、交易与应用数据等新数据源的兴趣，传统数据源的局限被打破，企业愈发需要有效的信息之力以确保其真实性及安全性。　　从所周知，大数据已经不简简单单是数据大的事实了，而最重要的现实是对大数据进行分析，只有通过分析才能获取很多智能的，深入的，有价值的信息。那么越来越多的应用涉及到大数据，而这些大数据的属性，包括数量，速度，多样性等等都是呈现了大数据不断增长的复杂性，所以大数据的分析方法在大数据领域就显得尤为重要，可以说是决定最终信息是否有价值的决定性因素。基于如此的认识，大数据分析普遍存在的方法理论有哪些呢？　　大数据分析的使用者有大数据分析专家，同时还有普通用户，但是他们二者对于大数据分析最基本的要求就是可视化分析，因为可视化分析能够直观的呈现大数据特点，同时能够非常容易被读者所接受，就如同看图说话一样简单明了。　　大数据分析的理论核心就是数据挖掘算法，各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点，也正是因为这些被全世界统计学家所公认的各种统计方法（可以称之为真理）才能深入数据内部，挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法才能更快速的处理大数据，如果一个算法得花上好几年才能得出结论，那大数据的价值也就无从说起了。　　大数据分析最终要的应用领域之一就是预测性分析，从大数据中挖掘出特点，通过科学的建立模型，之后便可以通过模型带入新的数据，从而预测未来的数据。　　大数据分析广泛应用于网络数据挖掘，可从用户的搜索关键词、标签关键词、或其他输入语义，分析，判断用户需求，从而实现更好的用户体验和广告匹配。　　大数据分析离不开数据质量和数据管理，高质量的数据和有效的数据管理，无论是在学术研究还是在商业应用领域，都能够保证分析结果的真实和有价值。大数据分析的基础就是以上五个方面，当然更加深入大数据分析的话，还有很多很多更加有特点的、更加深入的、更加专业的大数据分析方法。　　当下我国大数据研发建设应在以下四个方面着力　　一是建立一套运行机制。大数据建设是一项有序的、动态的、可持续发展的系统工程，必须建立良好的运行机制，以促进建设过程中各个环节的正规有序，实现统合，搞好顶层设计。　　二是规范一套建设标准。没有标准就没有系统。应建立面向不同主题、覆盖各个领域、不断动态更新的大数据建设标准，为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。　　三是搭建一个共享平台。数据只有不断流动和充分共享，才有生命力。应在各专用数据库建设的基础上，通过数据集成，实现各级各类指挥信息系统的数据交换和数据共享。　　四是培养一支专业队伍。大数据建设的每个环节都需要依靠专业人员完成，因此，必须培养和造就一支懂指挥、懂技术、懂管理的大数据建设专业队伍。

论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目，不能“无题”。论文题目一般20字左右。题目大小应与内容符合，尽量不设副题，不用第1报、第2报之类。论文题目都用直叙口气，不用惊叹号或问号，也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人，应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上，那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者，也可以一般致谢。行政领导人一般不署名。(三)论文——引言是论文引人入胜之言，很重要，要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法按规定如实写出实验对象、器材、动物和试剂及其规格，写出实验方法、指标、判断标准等，写出实验设计、分组、统计方法等。这些按杂志对论文投稿规定办即可。(五)论文——实验结果应高度归纳，精心分析，合乎逻辑地铺述。应该去粗取精，去伪存真，但不能因不符合自己的意图而主观取舍，更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因，不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃，不能只废弃不合己意者。实验结果的整理应紧扣主题，删繁就简，有些数据不一定适合于这一篇论文，可留作它用，不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图，可以不用图表的最好不要用图表，以免多占篇幅，增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代，不要随意丢弃。(六)论文——讨论是论文中比较重要，也是比较难写的一部分。应统观全局，抓住主要的有争议问题，从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理，而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论，表明自己的观点，尤其不应回避相对立的观点。论文的讨论中可以提出假设，提出本题的发展设想，但分寸应该恰当，不能写成“科幻”或“畅想”。(七)论文——结语或结论论文的结语应写出明确可靠的结果，写出确凿的结论。论文的文字应简洁，可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉，便于查找，同时也是尊重前人劳动，对自己的工作有准确的定位。因此这里既有技术问题，也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法；在结果中有时要引上与文献对比的资料；在讨论中更应引上与论文有关的各种支持的或有矛盾的结果或观点等。(九)论文——致谢论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的，不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意，不能拉大旗作虎皮。(十)论文——摘要或提要：以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写，有吸引力。要让读者看了论文摘要就像看到了论文的缩影，或者看了论文摘要就想继续看论文的有关部分。此外，还应给出几个关键词，关键词应写出真正关键的学术词汇，不要硬凑一般性用词。

大数据最新参考文献

会的。doi是云计算背景下最佳的“大数据”样本存储和应用技术，用于IKE进行协商SA协议统一分配。doi具有唯一性、持久性、兼容性、互操作性、动态更新的特点。参考文献是学术著作和期刊的必备项目，也是书刊编校容易忽略的版块。参考文献一般由作者提供，如果作者未能按照参考文献国标著录，编辑的工作量会比较大。

数据挖掘的十大算法为了进行数据挖掘任务，数据科学家们提出了各种模型，在众多的数据挖掘模型中，国际权威的学术组织 ICDM （the IEEE International Conference on Data Mining）评选出了十大经典的算法。按照不同的目的，我可以将这些算法分成四类，以便你更好的理解。分类算法：C5，朴素贝叶斯（Naive Bayes），SVM，KNN，Adaboost，CART聚类算法：K-Means，EM关联分析：Apriori连接分析：PageR C5C5 算法是得票最高的算法，可以说是十大算法之首。C5 是决策树的算法，它创造性地在决策树构造过程中就进行了剪枝，并且可以处理连续的属性，也能对不完整的数据进行处理。它可以说是决策树分类中，具有里程碑式意义的算法。朴素贝叶斯（Naive Bayes）朴素贝叶斯模型是基于概率论的原理，它的思想是这样的：对于给出的未知物体想要进行分类，就需要求解在这个未知物体出现的条件下各个类别出现的概率，哪个最大，就认为这个未知物体属于哪个分类。 SVMSVM 的中文叫支持向量机，英文是 Support Vector Machine，简称 SVM。SVM 在训练中建立了一个超平面的分类模型。如果你对超平面不理解，没有关系，我在后面的算法篇会给你进行介绍。 KNNKNN 也叫 K 最近邻算法，英文是 K-Nearest Neighbor。所谓 K 近邻，就是每个样本都可以用它最接近的 K 个邻居来代表。如果一个样本，它的 K 个最接近的邻居都属于分类 A，那么这个样本也属于分类 A。 AdaBoostAdaboost 在训练中建立了一个联合的分类模型。boost 在英文中代表提升的意思，所以 Adaboost 是个构建分类器的提升算法。它可以让我们多个弱的分类器组成一个强的分类器，所以 Adaboost 也是一个常用的分类算法。 CARTCART 代表分类和回归树，英文是 Classification and Regression Trees。像英文一样，它构建了两棵树：一棵是分类树，另一个是回归树。和 C5 一样，它是一个决策树学习方法。 AprioriApriori 是一种挖掘关联规则（association rules）的算法，它通过挖掘频繁项集（frequent item sets）来揭示物品之间的关联关系，被广泛应用到商业挖掘和网络安全等领域中。频繁项集是指经常出现在一起的物品的集合，关联规则暗示着两种物品之间可能存在很强的关系。 K-MeansK-Means 算法是一个聚类算法。你可以这么理解，最终我想把物体划分成 K 类。假设每个类别里面，都有个“中心点”，即意见领袖，它是这个类别的核心。现在我有一个新点要归类，这时候就只要计算这个新点与 K 个中心点的距离，距离哪个中心点近，就变成了哪个类别。 EMEM 算法也叫最大期望算法，是求参数的最大似然估计的一种方法。原理是这样的：假设我们想要评估参数 A 和参数 B，在开始状态下二者都是未知的，并且知道了 A 的信息就可以得到 B 的信息，反过来知道了 B 也就得到了 A。可以考虑首先赋予 A 某个初值，以此得到 B 的估值，然后从 B 的估值出发，重新估计 A 的取值，这个过程一直持续到收敛为止。EM 算法经常用于聚类和机器学习领域中。 PageRankPageRank 起源于论文影响力的计算方式，如果一篇文论被引入的次数越多，就代表这篇论文的影响力越强。同样 PageRank 被 Google 创造性地应用到了网页权重的计算中：当一个页面链出的页面越多，说明这个页面的“参考文献”越多，当这个页面被链入的频率越高，说明这个页面被引用的次数越高。基于这个原理，我们可以得到网站的权重划分。最后算法可以说是数据挖掘的灵魂，也是最精华的部分。这 10 个经典算法在整个数据挖掘领域中的得票最高的，后面的一些其他算法也基本上都是在这个基础上进行改进和创新。今天你先对十大算法有一个初步的了解，你只需要做到心中有数就可以了。

论文格式：纸张为A4纸，页边距上5cm，下5cm，左0cm，右5cm。论文由内容摘要与关键词、论文正文和参考文献组成。一级标题“一、”;二级标题“(二)”;三级标题“”。 [内容摘要]和[关键词]均为宋体小四号加粗，内容宋体小四号，行距25cm。正文:(1) 标题:黑体二号居中,上下各空一行。(2) 正文：小四号宋体，每段起首空两格，回行顶格，行距为多倍,25。(3) 一级标题格式：一级标题：序号为“一、”，小三号黑体字，独占行，起首空两格，末尾不加标点。(4) 二标题序号为“(一)”，四号宋体，加粗，独占行，起首空两格，末尾不加标点。(5)三级标题：序号为“”，起首空两格，空一格后接排正文，小四号宋体，加粗。(6) 四、五级标题序号分别为“(1)”和“①”，与正文字体字号相同，可根据标题的长短确定是否独占行。若独占行，则末尾不使用标点，否则，标题后必须加句号。每级标题的下一级标题应各自连续编号。(7) 注释 (根据需要)：正文中需注释的地方可在加注之处右上角加数码，形式为“①、②……”(即插入脚注)，并在该页底部脚注处对应注号续写注文。注号以页为单位排序，每个注文各占一段，用小5号宋体。书写格式参考文献标注的位置。参考文献标标注方法和规则。参考文献标标注的格式。2007年8月20日在清华大学召开的“综合性人文社会科学学术期刊编排规范研讨会”决定，2008年起开始部分刊物开始执行新的规范“综合性期刊文献引证技术规范”。该技术规范概括了文献引证的“注释”体例和“著者—出版年”体例。不再使用“参考文献”的说法。以上内容参考：百度百科-参考文献

例子傅刚大风过后的思考[N/OL]北京青年报，2000-04-12（14）[2002-03-06] %5ED0412B [序号] 主要责任者．题名：其他题名信息[文献类型标志、文献载体标志]．出版地：出版者，出版年（更新或修改日期）[引用日期]．获取和访问路径（网址）．注明：[N/OL]为[文献类型标志、文献载体标志]文献类型标志如下：普通图书 M, 会议录 C, 汇编 G, 报纸 N, 期刊 J, 学位论文 D, 报告R，标准 S，专利 P，数据库 DB，计算机程序 CP，电子公告 EB。电子文献载体类型标志如下：磁带 MT，磁盘 DK，光盘 CD，联机网络OL

大数据时代参考文献

杜艳玲(中石油勘探开发研究院资料中心)摘要长期以来，文字描述地质资料是记录地质信息的有效载体。随着大数据时代的来临，地质资料海量数据的发现与提取难度加大，地质资料信息化发展面临着二次开发与知识服务的新挑战。本文就地质资料管理的现状、管理中存在的问题进行了分析探讨，并就如何做好大数据时代的地质资料管理工作做了有益的探讨并提出了4个方面的意见和建议。关键词大数据地质资料信息化二次开发地质资料是地勘单位记录历史地质信息的有效载体，是工作得以有效实施的有力保障。随着社会发展进步及地质勘探技术的成熟，地质资料管理工作任务量越来越大。如何在大数据时代背景下完善地质资料的信息管理，成为所有档案工作者迫切需要解决的问题。1 地质资料管理的现状1 地质资料互相封闭随着经济建设的快速发展，勘探开发专业人员对地质资料的需求量不断增大，但是由于大部分地质资料属于内部管理资料，只用于级别较高且承担着较大科研任务的项目使用，部分单位甚至为获取自身利益互相封锁资料，导致地质档案无法得到有效的利用。2 地质资料的开发利用与资料保密处理不当《地质资料管理条例》第十四条规定：地质资料馆和地质资料保管单位，应当建立地质资料的整理、保管制度，配置保存、防护、安全等必要设施，配备专业技术人员，保障地质资料的完整和安全。第十九条规定：地质资料馆和地质资料保管单位应当按照规定管理地质资料，不得非法披露、提供利用保护期内的地质资料或者封锁公开的地质资料。地质资料是地质工作价值的集中体现，当它实现项目所需的第一价值之后，一般就进入馆藏机构进行存储。但是地质资料还有后续价值，地质资料所承载的信息资源可以多次、长期、反复地开发利用。这样，一些国家保密矿种，国家规划矿区的地质资料一方面具有保密性，一方面又有开发利用的需求，这种矛盾显而易见。既不能一味强调保密，也不能无视《保密法》等相关规定，擅自开发利用，造成泄密。如何处理好利用与保密的关系、如何做到借阅有法可依、借阅有章可循，成为摆在所有档案工作者面前的一个难题。3 地质资料的二次开发和深度开发效率较低大量的地质资料源于长期勘探过程中的积累。如何发现已有资料的内部价值，以便延长其使用寿命，是摆在我国地矿工作者面前的紧迫任务，也是一项新的挑战。但是由于研究经费短缺、过去和现在成藏理论的限制、不同研究者研究角度不同结论不同等问题，使得我国地质资料二次开发利用率很低。据不完全统计，全国保存的非纸质介质地质资料，共有磁盘4万盒，磁带4万盒，胶片1万片[1]。但是由于有关人员对地质资料二次开发利用的重视程度不够，经费、人员也没有相应的落实，从而经验做法总结不够，没有形成对地质资料二次开发、深入开发的良好氛围。2 地质资料管理面临的挑战1 海量数据的提取面临新的挑战在信息爆炸的今天，数据已经渗透到世界的每一个角落，且数据总量增长迅猛。据预测，未来每18个月，整个世界的数据总量就会翻倍，到2020年，世界的数据总量将会增长44倍[2]。以中石油勘探开发研究院为例，自1991年成立以来，已经累计积累了勘探开发资料71万件，其中包括探井36384口、生产井19617口井资料，以及研究院的各类档案92798万份，馆藏档案133186卷、786071件。面对不断丰富的馆藏资源，如何在海量的数据中快速而准确地检索到所需的信息，如何将档案资源转化为知识资源，传统的档案管理模式已经不足以满足工作需要。大数据时代的来临增加了地质资料寻找与提取的难度。2 地质资料面临知识服务的挑战大数据时代的资料用户已经不满足仅局限于数据或是文件的利用，而是希望能够获得数据背后的信息以及信息蕴藏的知识。与传统档案馆(室)藏资源或者其他应用相比，大数据时代下数字档案馆藏数量具有媒体形式多、数据量大的特点，大数据时代的用户需求变得更加个性化、多样化。特别是近年来，随着国际油价的持续攀升，矿权市场持续升温，地质资料的开发利用需求旺盛，地质资料管理人员转变为信息的咨询者和系统的服务者，这些都给地质资料的服务带来了挑战。3 如何加强地质资料的管理1 加强网络信息化建设加强建设地质资料网络信息化建设，是提高地质资料利用率的有效途径。建立网络信息化可以实现声音、图像以及文字等多种形式的信息进行统一的处理、存储，改变了传统的地质资料信息管理只能着眼于纸张文字的单一表现形式，呈现给地勘人员更加丰富多彩的地质资料编研形式，提供了更加丰富鲜活的地质档案信息[3]。用微机对档案进行收集、筛选、加工，使之转化为微机软件形式的二次文件信息，从而作为电子文件数据提供利用。把纸质资料数据文件归档电子化，充分利用计算机、扫描仪，建立全文数据库，以便存储查找和利用，这既是地质工作现实的要求，也是档案管理的必然取向[4]。对地质资料进行现代化信息建设可以很好地实现资料的详细记录，可以为以后的相关决策提供有力的依据，在很大程度上避免了由于突发性事件或是蓄意破坏而发生的资料丢失现象。对地质资料进行信息化建设可以远程服务实现对地质资源的共享，在编纂地质文档资料的时候可以有效地缩短对地质文献信息及地质文档编著的时间，更快、更好地提高现代地质资料信息的利用率。2 建立地质资料目录检索数据库大数据时代提供了海量的数据，如何在最短的时间内最快地检索到需要的数据，成为摆在所有档案工作者面前的一大挑战。地质资料目录检索数据库很好地解决了这一问题。国土资源部出版了《地质资料档案著录细则》，对如何著录地质资料进行了详细指导。数据检索系统智能化程度很高，可以根据使用者的需求，输入任意关键词，例如资料名称、井名、勘查程度、矿种或是几个关键词的组合，均可以从数据库中检索出有关的地质资料信息，方便快捷地为地勘人员提供服务。3 拓展地质资料开发利用的方式方法技术水平直接影响服务的效率和质量，大数据为地质资料的开发利用提供了很好的平台。拓展地质资料的开发利用方式要充分利用现代化服务手段，提升现代化服务水平。重视现代地质资料服务系统、技术和标准的开发，力争在系统交换和传输技术、新方法、新手段上下功夫，推进地质资料的整合和共享。同时加快内网外网和电子政务平台的建设，加强行业和部门互动，形成多层次、多部门社会化服务网络系统，实现地质资料的开发利用和信息共享。同样重要的是，要同步更新离线服务和在线服务方式方法，提升服务效率。离线服务要突出数据加工和介质拷贝服务，在线服务要提供数据检索和下载服务，配合电子邮件、传真、电话等形式，为用户答疑解惑，提供信息服务[5]。4 加强地质资料的二次开发和深度开发《国务院关于加强地质工作的决定》明确提出将“推进地质资料开发利用”作为新时期地质工作六大任务之一，充分体现了党中央、国务院对地质资料工作的高度重视，反映了经济社会发展对地质资料信息的迫切需求。地质资料具有形成成本高、应用范围广、可反复利用、经济社会效益潜力巨大等特点。地质资料的属性特征，决定了其直接价值和潜在价值远远大于其投资成本，决定了其反复永续利用的潜力。地质资料的二次开发，绝不仅仅是对现有的地质资料进行第二轮简单的整理、归纳，而是以最新的找矿理论、技术和方法为指导，以改革创新的精神对原有的地质资料进行有效而又合理的加工、整理、归纳和总结，提炼出具有重要价值的信息资源。根据利用者的需求，组织相关的工作团队，通过人、财、物的投入，提高地质档案社会化服务附加值，从而推动地质资料的产业化[5]。2003年英国地调局运用成本效益分析法和增值法对其经济效益进行了评估，结果表明：英国地调局在2001年为英国所做的贡献相当于其年度营业额的850～1525倍。另外，据其他国家测算，地质产品中的地质图，即使按最小价值计算，其价值也是填图成本的25倍[1]。新中国成立以来，我国累计投入了大约5000亿美元的地勘费，形成了大量的地质资料，通过对丰富的地质资料开发利用，为国民经济和社会发展作出了重大贡献。在大数据时代，必须提高地质资料的利用率，加大资料二次开发和深度开发力度，围绕用户的需求而不断地创新服务，提供多方面的优质服务。4 结语在大数据时代，地质资料海量数据管理与服务发生深刻的变化，我们要不断加强专业知识的学习，积极探索新的管理模式和管理方法，以新思维、新技术、新举措对待地质资料的现代化建设，以便于更好地为地质勘探事业服务。参考文献[1]姚华军深入贯彻学习《决定》大力推进地质资料开发利用[J]中国国土资源经济，2006(11)[2]郑军，尹兆涛中国石油应对“大数据的策略分析”[J]石油规划设计，2013，24(6)：27～[3]张艳霞如何做好地质档案的全面管理工作[J]价值工程，2012(10)[4]冯演对做好地质资料档案管理工作的思考[J]中国城市经济，2010(11)[5]马忠花青海省地质档案的开发与利用研究[D]郑州：郑州大学，

毕业论文参考文献可以从图书馆或者中国知网上找。毕业论文指的是你在大学期间对你所学专业的现实或理论问题进行科学探索且是有一定意义的论文，一般大学生在大三下半学期就可以为毕业论文做准备了，因为大四的上半学期要准备实习，下半学期要准备毕业答辩，等大四再去慢慢准备毕业论文时间是很仓促的。毕业论文的撰写过程要求是相当高的，学生要在相关教师的指导下，选定要写的课题才行，这也是从总体上考察一名大学生大学四年的学习成果。毕业论文一般都包含以下部分：题目、署名、中文摘要、中文关键词、英文摘要、英文关键词（其中英文摘要和关键词要与中文摘要和关键词相对应）、引言（前言)、正文、参考文献、致谢辞和附录。其中对参考文献的要求和格式都特别严格，查找参考文献的过程也特别浪费时间，下面我将讲讲一些找参考文献的方法。确定方向不管你要找什么类型的参考，首先都要确定你的毕业论文写作方向，然后根据根据你的毕业论文主题去寻找你所需要的参考文献。所以，定方向是至关重要的一步。找信息找信息这一步是最耗费心血也是工作量最大的一步了，因为就算你明确了你要找的参考文献目标，但是这一类的参考文献实在太多了，所以找起来也不方便。这些都是你要面临的挑战。找参考文献的话主要有两种方法：①图书馆。不过这个图书馆的范围就有点大了，你可以利用学校的图书馆，毕竟每一所高校的图书馆都提供了很多的资源供大家使用。同时要是学校图书馆的还是不能找到你所需的参考文献，你也可以去当地的图书馆，每一个县级以上的地区都设有它们专门的图书馆，你可以去看看。②网站信息。随着大数据时代的来临，我们查找资料也越来越方便了，只用动动手指就可以在网上查找到你所需要的资料。现在网上也有专门的网站为大家提供寻找参考文献的便利。比如中国知网和全国学术快报等。信息来源毕业论文的参考文献不仅仅是局限于一些专著，它还可以包括论文集、辞书、研究报告、期刊文章和报纸文章等。所以其实找毕业论文的参考文献其实有多种途径，能找的文献也很多，只是在找的过程中比较麻烦，还有就是一定不要抄袭，要是在毕业论文出现抄袭现象后果是很严重的。

引言空间数据挖掘（Spatial Data Mining，SDM）即找出开始并不知道但是却隐藏在空间数据中潜在的、有价值的规则的过程。具体来说，空间数据挖掘就是在海量空间数据集中，结合确定集、模糊集、仿生学等理论，利用人工智能、模式识别等科学技术，提取出令人相信的、潜在有用的知识，发现空间数据集背后隐藏的规律、联系，为空间决策提供理论技术上的依据[1]。空间数据挖掘的一般步骤空间数据挖掘系统大致可以分为以下步骤：（1）空间数据准备：选择合适的多种数据来源，包括地图数据、影像数据、地形数据、属性数据等。（2）空间数据预处理和特征提取：数据预处理目的是去除数据中的噪声，包括对数据的清洗、数据的转换、数据的集成等。特征提取是剔除掉冗余或不相关的特征并将特征转化为适合数据挖掘的新特征。（3）空间数据挖掘和知识评估：采用空间数据挖掘技术对空间数据进行分析处理和预测，从而发现数据背后的某种联系。然后结合具体的领域知识进行评估，看是否达到预期效果。空间数据挖掘的方法研究空间数据挖掘是一门综合型的交叉学科，结合了计算机科学、统计学、地理学等领域的很多特性，产生了大量处理空间数据的挖掘方法。1 空间关联规则关联规则挖掘是寻找数据项之间的联系，表达式形式是X→Y，其中X与Y是两种不相交的数据项集，即X∩Y=？覫。KOPERSKI K等人将关联规则与空间数据库相结合，提出了空间关联规则挖掘[2]。空间关联规则将数据项替换为了空间谓词，一般表达形式如下：A1∧A2∧…∧An→B1∧B2∧…∧Bm（3）令A=（A1，A2，…，An），B=（B1，B2，…，Bm），A和B分别表示Ai和Bj的谓词集合，A和B可以是空间谓词或非空间谓词，但是必须至少包含一个空间谓词且A∩B=？覫。SHEKHAR S和HUANG Y针对空间关联规则的特点提出了把关联规则的思想泛化成空间索引点集的空间同位规则的概念，在不违背空间相关性的同时用邻域替换掉了事务[3]。时空关联不仅涉及事件在空间中的关联，还考虑了空间位置和时间序列因素。国内的柴思跃、苏奋振和周成虎提出了基于周期表的时空关联规则挖掘方法[4]。2 空间聚类空间聚类分析是普通聚类分析的扩展，不能完全按照处理普通数据的聚类分析方法来处理空间数据。由于存在地理学第一定律，即空间对象之间都存在一定的相关性，因此在空间聚类分析中，对于簇内的定义，要考虑空间自相关这一因素。通过对空间数据进行自相关分析，可判断对象之间是否存在空间相关性，从而可合理判断出对象是否可以分为一簇。基本的聚类挖掘算法有：（1）划分聚类算法：存在n个数据对象，对于给定k个分组（k≤n），将n个对象通过基于一定目标划分规则，不停迭代、优化，直到将这n个对象分配到k个分组中，使得每组内部对象相似度大于组之间相似度。（2）层次聚类算法：通过将数据不停地拆分与重组，最终把数据转为一棵符合一定标准的具有层次结构的聚类树。（3）密度聚类算法：用低密度的区域对数据对象进行分割，最终将数据对象聚类成为若干高密度的区域。（4）图聚类算法：用空间结点表示每个数据对象，然后基于一定标准形成若干子图，最后把所有子图聚类成一个包含所有空间对象的整图，子图则代表一个个空间簇。（5）网格聚类算法：把空间区域分割成具有多重分辨率的和有网格结构特性的若干网格单元，在网格单元上对数据进行聚类。（6）模型聚类算法：借助一定的数学模型，使用最佳拟合数据的数学模型来对数据进行聚类，每一个簇用一个概率分布表示。仅采用一种算法通常无法达到令人满意的预期结果，王家耀、张雪萍、周海燕将遗传算法与K-均值算法结合提出了用于空间聚类分析的遗传K-均值算法[5]。现实空间环境中，存在很多像道路、桥梁、河流的障碍物，张雪萍、杨腾飞等人把K-Medoids算法与量子粒子群算法结合进行带有空间障碍约束的聚类分析[6]。3 空间分类分类，简单地说是通过学习得到一定的分类模型，然后把数据对象按照分类模型划分至预先给定类的过程。空间分类时，不仅考虑数据对象的非空间属性，还要顾及邻近对象的非空间属性对其类别的影响，是一种监督式的分析方法。空间分类挖掘方法有统计方法、机器学习的方法和神经网络方法等。贝叶斯分类器是基于统计学的方法，利用数据对象的先验概率和贝叶斯公式计算出其后验概率，选择较大后验概率的类作为该对象映射的类别。决策树分类器是机器学习的方法，采取从上到下的贪心策略，比较决策树内部节点的属性值来往下建立决策树的各分支，每个叶节点代表满足某个条件的属性值，从根节点到叶节点的路径表示一条合适的规则。支持向量机也是机器学习的方法，思路是使用非线性映射把训练数据集映射到较高维，然后寻找出最大边缘超平面，将数据对象分类。神经网络是一种模拟人神经的网络，由一组连接的输入和输出单元组成，赋予各个连接相应的权值，通过调节各连接的权值使得数据对象得到正确分类。针对融入空间自相关性的空间分类挖掘，SHEKHAR S等人使用空间自回归模型和基于贝叶斯的马可夫随机场进行空间分类挖掘[7]，汪闽、骆剑承、周成虎等人将高斯马尔可夫随机场与支持向量机结合并将其用于遥感图像的信息提取[8]。4 其他空间挖掘方法空间数据挖掘的方法多种多样，其他还包括：空间分析的方法，即利用GIS的方法、技术和理论对空间数据进行加工处理，从而找出未知有用的信息模式；基于模糊集、粗糙集和云理论的方法可用来分析具有不确定性的空间数据；可视化方法是对空间数据对象的视觉表示，通过一定技术用图像的形式表达要分析的空间数据，从而得到其隐含的信息；国内张自嘉、岳邦珊、潘琦等人将蚁群算法与自适应滤波的模糊聚类算法相结合用以对图像进行分割[9]。结论空间数据挖掘作为数据挖掘的延伸，有很好的传统数据挖掘方法理论的基础，虽然取得了很大进步，然而其理论和方法仍需进一步的深入研究。伴随着大数据时代，面对越来越多的空间数据，提升数据挖掘的准确度和精度是一个有待研究的问题。同时现在流行的空间数据挖掘算法的时间复杂度仍停留在O（nlog（n））~O（n3）之间，处理大量的异构数据，数据挖掘算法的效率也需要进一步提高。数据挖掘在云环境下已经得到很好的应用[10]，对于处理空间数据的空间云计算是有待学者们研究的方向。大多数空间数据挖掘算法没有考虑含有障碍约束的情况，如何解决现实中障碍约束问题值得探讨。带有时间属性的空间数据呈现出了一种动态、可变的空间现象，时空数据挖掘将是未来研究的重点。由于数据挖掘涉及多种学科，其基本理论与方法也已经比较成熟，针对空间数据挖掘，如何合理地利用和拓展这些理论方法以实现对空间数据的挖掘仍将是研究人员们需要长期努力的方向。参考文献[1] 李德仁，王树良，李德毅空间数据挖掘理论与应用（第2版）[M]北京：科学出版社，[2] KOPERSKI K， HAN J W Discovery of spatial association rules in geographic information databases[C] Procedings of the 4th International Symposium on Advances in Spatial Databases， 1995： 47-[3] SHEKHAR S， HUANG Y Discovering spatial co-location patterns： a summary of results[C] Procedings of the 7th International Symposium on Advances in Spatial and Temporal Databases， 2001：236-[4] 柴思跃，苏奋振，周成虎．基于周期表的时空关联规则挖掘方法与实验[J]．地球信息科学学报，2011，13（4）：455-[5] 王家耀，张雪萍，周海燕一个用于空间聚类分析的遗传K-均值算法[J]计算机工程，2006，32（3）：188-[6] Zhang Xueping， Du Haohua， Yang Tengfei， et A novel spatial clustering with obstacles constraints based on PNPSO and K-medoids[C] Advances in Swarm Intelligence， Lecture Notes in Computer Science （LNCS）， 2010： 476-[7] SHEKHAR S， SCHRATER P R， VATSAVAI R R， et al．Spatial contextual classification and prediction models for mining geospatial data[J]． IEEE Transactions on Multimedia， 2002， 4（2）：174-[8] 汪闽，骆剑承，周成虎，等结合高斯马尔可夫随机场纹理模型与支撑向量机在高分辨率遥感图像上提取道路网[J]遥感学报，2005，9（3）：271-[9] 张自嘉，岳邦珊，潘琦，等基于蚁群和自适应滤波的模糊聚类图像分割[J]电子技术应用，2015，41（4）：144-[10] 石杰云计算环境下的数据挖掘应用[J]微型机与应用，2015，34（5）：13-来源 | AET电子技术应用

文献参考数据库

常用的有百度学术，谷歌学术，爱学术，爱学术的文献类型比较广，主要有中文的期刊，会议，专利，标准，图书，论文，英文的期刊，会议，专利，图书等，我比较喜欢。

论文的国外参考文献可以在以下网站查找：一、seek68文献馆大型中外文献数据库整合，覆盖全科。二、EBSCO共收集了4000多种索引和文摘型期刊和2000多种全文电子期刊。该公司含有Business Source Premier （商业资源电子文献库）、Academic Search Elite（学术期刊全文数据库）等多个数据库。涉及社会科学、人文、教育、计算机科学、工程、物理、化学、艺术、医学等。三、OCLC FirstSearch是大型综合的、多学科的数据库平台，基本组数据库包共有13个子数据库，涉及广泛的主题范畴，覆盖所有领域和学科，所有信息来源于全世界知名图书馆和知名信息提供商。四、Taylor & Francis 出版集团拥有200多年丰富的出版经验，作为世界领先的学术性期刊、图书、电子书及参考工具书出版社之一，出版的内容遍及人文、社会科学、行为科学、科学技术和医学等各个领域。五、John Benjamins电子期刊目前收录90多种学术期刊，重点聚焦语言学、文学和心理学等研究领域。六、NetLibrary是世界上向图书馆提供电子图书的主要提供商。七、Blackwell出版公司是世界上最大的期刊出版商之一。它所出版的学术期刊在科学技术、医学、社会科学以及人文科学等学科领域享有盛誉。八、springerSpringer期刊的学科范围包括：行为科学、生命科学、商业与经济、化学和材料科学、计算机科学、地球和环境科学、工程学、人文社会科学和法律等。

介绍一个叫做联合在线咨询的网站给你。百度一下进入之后，无需注册直接点击“我要提问”功能，把论文的标题、作者贴进来，留个邮箱，提交就可以了。论文会通过邮箱发给你

规定中不是有一条网络文献的规定吗按它的规定来

索引序列
大数据技术参考文献
大数据论文参考文献
大数据最新参考文献
大数据时代参考文献
文献参考数据库
返回顶部

大数据技术参考文献