首页 > 论文期刊知识库 > 统计学论文数据分析总结报告

统计学论文数据分析总结报告

发布时间:

统计学论文数据分析总结报告

统计数据是金融银行系统内最常用到的数据比较与分析的一种统计形式,想要做好全行的资金计划工作,对数据的统计月分析就不容忽视。做好了这项工作,也就为其他的工作奠定了好的基础。统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。就政府统计工作过程而言,它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。而从社会上广泛开展的统计分析活动来看,它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。系统、完善的资料是统计分析的必要条件。  运用统计方法、定量与定性的结合是统计分析的重要特征。随着统计方法的普及,不仅统计工作者可以搞统计分析,各行各业的工作者都可以运用统计方法进行统计分析。统计分析与经济分析、会计分析、企业经营状况分析以及其他各种分析研究活动有着密切的联系,它们之间往往存在着一种相互包含的关系。经济分析、会计分析等反映的是分析对象所属的领域,但只要运用了统计方法,就也可以称其为统计分析。从一定意义上讲,提供高水平的统计分析报告是统计数据经过深加工的最终产品,是统计信息、咨询、监督整体功能有机结合的充分展现。统计分析报告是对研究过程进行表述的文章,是统计分析结果的最终形式。与一般文章相比,它具有以下一些特点:  以统计数字为语言。统计分析报告以统计数据为主要语言,并辅之以统计表和统计图来具体而明确地进行表述。并且,统计分析报告所使用的统计数据不是个别的、简单的、杂乱无章的,而是相互联系的,具有逻辑关系的统计数据。  具有简明的表达方式和结构。统计分析报告属于说明文,在表述时不使用夸张、虚构、想象等文学表达方式,也不使用华丽的语言和过多的描写去着意渲染。它要求用尽可能少的文字,做到言简意赅、精炼准确,资料与基本观点一致,论点和论据的一致。统计分析报告具有相对确定的结构。其突出特点是层次分明,脉络清晰。一般是先针对问题亮出观点,然后摆数据和事实进行论证,在进行科学分析的基础上最后提出对策和建议。  对研究过程的高度概括。统计分析报告是研究过程的叙述,但又不是对研究过程的全盘照搬,而是择其主要论点和论据对研究过程的高度概括。它省略了研究过程中运用多项指标、多种统计方法进行试算的过程,而且也不需要对方法的基本原理、特点、推导过程和运算步骤进行过细的讨论,而是通过论点和主要论据的联系直扣主题。统计数据报告既有的特点也是其他类型的分析报告所不具备的。其具有以下几个特点。准确性。实事求是地反映客观实际,做到数字要准确,情况要真实,观点要正确。要扎扎实实地把数字搞准,对大起大落的数字要查明原因,但统计分析不应是数字的简单罗列,要正确地使用数据通过对数字的分析、判断、提炼出观点,揭示经济现象的规律性。只有这样统计分析报告才有了坚实的基础和足够的份量。实用性。统计分析报告有着明显的目的性、针对性,它是为一定对象服务的。它必须紧密结合当前经济运行中的重点、热点和难点问题进行分析,为各级领导宏观调控和管理决策提供科学依据。统计分析报告的针对性和实用性越强,质量也越高。逻辑性。统计分析是由数字形成概念,从概念形成判断,由判断进行推理,并由此得出结论。判断是以准确的统计数字为依据,推理是以充分的依据为前提,正确的判断和推理就是要有合乎事实的逻辑性,判断推理的结果前后不能矛盾,不能脱节,要如实反映客观事物的内在联系。因此,统计分析报告要主题突出、结构严谨、条理清晰。时效性。这是保证统计信息价值的重要条件。提供不适时就是失效的信息。进度统计分析报告越快越好,要争分夺秒;专题分析贵在适时,特别是前瞻性和予警性的专题分析往往会产生较好的社会效益。提高统计分析的层次和质量,要求统计部门能够提供准确的集约化信息、高质量的咨询决策和可操作的咨询建议,这是达到较高层次优质服务水平和充分发挥统计部门整体功能的重要标志。为了促进调研工作上质量、上层次、上水平主要应从以下几个方面入手:增强分析的针对性,善于捕捉领导的"关注点"。调研分析的目的在于应用,对统计部门来说,就是要将研究成果转换为领导决策。为了实现这种"转换",应增强观察和分析问题能力选择领导最为关心的问题,善于捕捉领导的"关注点",针对当前经济发展中的重点、热点和难点问题进行研究。发挥优势,快速反映,适时为领导送上"及时雨"。调研分析不仅要想领导之所想,还要急领导之所急。兵贵神速,要充分利用丰富的统计信息和大量的第一手资料的优势,在尽量短的时间内完成分析报告的撰写,迅速及时地向领导发送各种新鲜动态信息和经济运行状况的监测预警分析报告,以便领导及时掌握情况,指挥全局。切实提高数据和分析质量,为领导"报实情"。准确性是统计的生命所在,要坚持客观公允态度,发扬唯实精神,讲实话,报实情,在保证数据准确的基础上,以科学求实的精神对当前经济运行状况提出恰当的分析,为领导决策提供科学的数据和理论依据。在"新"字上下功夫,分析要有"新鲜感"。写分析文章切忌老三段、冗长的平铺直叙和没有自己主见的"对策建议",不能过多重复一般概念和别人说过的话,对问题的研究要与时俱进,有新角度,要有独到见解,不仅立题要"新",而且见解更要"新"。对经济运行状况进行超前分析,要向前"抢半拍"。要善于时刻把握新的"增长点"和"变化点",具有敏锐的眼光,为各级领导做好超前服务。所谓"超前性",一是对趋势性的苗头问题进行超前反映,二是对未来发展做出预测。咨询决策要具有可操作性,在建议上要"想实招"。统计分析不应当是简单的提出问题和局限在数字文字化的表述上,应当在深刻总结的基础上,提出有一定量化依据和可操作的具体实施意见,针对当前经济发展中存在的问题,一方面提出有针对性的工作思路,一方面提出可操作性的工作对策,使调研成果迅速得到应用。 在统计分统计分析方法从根本上说有两大类,一是逻辑思维方法,二是数量关系分析方法。析中二者密不可分,应结合运用。  逻辑思维方法是指辩证唯物主义认识论的方法。统计分析必须以马克思主义哲学作为世界观和方法论的指导。唯物辩证法对于事物的认识要从简单到复杂,从特殊到一般,从偶然到必然,从现象到本质。坚持辨证的观点、发展的观点,从事物的发展变化中观察问题,从事物的相互依存、相互制约中来分析问题,对统计分析具有重要的指导意义。  数量关系分析方法是运用统计学中论述的方法对社会经济现象的数量表现,包括社会经济现象的规模、水平、速度、结构比例、事物之间的联系进行分析的方法。如对比分析法、平均和变异分析法、综合评价分析法、结构分析法、平衡分析法、动态分析法、因素分析法、相关分析法等。在写好统计数据分析报告的同时,在统计数据人员的心里也就有了一本非常明确的帐目,这对帮助行领导决策与金融系统的资金计划工作起了很大的作用,所以这份报告的重要性不可小觑。作者:王钰淇 林勤 魏瑞单位:中国农业发展银行房县支行地址:湖北省十堰市房县神农路96号农业发展银行房县支行

统计学论文数据分析总结

基本信息描述

《统计学与应用》这本期刊上的文献,你可以去看看学习学习的

摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整  Distribution of Small Sample DW Statistic  Zhang Xiaotong1 Zhao Chuxiao2  ( Institute of International Economics, Nankai University, Tianjin 300071)  ( Management School, Tianjin University, Tianjin 300072)  Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration  1.概述  八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。  本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一 所涉及的两个变量都取自I(1)过程;二 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三 所涉及的两个变量都取自I(0)过程。  在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。  本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。  2.DW统计量的极限分布  给定如下随机数据生成系统,  yt = yt-1 + ut , y1 = 0, (1)  xt = xt-1 + vt , x1 = 0, (2)  其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。  建立如下回归模型:  yt = b0 + b1xt + wt (3)  当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量,  (4)  因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有  DW Þ   即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。  3.小样本DW分布的蒙特卡罗模拟及其结果分析  当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。  以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。  由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。  首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一 DW(0,0)分布的均值为2,不受样本容量大小的影响;二分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三 随着样本容量的增大,分布的标准差逐步减小。  见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一 分布均为右偏态,分布左侧有端点,端点为零;二 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。  表一 DW分布的蒙特卡罗模拟结果  类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量  1 90 95 99  10 22 18 45 81 28 62 50 74  DW(1,1) 20 11 28 49 80 75 39 68 61  30 09 90 04 39 51 29 07 73  40 06 77 88 16 41 25 06 10  50 05 59 71 98 33 20 16 31  10 18 73 02 38 98 53 73 59  20 09 02 21 59 56 34 22 61  DW(1,0) 30 06 70 83 18 38 24 27 43  40 04 54 66 91 30 19 25 68  50 04 45 54 71 24 15 12 84  DW(0,0) 10 31 75 97 24 02 57 00 17  40 72 41 53 70 00 31 03 06  注: DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值   DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。   DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。   在每个样本容量条件下各模拟1000次。  图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图  在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt&nb  1、统计范围  GDDS将国民经济活动划分为五大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标,鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。  规定的数据类别包括:(1)来自综合框架中的核心部分,如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量;(2)追踪分析统计类目,如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计;(3)与该部门相关的统计指标,如实际部门的劳动市场和价格指数统计;(4)社会人口数据,包括人口、保健、教育、卫生等方面统计。  除规定的数据类别以外,GDDS鼓励成员国发布更多的统计信息,以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标,财政部门列出利息支付和偿债预计数据等。  GDDS认为,系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌,并使各国数据的范围更加一致。但是,将一些由私人机构编制的数据包括在系统内会增加工作的复杂性,比如由官方转发这些数据隐含着对这些数据质量的认可,官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。  2、公布频率  公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如, GDDS要求国民帐户、国际收支平衡表按年公布,广义货币概览按月公布,汇率则每日公布。  3、公布及时性  公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限,如按季度统计的GDP数据规定在下一季度内发布,按月度统计的生产指数规定在6周至3个月内公布。  GDDS将选定的数据类别分为规定性和鼓励性两类,目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的,条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”,即成员国认为该项统计不符合本国实际的,可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。  GDDS有关数据方面的内容及要求如下:  GDDS的数据规范  A、综合框架  核心框架  范围、分类和分析框架  受鼓励的扩展  频率  及时性  国民帐户  编制和公布全套的名义和实际国民帐户总量和平衡项目,得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表  年度  10-14个月  中央政府操作  编制和公布交易和债务的综合数据,需强调:1)包括所有的中央政府单位;2)使用适当的分析框架;3)建立一整套详细的分类标准(税收和非税收收入、经常性和资本性支出、国内及国外融资),并适当细分(根据债务持有人、债务工具和币种)。  广义政府或公共部门操作数据,在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。  年度  6-9个月  广义货币概览  编制和公布综合的数据,需强调:1)包括所有的存款公司(银行机构);2)使用适当的分析框架;3)建立对外资产和负债、按部门分类的国内信贷以及货币(流动性)和非货币债务构成的分类标准。  月度  2-3个月  国际收支  编制和公布综合的国际收支主要总量数据和平衡项目,包括:货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额,并适当进行细分。  国际投资头寸和总体经济外债数据(如果这些数据具有重要的分析和政策意义)  年度  6-9个月  GDDS的数据规范  B、数据类别和指标  数据类别  核心指标  受鼓励的总量及构成  频率  及时性  实际部门  国民帐户总量  国内生产总值(名义和实际)  国民总收入、资本形成、储蓄  年度(鼓励季度)  6-9个月  生产指数  制造业或工业  初级产品、农业或其他指标  视具体情况  月度  视具体情况  所有指标都为6周-3个月  价格指数  消费者价格指数  生产者价格指数  月度  1-2个月  劳动力市场指标  就业、失业,工资/收入,视具体情况  年度  6-9个月  财政部门  核心指标  受鼓励的指标  频率  及时性  中央政府预算总量  收入、支出、差额和融资,视具体情况进行细分(根据债务持有人、债务工具和币种)  利息支付  季度  1个季度  中央政府债务  内债和外债,视具体情况适当细分(按币种、期限、债务持有人和债务工具)  政府担保债务  年度(鼓励季度)  1-2个季度  金融部门  核心指标  受鼓励的指标  频率  及时性  广义货币和信贷总量  净对外头寸、国内信贷、广义或狭义货币  月度  1-3个月  中央银行总量  储备货币  月度  1-2个月  利率  短期和长期政府债券利率,政策可变利率  货币或银行间市场利率及一套存贷款利率  月度  高频率(如月度)  股票市场  股票价格指数,视具体情况  月度  对外部门  核心指标  受鼓励的指标  频率  及时性  国际收支总量  货物和服务的进口和出口、经常帐户差额、储备、总差额  总体经济的外债和偿债数据,视具体情况  年度(十分鼓励季度)  6个月  国际储备  以美元标价的官方储备总额  与储备有关的负债  月度  1-4周  商品贸易  总进口和总出口  较长时间的主要商品的分类  月度  8周-3个月  汇率  即期汇率  每日  高频率(如月度)  社会-人口数据  核心指标  频率  人口  人口;人口增长率;城市人口;农业人口;人口性别;人口的年龄构成  各国公布频率会各不相同;及时性  保健  每个医生照顾人口数;预期寿命;婴儿/儿童/产妇死亡率  也不尽相同  教育  成年人文盲率、学生-教师比率、小学/中学入学率  贫困状况  获得洁净水的情况、卫生;每个房间居住的人数;收入分配;最低收入标准以下的家庭数  二、公布数据的质量  GDDS从两个方面的内容来评估公布的统计数据质量,即:提供统计数据的文字说明和提供统计数据的交叉检验。  统计数据质量是个难以界定、因而不易评估的概念。为了便于检查,GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式,包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明(例如,数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等)。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法,以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验,规定在统计框架内公布有关总量数据的分项,公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据,例如,作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。  与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个:(1)针对已发现不全的改进计划;(2)最近实施的改进措施;或(3)国家认定不  四、公众获取  GDDS规定要提前公布数据发布日期,并向各方同时发送。  官方统计数据的公布是统计数据作为一项公共产品的基本特征之一,及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划:一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据,又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标,时间表表明不迟于某个既定时间;对于公布频率更高的数据,则可确定一个日期范围,如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品,因此GDDS规定应向所有有关方同时发布统计数据,以体现公平的原则。发布时可先提供概括性数据,然后再提供详细的数据,当局应至少提供一个公众知道并可以进入的地方,数据一经发布,公众就可以公平地获得。

数据分析论文总结报告

论文的格式都是基本相当的 1、论文格式的论文题目:(下附署名)要求准确、简练、醒目、新颖。 2、论文格式的目录 目录是论文中主要段落的简表。(短篇论文不必列目录) 3、论文格式的内容提要: 是文章主要内容的摘录,要求短、精、完整。字数

在实验报告中,要建立一份图表,这样更直观的反映实验数据的内在规律性,以便于归纳总结。先建立统计表,然后对表中数据建立图表,根据图表的趋势分析总结实验的内在规律性。

以下结构,仅供参考目录:提现数据分析报告的整体架构前言前言部分就和写论文时候的Abstract类似: 要写出做这次分析报告的目的和背景 略微阐述现状或者存在的问题 通过这次分析需要解决什么问题 运用了什么分析思路,分析方法和模型 给出总结性的结论或者效果 给出数据来源正文:逻辑性强现实状况的给出和论证一定要严谨合理,逻辑性强。这正是数据分析师存在的意义。架构清晰分析报告的架构体现了分析师的分析思路的框架,一定要显而易见,符合常识。思路最好不要出现跳跃的地方,以免出现阅读障碍,令读者不知所云。一步一步得出结论,给出观点。结论明确数据的结论一定是要从数据中得出来,要严谨的切合数据分析的主题,最好一个分析模块只给出一个最直接最和主题关联的分析结论。一个特征当然可以从多个角度提取出多个观点和结论,但是一定要选择和主题相关性最强的那个,不然大量的低相关信息会很容易打乱读者的思路。可视化人都是视觉动物,一图胜千言。在数据报告中需要大量地使用各种图表而非文字,图表能够一步到位的将数据呈现在读者面前,大部分时候无需做多余的解释。术语根据读者的不同决定是否要解释报告中的分析方法和术语。

统计学论文数据分析总结表

摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整  Distribution of Small Sample DW Statistic  Zhang Xiaotong1 Zhao Chuxiao2  ( Institute of International Economics, Nankai University, Tianjin 300071)  ( Management School, Tianjin University, Tianjin 300072)  Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration  1.概述  八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。  本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一 所涉及的两个变量都取自I(1)过程;二 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三 所涉及的两个变量都取自I(0)过程。  在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。  本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。  2.DW统计量的极限分布  给定如下随机数据生成系统,  yt = yt-1 + ut , y1 = 0, (1)  xt = xt-1 + vt , x1 = 0, (2)  其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。  建立如下回归模型:  yt = b0 + b1xt + wt (3)  当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量,  (4)  因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有  DW Þ   即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。  3.小样本DW分布的蒙特卡罗模拟及其结果分析  当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。  以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。  由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。  首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一 DW(0,0)分布的均值为2,不受样本容量大小的影响;二分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三 随着样本容量的增大,分布的标准差逐步减小。  见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一 分布均为右偏态,分布左侧有端点,端点为零;二 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。  表一 DW分布的蒙特卡罗模拟结果  类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量  1 90 95 99  10 22 18 45 81 28 62 50 74  DW(1,1) 20 11 28 49 80 75 39 68 61  30 09 90 04 39 51 29 07 73  40 06 77 88 16 41 25 06 10  50 05 59 71 98 33 20 16 31  10 18 73 02 38 98 53 73 59  20 09 02 21 59 56 34 22 61  DW(1,0) 30 06 70 83 18 38 24 27 43  40 04 54 66 91 30 19 25 68  50 04 45 54 71 24 15 12 84  DW(0,0) 10 31 75 97 24 02 57 00 17  40 72 41 53 70 00 31 03 06  注: DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值   DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。   DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。   在每个样本容量条件下各模拟1000次。  图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图  在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt&nb  1、统计范围  GDDS将国民经济活动划分为五大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标,鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。  规定的数据类别包括:(1)来自综合框架中的核心部分,如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量;(2)追踪分析统计类目,如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计;(3)与该部门相关的统计指标,如实际部门的劳动市场和价格指数统计;(4)社会人口数据,包括人口、保健、教育、卫生等方面统计。  除规定的数据类别以外,GDDS鼓励成员国发布更多的统计信息,以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标,财政部门列出利息支付和偿债预计数据等。  GDDS认为,系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌,并使各国数据的范围更加一致。但是,将一些由私人机构编制的数据包括在系统内会增加工作的复杂性,比如由官方转发这些数据隐含着对这些数据质量的认可,官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。  2、公布频率  公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如, GDDS要求国民帐户、国际收支平衡表按年公布,广义货币概览按月公布,汇率则每日公布。  3、公布及时性  公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限,如按季度统计的GDP数据规定在下一季度内发布,按月度统计的生产指数规定在6周至3个月内公布。  GDDS将选定的数据类别分为规定性和鼓励性两类,目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的,条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”,即成员国认为该项统计不符合本国实际的,可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。  GDDS有关数据方面的内容及要求如下:  GDDS的数据规范  A、综合框架  核心框架  范围、分类和分析框架  受鼓励的扩展  频率  及时性  国民帐户  编制和公布全套的名义和实际国民帐户总量和平衡项目,得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表  年度  10-14个月  中央政府操作  编制和公布交易和债务的综合数据,需强调:1)包括所有的中央政府单位;2)使用适当的分析框架;3)建立一整套详细的分类标准(税收和非税收收入、经常性和资本性支出、国内及国外融资),并适当细分(根据债务持有人、债务工具和币种)。  广义政府或公共部门操作数据,在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。  年度  6-9个月  广义货币概览  编制和公布综合的数据,需强调:1)包括所有的存款公司(银行机构);2)使用适当的分析框架;3)建立对外资产和负债、按部门分类的国内信贷以及货币(流动性)和非货币债务构成的分类标准。  月度  2-3个月  国际收支  编制和公布综合的国际收支主要总量数据和平衡项目,包括:货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额,并适当进行细分。  国际投资头寸和总体经济外债数据(如果这些数据具有重要的分析和政策意义)  年度  6-9个月  GDDS的数据规范  B、数据类别和指标  数据类别  核心指标  受鼓励的总量及构成  频率  及时性  实际部门  国民帐户总量  国内生产总值(名义和实际)  国民总收入、资本形成、储蓄  年度(鼓励季度)  6-9个月  生产指数  制造业或工业  初级产品、农业或其他指标  视具体情况  月度  视具体情况  所有指标都为6周-3个月  价格指数  消费者价格指数  生产者价格指数  月度  1-2个月  劳动力市场指标  就业、失业,工资/收入,视具体情况  年度  6-9个月  财政部门  核心指标  受鼓励的指标  频率  及时性  中央政府预算总量  收入、支出、差额和融资,视具体情况进行细分(根据债务持有人、债务工具和币种)  利息支付  季度  1个季度  中央政府债务  内债和外债,视具体情况适当细分(按币种、期限、债务持有人和债务工具)  政府担保债务  年度(鼓励季度)  1-2个季度  金融部门  核心指标  受鼓励的指标  频率  及时性  广义货币和信贷总量  净对外头寸、国内信贷、广义或狭义货币  月度  1-3个月  中央银行总量  储备货币  月度  1-2个月  利率  短期和长期政府债券利率,政策可变利率  货币或银行间市场利率及一套存贷款利率  月度  高频率(如月度)  股票市场  股票价格指数,视具体情况  月度  对外部门  核心指标  受鼓励的指标  频率  及时性  国际收支总量  货物和服务的进口和出口、经常帐户差额、储备、总差额  总体经济的外债和偿债数据,视具体情况  年度(十分鼓励季度)  6个月  国际储备  以美元标价的官方储备总额  与储备有关的负债  月度  1-4周  商品贸易  总进口和总出口  较长时间的主要商品的分类  月度  8周-3个月  汇率  即期汇率  每日  高频率(如月度)  社会-人口数据  核心指标  频率  人口  人口;人口增长率;城市人口;农业人口;人口性别;人口的年龄构成  各国公布频率会各不相同;及时性  保健  每个医生照顾人口数;预期寿命;婴儿/儿童/产妇死亡率  也不尽相同  教育  成年人文盲率、学生-教师比率、小学/中学入学率  贫困状况  获得洁净水的情况、卫生;每个房间居住的人数;收入分配;最低收入标准以下的家庭数  二、公布数据的质量  GDDS从两个方面的内容来评估公布的统计数据质量,即:提供统计数据的文字说明和提供统计数据的交叉检验。  统计数据质量是个难以界定、因而不易评估的概念。为了便于检查,GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式,包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明(例如,数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等)。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法,以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验,规定在统计框架内公布有关总量数据的分项,公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据,例如,作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。  与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个:(1)针对已发现不全的改进计划;(2)最近实施的改进措施;或(3)国家认定不  四、公众获取  GDDS规定要提前公布数据发布日期,并向各方同时发送。  官方统计数据的公布是统计数据作为一项公共产品的基本特征之一,及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划:一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据,又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标,时间表表明不迟于某个既定时间;对于公布频率更高的数据,则可确定一个日期范围,如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品,因此GDDS规定应向所有有关方同时发布统计数据,以体现公平的原则。发布时可先提供概括性数据,然后再提供详细的数据,当局应至少提供一个公众知道并可以进入的地方,数据一经发布,公众就可以公平地获得。

《统计学与应用》这本期刊上的文献,你可以去看看学习学习的

统计学论文数据分析报告

《统计学与应用》这本期刊上的文献,你可以去看看学习学习的

指标选择,统计原理,统计方法选择,统计结果,分析讨论等等。

  • 索引序列
  • 统计学论文数据分析总结报告
  • 统计学论文数据分析总结
  • 数据分析论文总结报告
  • 统计学论文数据分析总结表
  • 统计学论文数据分析报告
  • 返回顶部