• 回答数

    5

  • 浏览数

    337

~凭凑不齐~
首页 > 论文问答 > 金融数据挖掘论文

5个回答 默认排序
  • 默认排序
  • 按时间排序

忘心敛意

已采纳
金融数据挖掘案例教学:VaR的定义、计算与应用目前,金融资产市场风险(也包括信用风险和操作风险)的通用度量工具为Value at Risk(VaR,在险价值),在几个巴塞尔协议形成后,用VaR度量金融风险更是受到普遍关注。建立金融风险的准确的VaR度量很不容易,本案例通过美元指数市场风险VaR度量模型的建立、及不同VaR模型对银行监管资本要求的影响展开研究,通过案例对VaR的定义、计算与应用作较全面的介绍。一、 VaR的定义设在某一持有期时金融资产的收益率的分布函数为 ,密度函数为 ,对给定的置信水平 ,在险价值的定义为:VaR的含义:VaR是一定置信水平下,一定持有期中,金融资产可能遭受的最大损失。由于VaR与收益率的分布函数(密度函数)密切相关,特别是与分布函数(密度函数)的尾部性质密切相关,因此VaR模型的准确与否就与我们对金融资产收益率过程的描述的准确与否、特别是与收益率过程的尾部特征的描述的正确与否密切相关。由于这种描述很困难,因此建立准确的VaR模型是很不容易的。二、单一资产(资产组合)的VaR模型的构建方法1、 历史模拟法基本思想:金融资产收益率的变化具有某种稳定性,因此可以用过去的变化情况对未来进行预测。案例1:基于历史模拟法的那斯达克指数的VaR模型的构建,取置信水平为99与95。计算2004年度单位货币的那斯达克指数的每日在险价值,并实际检验模型的预测准确性。数据:那斯达克指数的每日收盘价的收益率时间跨度:19850711~20050923共5115个日收益率数据,收益率采用对数收益率。方法:取300个数据的移动窗口,对每个窗口数据排序后取第3个(第15个)数据作为VaR预测值,窗口移动250次,则可以得到250日中的每日VaR预测值。Sas程序:初始数据库为sjkData a; set sjk ; run;Data a; modify a; if _n_>300 then remove;Run;Proc sort data=a;by r; run;Data a; modify a; if _n_<3 or _n_>3 then remove; run;Data b; set c a;run;Data c; set b; run;Data sjk; modify sjk; if _n_=1 then remove; run;历史模拟方法的缺陷分析VaR模型预测准确性的检验方法(事后检验方法)置信水平99,如果模型准确,则例外发生应该服从 , 的二项分布。如果例外数为 ,只要计算 就可知道模型是否高估风险;只要计算 就可知道模型是否低估风险。Sas程序Data a; X=probbnml(01,250,k);Y=1-probbnml(01,250,k-1);run;历史模拟方法通常存在高估风险价值的缺陷,尤其当显著性水平取的很高时,对银行来说,这会提高监管资本要求。从理论上看,历史模拟法也有很大缺陷。2、 参数方法假设 具有某种形式的分布,其中参数需要估计,利用VaR的定义得到VaR预测值。参数方法建立VaR模型是最常见形式,例如JP摩根公司开发的Riskmetrics就是采用参数方法。首先想到假设收益率服从正态分布,只要估计均值与标准差,就可得到VaR预测值。如果 ,则 利用正态分布计算在险价值的方法①、利用移动窗口方法计算每个窗口对应的均值与标准差;②、利用均值与标准差得到每日的VaR预测值。③、巴塞尔协议要求用一年的数据计算VaR,我们用一年数据构造移动窗口。案例2:基于参数方法和正态分布假设的那斯达克指数的VaR模型的构建,置信水平为99与95。计算2000年度单位货币的那斯达克指数每日的在险价值,并实际检验模型的预测准确性。Sas程序(数据库sjk,为简洁起见,只用收益率数据)Data a; set sjk ; run;Data a; modify a; if _n_>254 then remove;Run;Proc means data=a;Output out=b mean=mr std(r)=stdr;run;Data b1; set c b;run;Data c; set b1; run;Data sjk; modify sjk; if _n_=1 then remove; run;Data c1;set c;Var=33*stdr-mr; run;对模型预测的检验结果:在252个观测值中有11个例外,模型存在低估市场风险的现象。那么为什么会出现这样的现象。3、 金融资产收益率的特征分析金融资产收益率通常存在两个显著的特征:①、波动的时变性、或者说波动的集聚性,比较那斯达克指数的收益率图形与正态分布的图形可以明显地看到这一点; data a; set sjk;z=normal(17); z1=_n_; run;由于波动具有时变性,因此正态假设不合适,或者说对标准差的估计方法不合适。比较合理的改进方式是,在估计分布的方差时,近期数据应该具有更大的权重。JP摩根公司采用加权方式估计方差,一般的方差估计表达式为: 即在估计方差时,每个离差具有相同的权重1/254,而JP摩根公司采用的方差估计式为: 如在Riskmetrics中取 。 案例3:建立基于加权正态模型的那斯达克指数的VaR,置信水平为99与95。计算2000年度单位货币的那斯达克指数每日的在险价值,并检验模型的预测准确性。原始数据库sjk,均值数据库aa,权重数据库bbSas程序(sjk)Data a; set sjk;run;Data a; modify a;if _n_>254 then remove;run;Data a1; set aa; run;Data a1; modify a1; if _n_>254 then remove; run;Data c1; merge a a1 bb; run;Data b1; set c1; r1=q*(r-mr)**2; run;Proc means data=b1;Output out=b mean(r1)=mr1; run;Data c2; set c b; run;Data c; set c2; run;Data sjk; modify sjk; if _n_=1 then remove;run;Data aa; modify aa; if _n_<255 then remove; run;Data cc; set c; Stdr1=sqrt(254*mr1); run;检验结果:例外数为7个,模型为“不准确模型”②、金融资产收益率分布的厚尾性,比较那斯达克指数的收益率数据的经验分布的尾部与正态分布的尾部,可以明显地看到这一点。Data a; set sjk;P=probnorm((r+000154)/0256);run;利用1999-2001年度的数据,可以看到明显的厚尾现象利用参数方法建立VaR模型时,应该考虑两个因素:波动的时变性与厚尾性要提高VaR模型的预测准确性,就要采用适当的统计模型来描述收益率的波动特征,模型既要能够反映波动的时变性、又要能够反映波动的厚尾性。现有研究对前一个特征考虑较多,通常的方式是采用GARCH模型(广义自回归条件异方差模型)来描述收益率过程。GARCH模型是Bollerslev(1986)提出的,GARCH模型是对ARCH模型的拓展。假设收益率服从 阶自回归模型,即 ,Bollerslev对 的假设是 。GARCH模型可用较少的参数捕捉方差的缓慢变化。在建立VaR模型时,通常采用的是GARCH(1,1)模型,其形式为 许多研究者在建立描述收益率的统计模型过程中,假设 ,甚至假设 ,这是不合适的(方差过程设置错误不会影响均值过程,而均值过程设置错误会影响方差过程)。因此,应该首先需考虑均值过程,再考虑方差过程。许多实证研究显示,采用GARCH(1,1)模型描述收益率过程可以提高VaR的预测精度,这是因为与正态假设相比,GARCH(1,1)模型能够更好地描述收益率过程,但是实证研究同时发现,当置信水平较高时(如99),采用GARCH(1,1)模型建立的VaR模型仍然存在低估风险的现象。原因分析:事件风险造成价格的暴涨暴跌,这是波动过程出现厚尾现象的重要原因,而GARCH(1,1)模型不能反映由事件风险造成的暴涨暴跌,因此不能完全反映厚尾现象,这就造成模型对风险的低估。波动过程不是由一个统计模型描述,而是由两个模型所描述——体制转换模型。对收益率数据的自相关-偏自相关分析的方法sas程序proc autoreg data=a;model r=t / dw=10 dwprob; run;也可以采用Eviews软件进行分析quick/series tatistics/corrlogramGARCH模型参数估计方法Quick/estimation equation /选择ARCH,输入被解释变量名,/options 选择Heteroskedasticity 可得到稳健的标准差连续计算GARCH模型中的时变的方差sas程序data b; set a;z=w+a1*x+b1*lag(y);run;data b; modify b;if _n_<2 or _n_>2 then remove; run;data b1; set c b; run;data c; set b1; run;data b1; set b; y=z; run;data b; set b1; run;data a; modify a; if _n_<3 then remove; run;data b1; set b a; run;data a; set b1; run;注意:数据库为A,结构为 对于 可按照 计算补充知识: ARCH与GARCH模型一、 阶自回归模型随机过程可分为平稳过程与非平稳过程。平稳过程的均值、协方差不随时间变化。自回归模型是对平稳过程产生的时间序列进行建模的方法。1、 阶自回归模型有效市场假设 是独立过程,实际上 存在自相关性,如果存在 阶自相关, 可用如下形式表示: ,其中 与 相互独立、服从独立同分布的正态分布。2、移动平均模型如果 为它的当前与前期随机误差项的线性函数,即 ,则称时间序列 为移动平均序列。3、自回归移动平均过程 。4、自相关与偏自相关对时间序列进行建模,首先需判断其服从什么过程。这就涉及自相关、偏自相关的概念,k阶自相关系数定义为: 。k阶偏自相关系数的定义:偏自相关是指在给定 的条件下, 与 的条件相关关系。其计算式为: , 。二、模型的识别1、自回归模型的识别自回归模型 的偏自相关系数是 步截尾的,而其自相关系数则呈指数或正弦波衰减,具有拖尾性;平均移动模型 的自相关系数是 步截尾的,而其偏自相关系数则呈指数或正弦波衰减,具有拖尾性。自回归平均移动过程的自相关系数、偏自相关系数均呈指数或正弦波衰减,具有拖尾性。2、模型识别的例利用2002年度美元指数收盘价的对数收益率数据a1、2002年度那斯达克指数收盘价的对数收益率数据b1分别判断其所满足的模型。计算自相关系数、偏相关系数的Eviews方法:quick / series statistics / correlogram / r利用GDP数据c1进行模型识别由于其一阶自相关系数、前二阶的偏自相关系数显著地不等于零,可建立自回归移动平均模型ARMA(2,1)。即 ARMA(2,1)模型参数估计的Eviews方法Qick/Estimate Equation/rr ar(1) ar(2) ma(1)注意在时间序列模型分析中,对参数的t检验不像一般回归模型中那样重要,主要是考虑模型整体的拟合效果。三、ARCH与GARCH模型在自回归模型中假设时间序列由平稳过程产生,即产生时间序列的随机过程具有不随时间变化的均值与标准差。实际上,由于金融资产收益率具有波动的时变性,即产生时间序列的随机过程的二阶矩随时间而变化,因而随机过程不是一个平稳过程,不适合直接采用以上的分析方法。现在需要建立自回归条件异方差模型(ARCH模型)和广义自回归条件异方差模型(GARCH模型)。1、ARCH模型该过程由Engle(1982)发展起来,目的是解决随时间而变化的方差问题。它经常用于对金融资产的收益率的波动性进行建模。假设收益率服从 阶自回归模型,即 , 服从均值为0,方差为 的正态分布, 取决于 过去值的平方。 阶自回归条件异方差模型ARCH( )的形式 ,其中 为未知的正系数。在ARCH模型中, 随时间而变化,如果近期平方误差很大,则当前平方误差也会较大,即 为较大;反之,如果近期平方误差很小,在当前平方误差也会较小;通过这种方式表示波动的集聚性。2、GARCH模型Bollerslev(1986)提出的GARCH模型扩展了ARCH模型,假设收益率服从 阶自回归模型,即 ,Bollerslev对 的假设是 与ARCH模型相比,GARCH模型可以利用更少的参数捕捉到方差的缓慢变化。从理论上讲,由于不同金融资产收益率的波动布变性不同,因此某种资产收益率究竟服从哪种GARCH也需要进行判别,实际上,很多金融资产的收益率服从GARCH(1,1)模型,即 。注意这个式子表明,第t天的方程 由第t-1天的二个值 决定,其中残差 的估计值为 ,而 可递推得到。特别地有 。利用这样的方式计算方差,实际上隐含着假设,方差的波动方式在训练时期与计算时期是一致的。由于在对收益率建立GARCH(1,1)模型时,自回归模型的准确设置与否会直接影响到GARCH模型的参数估计,因此必须正确建立均值过程再建立方差过程。3、GARCH模型的参数估计方法如果金融资产的收益率服从p阶自回归及GARCH(1,1)过程,则Eviews方式为quik / Estimate Equation例: n1给出那斯达克收盘价的对数数据,试用适当的方式建立模型。解:股票市场一般服从随机游走过程,但是其方差具有波动性,因此lp lp(-1)出的哪本《金融数据挖掘》你也买来自己看看
195 评论

瞪样的胖子

数据挖掘本身是统计学、计算机科学、机械智能等多学科交叉而形成的,研究方向很多。建议结合自己的兴趣进行选择。推荐的几个方向有:金融数据挖掘与分析;模式识别;支持向量机;聚类算法研究;智能决策支持系统研究;数据挖掘理论研究等。这些方向都有待于开拓和深入,认真投入时间肯定会有所建树的。与君共勉!

316 评论

浪费粮食的满福

学术堂整理了十五个金融经济学方面和证券有关的论文题目:  1、我国金融业综合化经营与监管问题探析  2、中国股指期货投资的风险管理  3、中国股指期货推出后对股票市场的影响  4、外资银行在中国设立分支机构所要求的经营环境研究  5、股权投资基金研究  6、证券投资基金业绩评价研究  7、认股权证定价的实证研究  8、股指期货交易策略研究  9、物流金融发展研究  10、黄金市场投资策略研究  11、高新技术企业融资困境及其对策研究  12、我国证券市场内幕交易研究  13、期货价格与现货价格的关系研究  14、中国股票市场“政策市”表现及原因探析  15、股票发行制度创新研究

147 评论

宠儿520520

1、房产税改革与房价变动的宏观经济效应——基于DSGE模型的数值模拟分析2、基础设施、融资依赖与地区出口比较优势3、人口结构能解释经常账户平衡吗4、基于货币市场压力指数的银行危机预警研究5、宏观金融风险联动综合传染机制6、中国证券公司净资本比率顺周期性实证研究7、中国证券公司股权结构、市场结构与成本效率的实证研究8、中国银行次级债发行时的“风险定价”与市场约束臆想9、关联贷款与商业银行的薪酬契约——基于我国商业银行的经验证据10、中国商业银行网点布局绩效研究——基于主要商业银行的比较11、税率变动、破产成本与资本结构非对称调整12、授信额度与投资效率13、投资经验能够改善股民的收益状况吗——基于股民交易记录数据的研究14、信息优势、择时行为与大股东内幕交易15、医疗保险中的道德风险研究——基于微观数据的分析

280 评论

gell墨脱

学术堂整理了十五个新颖的金融经济学论文题目供大家进行参考:  1、经典金融经济学理论体系若干矛盾与重构思考  2、经济金融化与金融经济学的发展  3、汇率调整对我国贸易收支影响的金融经济学分析  4、“国进民退”的五大后果——专访耶鲁大学金融经济学终身教授陈志武  5、对金融经济学的发展金融深化论  6、金融经济学十讲  7、货币金融经济学  8、金融经济学的研究范式及其演进——行为金融与标准金融研究范式之比较  9、经济泡沫与泡沫经济——一个基于金融经济学的考察视角  10、理查德·罗尔对金融经济学的贡献  11、马克思主义认识论的数学描述及其在金融经济学中的一个应用  12、金融经济学课程教学改革与实践探索  13、基于金融经济学的股票市场稳定研究  14、金融经济学教程  15、金融经济学研究的国际动态——基于1990—2011年间《金融学期刊》刊发论文的统计分析

146 评论

相关问答

  • 金融数据挖掘论文

    学术堂整理了十五个新颖的金融经济学论文题目供大家进行参考:  1、经典金融经济学理论体系若干矛盾与重构思考  2、经济金融化与金融经济学的发展  3、汇率调整对

    北条真理 4人参与回答 2024-05-17
  • 数据挖掘论文

    数据挖掘是从大量数据中提取人们感兴趣知识的高级处理过程, 这些知识是隐含的、 事先未知的, 并且是可信的、 新颖的、 潜在有用的、 能被人们理解的模式。随着信息

    天棚元帅 3人参与回答 2024-05-15
  • 数据挖掘类论文

    数据挖掘是从大量数据中提取人们感兴趣知识的高级处理过程, 这些知识是隐含的、 事先未知的, 并且是可信的、 新颖的、 潜在有用的、 能被人们理解的模式。随着信息

    2岁半的猫 3人参与回答 2024-05-16
  • 大数据与数据挖掘论文

    获得学位意味着被授予者的受教育程度和学术水平达到规定标准的学术称号, 经在高等学校或科学研究部门学习和研究,成绩达到有关规定,由有关部门授予并得到国家社会承认的

    sml90050056 4人参与回答 2024-05-18
  • 数据挖掘导论论文

    数据挖掘导论数据挖掘:概念与技术数据挖掘实用机器学习技术Web数据挖掘机器学习 Tom Michell数据挖掘十大算法统计学习基础:数据挖掘、推理与预测= Th

    豆浆煮菠菜 5人参与回答 2024-05-17