平衡损失下线性模型系数参数的平衡岭估计
0 引言
设有线性模型
y=Xβ+ε,E(ε)=0,Cov(ε)=δ2In
综上所述,知识可视化与网络媒介素养教育二者在互联网技术高度发达的信息社会中结合,能够实现网络技术更好地促进人的发展,实现人们在高技术环境下能够获得丰富的知识、方便的交流,从而实现自身的发展,最终实现智慧的技术环境,培养智慧的人的目标。
(1)
其中y为n维观测向量,X为n×p阶矩阵,rank(X)=r≤p,In为n×n阶单位矩阵,β∈RP,δ2>0为未知参数.模型(1)中β的最小二乘估计为
最小二乘估计的基本思想是使得偏差向量ε=y-Xβ的长度平方‖y-Xβ‖2达到最小,这是充分考虑了线性模型的拟合优度.在统计决策理论基础上,常用二次损失函数考虑估计的精度.
为了使得在考虑拟合优度的情况下,兼顾估计的精度,Zellner[1]提出了平衡损失函数概念,
由于累加后,阴影区数值不统一,选择 [重分类]工具,将sh_all数据分类成 “阴影栅格”(值为 l)与 “非阴影栅格”(值为0)两类,如图10。
S(d-β)
其中0≤ω≤1,S>0.已知,使其达到最小的d即为所求.将拟合优度与估计精度做了综合考虑,此后关于平衡损失下对估计其风险进行了诸多研究[2-11].
1 平衡岭估计概念
引理1.1[12] (奇异值分解定理) 设X为n×p阶矩阵,rank(X)=r,则存在两个正交矩阵Pn×n,Qn×n使得
其中Λr=diag(λ1,λ2,…,λn),λi>0
为X′X的非零特征值.
引理1.2[13] 对于线性模型(1),设Cβ可估,则Ay~Cβ,即Ay是Cβ的可容许估计的充分必要条件是
(1)A=AX(X′X)-X′
(2) AA′≤AX(X′X)-C′
基于Zellner的平衡损失思想,在设计矩阵不满秩情况下,同时考虑到拟合优度及岭估计精度,为此构造平衡损失函数:
(2)
定义1.1 对于线性模型y=Xβ+ε,E(ε)=0,Cov(ε)=δ2In,且rank(X)=r<p,k>0,0≤ω≤1,若满足
1.4 统计学方法 采用SPSS 16.0软件进行分析,计量资料以x-±s表示。组间比较用单因素方差分析或非参数检验。相关性分析用Pearson相关分析,P<0.05为差异有统计学意义。
则称为β的平衡岭估计.
定理1.1 对于线性模型y=Xβ+ε,
E(ε)=0,Cov(ε)=δ2In,且rank(X)=r<p,k>0,0≤ω≤1,在平衡损失函数Q(β)下的平衡岭估计
(3)
证明 由定义,将(2)式展开,
Q(β)=ωy′y-2ωy′Xβ+ωβ′X′Xβ+(1-ω)y′X(X′X+kIp)-2X′y+(1-ω)β′β-
2(1-ω)(X′X+kIp)-1β′X′y
对β求偏导,令其为零,可得以下等式
得到以下方程组
(ωX′X+(1-ω)Ip)β=ωX′y+(1-ω)(X′X+kIp)-1X′y
(4)
由于
(1-ω)(XX+kIp)-1X′y=(1-ω)(X′X+kIp)(X′X+kIp)-2X′y=(1-ω)(X′⋮
本调查共抓取到高职高专院校图书馆招聘信息66条,占抓取到的招聘信息总量的13.1%。高职高专院校图书馆招聘的自由度不如本科院校,以事业单位招聘为主。
(X′X+kI)-2X′y∈R(X′⋮Ip)
=R(wX′X+(1-ω)Ip)
定理2.2 对于线性模型(1),而且rank(X)=r<p,任意k>0,0≤ω≤1,则有:
且
ωX′y∈R(X′)=R(X′X)=R(ωX′X)⊂R(ωX′X+(1-ω)Ip)
定理2.1 对于线性模型(1),而且rank(X)=r<p,任意k>0,0≤ω≤1,则有:
所以
(1-ω)(X′X+kIp)-1X′y+ωX′y∈R(ωX′X+(1-ω)Ip)
故方程(4)是相容的,其解为:
对于任意的b
由(4)式,上式最后一项等于零.从而有
读万卷书,行千里路,是每个文人的梦想。但在那个时代,没有祖荫庇护,或是天上掉馅饼,只能是梦想。李白二十五岁时离家远游,一游就是十七年。游踪遍及长江、黄河下游地区,风景宜人处都留下深深的足迹。那足迹上留下的是诗名,还有散发着酒味、豪气,给人留下梦幻般的回忆。多么畅快的旅行啊!结交当地名士,或饮酒作诗,或邀伴同游,而且往往出手大方得惊人。
所以是β的平衡岭估计,证毕.
2 平衡岭估计的优良性
由于设计矩阵X不满秩,即rank(X)=r<p,所以线性模型(1)的系数β是不可估的.而任意可估函数C′β均可表示为Xβ的平衡岭估计优良性及可容许性.
由引理1.1,将设计矩阵X进行奇异值分解
且记P=(P1⋮P2),Q=(Q1⋮Q2)=(qij)p×p,其中P1,Q1分别为n×r,p×r阶矩阵,且
性质1 对于线性模型(1),且rank(X)=
r<p,任意k>0,0≤ω≤1,则有:
证明 由引理1.1奇异值分解定理和广义逆的性质,对任一矩阵X,由于X(X′X)-X′与(X′X)-的选择无关,故取X(X′X)-X′=X(X′X)+X′
从而有
ω(y-Xd)′(y-Xd)+(1-ω)(d-β)′×
同理
×
土木工程施工的综合性很强,在当前的城市建设中存在许多不同类型的土木工程项目,以便满足城市生活和生产中的不同功能。这一要求给土木工程的施工过程提出了更高的要求。
在后备牛不同年龄阶段,生长速度可能会影响乳房发育,但是在断奶之后有影响,并不是断奶前。图1可以看出,3月龄前,体重生长曲线和乳腺增长曲线完全一致,这意味着,在3月龄前,不管怎么饲养,提供的营养物质是高或是低,牛长得快或慢,都不会对乳腺组织发育产生影响,即不会对后期产奶产生影响。
区总馆要充分发挥示范引导作用,围绕基本文化服务功能,精心设置服务项目,提高全区各类图书馆、公共阅读空间的利用率。各分馆、基层馆外服务点,作为强力支撑,以标准化建设为抓手,实现服务供给全覆盖,社会参与覆盖,志愿者服务推进,科技文化传播,接轨一流标准的目标。
证明 由性质1
由于k-ωk=k(1-ω)≥0
故有
1-ω)
即
令
梁元帝读书这么勤奋,缘何会落得如此下场,甚至产生“书籍误我”的感觉?分析起来,梁元帝读书不外乎两种情况:要么读书方法不对头,要么读错了书。
B是主对角矩阵,其主对角线上元素为bii(i=1,2,…,r)从而得到Ir-B≥0,又因为P是正交矩阵,所以
即
因此
证毕.
1) The basic principle of the UltraLab network experiment platform
6) HistoryService:用于获取正在运行或已完成流程实例的信息,与 RuntimeService中获取的流程信息不同,历史信息包含已持久化存储的永久信息,并已被针对查询优化。
证明 均方误差(风险函数)
大斑病、小斑病是玉米种植中最为常见的两种病害,主要病害部位是叶鞘和苞叶,在病情严重的时候,果穗也会被波及,最初病斑呈现水浸状,之后会逐渐变成青灰色,接着会呈现褐色,直至玉米植株枯死。针对这种病害,可以选择抗病性强的玉米品种,及时消除越冬病菌,减少发病几率。
=k2(1-ω)2×
的方差和迹:
=f1(ω)
记即
由于f(ω)与在ω≤1下连续,因而当ω<1且充分大时 ,有即
在ω<1且充分大时是ω的单调增函数,故存在ω*<1,当ω∈(ω*,1)时,有
且当ω=1时,
证毕.
定理2.3 对于线性模型(1),而且rank(X)=r<p,任意k>0,0≤ω≤1,则有:
证明 要证明可容许性,只需证明A=AX(X′X)-X′和AA′≤AX(X′X)-C′成立,由性质1,
记
由Moore-Penrose广义逆矩阵性质,X(X′X)-X′=则有
而且:
因为k(1-ω)≥0,所以
得到
从而有
即AA″≤AX(X′X)-C′,由引理2.2得知是Xβ的可容许估计,证毕.
性质2 对于线性模型(1),而且rank(X)=
r<p,任意k>0,0≤ω≤1,则有:
(1)当ω=1时,
(2)当ω=0时,
(3)当k=0时,
3 结束语
在线性模型(1)的设计矩阵X不满秩情况下,定理2.1说明平衡损失函数Xβ的平衡岭估计的长度总比最小二乘估计长度小.定理2.2说明在均方误差(风险函数)意义下,平衡岭估计优于最下二乘估计定理2.3说明平衡岭估计作为平衡损失函数Xβ的估计具有可容许性.
参 考 文 献
[1] Zellner A.Bayesian and non-Bayesian estimation using balanced loss functions. In :Gupta S S ,Berger J O eds.Statistical decision theory and related topics V.New York :Spring-Verlag,1994.377-390.
[2] Hoerl A E,Kennard R W. Ridge Regression: Biased Estimation for Non-orthogonal Problems. Technometrics,1970, 12(1) : 55-68.
[3] Wan A T K.Risk comparison of inequality constrained least squares and other related estimators under balanced loss[J].Economics Letters,1994,46,203-210.
[4] Rodrignes J, Zellner A.Weighted balanced loss function and estimation of the mean time to failure[J].Communications in Statistics-Theory and Methods ,1994,23:3609-3616.
[5] 罗汉,胡桂开,彭萍.平衡损失下奇异线性模型中线性估计的可容许性[J].湖南大学学报:自然科学版,2008,35(11).
[6] 徐文科,李凤日.基于奇异设计矩阵的岭估计及其性质[J].黑龙江大学自然科学学报,2013,30(1).
[7] 邬吉波.线性模型参数估计的若干问题研究[D].重庆大学博士学位论文,2013.
[8] 揣瑞.平衡损失函数下Stein估计的优良性研究[D].吉林大学硕士学位论文,2016.
[9] 徐兴忠,吴启光.平衡损失下回归系数的线性容许估计[J].数学物理学报,2000,20(4):468-473.
[10] 胡桂开,饶志勇,等.平衡损失下回归系数的最优估计[J].湖北大学学报:自然科学版,2010,32(3).
[11] 胡宏昌,在平衡损失函数下的泛最小二乘估计[J].商丘师范学院学报,2008,24(12).
[12] 松桂桂,史建红,尹素菊等.线性模型引论:第3版[M].北京:科学出版社,2005.80-81.
[13] 陈希孺,陈桂景,吴启光,等.线性模型参数的估计理论[M].北京:科学出版社,2005.