平衡损失下有限总体回归系数的稳健预测
0 引 言
设P={1,2,…,N}表示容量为N的有限总体,P的第i个元对应着p+1个量:yi,xi1,…,xip,这里除yi外都是已知的,i=1,2,…,N。记 y=(y1,y2,…,yN)′,X=(X1,X2,…XN)′,
其中Xi=(xi1,…,xip)′,i=1,2…,N。 考虑如下线性模型:
y=Xβ+ε
(1)
其中:β是p维未知参数向量,ε是n维随机误差向量,其均值为0,协方差阵为σ2V,V是已知的对称正定矩阵,σ2>0为未知参数。模型(1)在形式上与一般线性模型没有多大区别,但它们在本质上是不同的。因为这里的总体是有限的,且向量y是部分被观测的,所以在抽样调查的文献中称其为超总体模型 [1]。
抽样调查理论要对y的函数进行有效预测,如总体总量和有限总体回归系数βN=(X′V-1X)-1X′V-1y,这里主要讨论有限总体回归系数的预测问题。关于有限总体回归系数的预测已有系统的研究,如Bolfarin等 [2]在均方损失下研究了贝叶斯预测和minimax预测;Bolfarine等 [3]提出了简单投影预测;同时,Bolfarine等 [4]在广义预测均方误差下得到了最优预测。在他们的研究中,损失函数通常只考虑了估计精度或者拟合优度,如二次损失和它的变体等,但在回归分析中,通常采用既有高拟合优度又有高估计精度的估计。为此,Zellner [5]提出了一种称之为平衡损失函数的标准,该损失函数既考虑了拟合优度又考虑了估计精度,相对于二次损失和误差平方和准则,它是一个更加全面和合理的标准,因此一经提出就受到广泛的关注。近年来,Bansal等 [6-8]在平衡损失下研究了有限总体回归系数的Bayes预测。然而,不管在平衡损失还是在二次损失下,贝叶斯预测和最佳无偏预测都是在正态误差假定下得到的,而当模型误差服从Gauss-Markov型(即只知道误差的均值和方差,不关心其具体分布)假定时,很难得到参数的最佳无偏预测,统计学家往往通过缩小预测类范围来处理该问题,如线性预测类,然而线性预测类中的最佳线性预测是不存在的,因为其依赖于未知参数,在应用上为非线性的。为此,Hu等 [9]在平衡损失下研究了Gauss-Markov型总体中有限总体回归系数的线性可容许预测。胡桂开等 [10]在线性无偏预测类中得到了有限总体回归系数的最佳线性无偏预测 (BLUP),并验证了最佳线性无偏预测在齐次线性预测类中具有可容许性。同时Hu等 [11] 给出了有限总体回归系数在齐次线性预测类中的线性minimax预测。另外,当模型(1)中误差服从正态假定时,在平衡损失下,Hu等 [12]得到了有限总体回归系数的最佳无偏预测和一切预测类中的线性minimax预测。
本文考虑有限总体回归系数最佳线性无偏预测的稳健性,即当模型(1)中协方差阵具有微小扰动后,平衡损失下的最佳线性无偏预测是否仍然保持其优良性;另外,Bolfarine等 [4]在广义预测均方误差下得到了有限总体回归系数的最佳线性无偏预测,本文考虑当损失函数变为平衡损失函数时,该预测是否仍然保持其优良性。为方便计,设M2是选用的超总体模型,对应的协方差阵为σ2V,而实际的超总体模型是M1,对应的协方差阵为σ2U。本文将得到平衡损失下模型M2中βN的BLUP在模型M1下仍为βN的BLUP,即βN的BLUP关于协方差矩阵具有稳健性的充要条件。同时,也将获得Bolfarine在广义预测均方误差下提出的BLUP关于平衡损失函数稳健性的充要条件。
1 主要结果
为了预测βN,根据某个特定的抽样方案,从P中抽取容量为n的样本s,r=P-s是总体中未被观测的部分,它的容量为N-n。当样本s确定后,可重新安排y的元素,使y,X,V和U有一致的分块:
则(2)式的右端是关于t的一个二次三项式,而一次项系数为负数,所以存在t0使得(2)式后两项为负数。于是,对必有R(Mys,βN)<R(Lys,βN),这与Lys是βN的BLUP矛盾。
问卷中的所有问题都围绕“在英留学生网上购物行为”主题进行设计。笔者收集了来自英国纽卡斯尔大学、诺森比亚大学、杜伦大学等300名留学生的相 关 数 据。The Survey Monkey(http://www.surveymonkey.com)和Excel软件将用于收集数据并对这些数据进行分析。下面将介绍、分析和比较调查的重要结果。
其中
高性能FEC是为了解决功率预算问题而提出新技术方向。目前PON采用的是冗余度为7%左右的里所码(RS)编码,能够将1E-3误码纠正到1E-12。低密度奇偶校验码(LDPC)、Turbo乘积码(TPC)、Polar码等高性能FEC技术可以将1E-2误码率纠正到1E-12以下,但需要更高的编码冗余、更高计算复杂度和更大的处理时延。
考虑齐次线性预测类H={Lys:L∈Rp×n},
其中Rp×n表示所有p×n阶矩阵构成的集合,为评价预测Lys,对任意的β∈Rp和σ2>0,定义损失函数如下:
其中θ∈[0,1]为加权系数,则相应的风险函数为R(Lys,βN)=E[L(Lys,βN)]。
定义1 Lys称为有限总体回归系数的无偏预测,如果E(Lys-βN)=0对任意的β∈Rp成立。
定义2 线性无偏预测Lys称为有限总体回归系数的最佳线性无偏预测,如果对任意的线性无偏预测Mys∈H,R(Lys,βN) R(Mys,βN),对任意的β∈Rp和σ2>0成立。
要建立相应的管理制度,为人力资源优化配置提供政策依据和导向。深化干部人事制度改革,加快“三能”机制建设,建立干部交流工作制度,畅通企业之间的干部流通渠道。制定各类企业机构编制标准,特别是未来发现方向的分散式新能源、分布式能源的管理模式,安排和实施差异化、结构化、系统化的人力资源优化配置。建立企业内部人才市场,形成有序的员工流动机制。
引理1 [10] 对于模型M2,设Lys∈h,则
2.1.7 重复性试验 取同一批KC粉末(批号F31008),按照“2.1.3”项下方法制备6份试品溶液,按照“2.1.1”项下色谱条件进样测定,金丝桃苷、朝藿定B、朝藿定A、朝藿定C、淫羊藿苷、木犀草素、槲皮素、川陈皮素、山柰酚、宝藿苷I的平均质量分数分别为6.22、4.12、35.07、32.62、47.32、0.213、0.402、0.380、0.336、2.86 mg/g,RSD分别为1.90%、0.78%、1.04%、0.70%、0.68%、2.61%、1.92%、1.45%、2.92%、0.84%,表明该方法重复性较好。
根据实验数据及实际计算得出,27 d变周期数据传输检测器比固定周期检测器减少了66.97%的能耗。变周期数据传输模式下,检测器节点及网关由于数据转发量小于固定周期模式,因此功耗有所降低,可延长系统工作时间。
理想的发展模式是什么?钟秉枢(2013)认为需要在继续发展传统优势项目的同时,突出发展集体对抗和体能类项目,还要关心运动员的长远利益和全面发展。对竞技体育的发展模式的思考应该不忘初心,回归本质,孙科(2012)认为竞技体育价值导向应回归理性,能真正满足人全面发展的需要,如果忽视了“以人为本”,那么竞技体育就会偏离原本的模样。进入后奥运时代,体育改革是必须的,竞技体育发展模式改革究竟怎么改,如何具体实施还有待进一步研究。
[NXs-NXsVsNXs(NXsVsNXs)+NXs]UsZ=0,
一提健康,会想到健壮的身躯。是的,外形的健康是可看到的,而内心的健康往往被忽视。明代养生家高濂说:“夫人只养形,不知养神,殊不知形者载神之车也。神去人即死,车败马即跑也。”这个比喻十分恰当。
所以Lys为平衡损失下βN的BLUP,即充分性成立。
2. Ψ={Lys:L=L*+Z[NXs-NXsVsNXs(NXsVsNXs)+NXs],Z∈Rp×n}为平衡损失下βN的最佳线性无偏预测的全体;
3. 如果Lys∈Ψ,则Lys=L*ys在几乎处处意义下成立,即L*ys为平衡损失下βN的唯一的最佳线性无偏预测。
Bolfarine等 [4]在广义预测均方误差下得到了模型M2下有限总体回归系数的最佳线性无偏预测为下面给出其在平衡损失下仍为BLUP的充要条件。
引理2 [10] 对于模型M2,设则以下陈述成立:
证明 充分性。由Lys为βN的一个线性无偏预测知,对βN的任意一个线性无偏预测Mys,M必满足其中因此,则存在矩阵Z,使不妨取F=ZNXs,则Fys为零的线性无偏预测。反之,零的任一无偏预测Fys都满足Xs′F′=0,因此F可以表示为由该式和引理1知
检测结果表明,空白组的亚硝酸盐含量最高,亚硝酸盐降解率仅为22.5%,说明未接种乳酸菌的试验组的降解能力较弱。接种乳酸菌菌株的培养液中的亚硝酸盐含量均有一定程度的下降,降解率在59.1%~99.8%。不同乳酸菌降解亚硝酸盐的能力差别较大,其中活性最强的是Y1、Y4、Q6和Q12,接种这4株乳酸菌的培养液的亚硝酸盐的降解率分别达到98.7%,99.1%,97.9%,99.8%。这4株乳酸菌的菌落形态和细胞形态见表3,亚硝酸盐降解过程见图1。
2.2.2 NIHSS 评分 纳入研究中 11 篇[3,8‐9,12,14‐18,20‐21]报道了溶栓前后NIHSS评分变化情况,各研究间无异质性(P=0.29,I2=16%),采用固定效应模型进行Meta‐分析(图2)。结果显示标准剂量组溶栓后NIHSS评分减少值大于低剂量组,差异有统计学意义(SMD=0.27,95%CI=0.14~0.40,P<0.001)。
1. L*ys是平衡损失下βN的一个最佳线性无偏预测;
必要性。若存在零向量的线性无偏预测F0ys,使得令不妨设k<0(若k>0,取-F0代替F0,即化为k<0的情形),用F=tF0代入R(Mys,βN)中,即得到
(2)
通过直接计算,模型M2中有限总体回归系数可表示为:
“部分/整体”途径中,分数被视作“部分事物”与“事物整体”所代表的两者间的一种数量关系.与之相对的,通过“测量”途径得到的分数,是通过“可公度性”的概念将两个整数的比定义为分数.无论“部分/整体”途径,还是“测量”途径,其所产生的分数始终未脱离整数概念的束缚.在“测量”途径产生分数所对应的古希腊时期,曾经爆发了著名的第一次数学危机.数学危机的产生是特殊历史背景下,人们对于数学认识的局限所致.而第一次数学危机的实质,是当时数学家的思维被错误的哲学所支配,他们认为“数”只能是正整数[18].由此可见,古希腊及更早时期的人们对于分数概念的认识,是受其对于“数”的认识所局限的.
定理1 在模型M2下的BLUP也是模型M1下的BLUP的充要条件是
1. [NXs-NXsVsNXs(NXsVsNXs)+NXs]UsZ=0;
其中Z=(Xs)⊥,它表示满足Xs′Z=0且具有最大秩的矩阵。
证明 由引理2知,在模型M2下βN的全体BLUP为
{Lys:L=L*+Z1[NXs-NXsVsNXs(NXsVsNXs)+NXs],Z1∈Rp×n},
其中由引理3知,在模型M2下的BLUP在模型M1下仍为BLUP,当且仅当其中Fys为零的任一无偏预测量,且F=t′Z′,t∈Rn×n和
由此可知,等价于:对任意的t∈Rn×n和Z1∈Rp×n,有
而上式等价于以下两式成立
其中
即条件(1)和(2)成立。
定理1给出了最佳线性无偏预测关于协方差阵扰动时仍然为最佳线性无偏预测的充要条件,下面给出2个实例进行说明。例1得到了模型协方差阵扰动时最佳线性无偏预测保持稳健的充要条件,例2在此基础上进一步论证了结论的正确性。
例1 在超总体模型M2中,若而实际模型M1中
由引理2知模型M2下βN的BLUP为进一步,由定理1知其在模型M1下的BLUP,当且仅当成立。
例2 在例1中,若X=1N,
其中模型M2中V=IN,模型M1中其中0<ρ<1。则在模型M2下βN的BLUP为
令Z=(1s)⊥,容易验证在模型M1下仍然为βN的BLUP。事实上,通过直接计算可知,且
尽管如此“公摊”并不合规,但现实中的购房者往往在不知情中被迫埋单。上海房产经济学会副会长严荣认为,国内对于公摊系数的规定并不规范,基本靠经验,亟须予以规范。
根据例1中的结论可知,在模型M1下仍然为βN的BLUP。
引理3 对于模型M1或M2,若Lys为有限总体回归系数βN的一个线性无偏预测,则Lys为平衡损失下βN的BLUP的充分必要条件是:对于零的任一无偏预测Fys,有
定理2 在模型M2中,广义预测均方误差下βN的BLUP在平衡损失下仍然为βN的BLUP的充要条件是
证明 记则
由引理3知,在模型M2中,Lys为平衡损失下βN的BLUP的充分必要条件是:对于零的任一无偏预测Fys,有其中F=t′Z′,t∈Rn×n,Z=(Xs)⊥。通过直接计算得到
当丝木棉花王在新址长出嫩芽,在花王原址也移植来丝木棉长出嫩叶。我坚信,六七年后,丝木棉花王的英姿又将重现,它遇土而生、顽强生长的精神将深入人心。它们长了又灭,灭了又长,无不昭示着能屈能伸、生生不息的力量。最重要的是,它每一次绽放、凋零、重生,都在我的记忆里。或许,丝木棉的生长,本身就是一种力量,一种精神的延续。
由此可知,对任意t∈Rn×n,有
而上式等价于由Z=(Xs)⊥可知,等价于证毕。
定理2得到了最佳线性无偏预测关于损失函数变动时仍然为最佳线性无偏预测的充要条件,下面给出2个例子对其进行说明。
例3 假设模型(1)中X=(x1,…,xN)′,V=diag(x1,…,xN),则在广义预测均方误差下βN的BLUP为其中ys=(y1,…,yn)′,Xs=(x1,…,xn)′。通过直接计算得到因此
由定理2知,其在平衡损失下仍然为βN的BLUP。
例4 考虑模型其中0<ρ<1。此时在广义预测均方误差下βN的BLUP为容易验证其在平衡损失下仍然为βN的BLUP。事实上,通过直接计算得到
线上:从之前的线上统计情况来看,六项缺点占比都在40%到50%之间,说明目前南京城墙相关景区的旅游性观赏性乃至保护性都有所欠缺。缺点中占比最高的是过度商业化,少了文化氛围;占比最少的是保护不到位,城墙残缺严重。
因此
=0
由定理2知,为平衡损失下βN的BLUP。
参考文献
[1] CASSEL C M, SARNDAL C E, WRETMAN J H. Foundations of inference in survey sampling [M]. New York: John Wiley & Sons, 1977.
[2] BOLFARINE H, ZACKS S. Bayes and minimax prediction in finite populations [J]. Journal of Statistical Planning Inference, 1991, 28(2): 139-151.
[3] BOLFARINE H, RODRIGUES J. On the simple projection predictor in finite populations [J]. Australian and New Zealand Journal of Statistics, 1988, 30(3): 338-341.
[4] BOLFARINE H, ZACKS S, ELIAN S N, et al. Optimal prediction of the finite population regression coefficient [J]. Sankhy a: The Indian Journal of Statistics, 1994, 56(1): 1-10.
[5] ZELLNER A. Bayesian and non-Bayesian estimation using balanced loss functions [C]. Statistical Decision Theory and Related Topics V. New York: Springer, 1994: 377-390.
[6] BANSAL A K, AGGARWAL P. Bayes prediction for a heteroscedastic regression surperpopulation model using balanced loss function [J]. Communications in Statistics - Theory and Methods, 2007, 36(8): 1565-1575.
[7] BANSAL A K, AGGARWAL P. Bayes prediction of the regression coefficient in a finite population using balanced loss function [J]. Metron, 2009, 67(1): 1-16.
[8] BANSAL A K, AGGARWAL P. Bayes prediction for a stratified regression superpopulation model using balanced loss function [J]. Communications in Statistics - Theory and Methods, 2010, 39(15): 2789-2799.
[9] HU G K, PENG P. Linear admissible prediction of finite population regression coefficient under a balanced loss function [J]. Journal of Mathematics, 2014, 34(5): 820-828.
[10] 胡桂开, 吴志强. 平衡损失下有限总体回归系数的最优预测 [J]. 东华理工大学学报 (自然科学版), 2015, 38(3): 331-334.
[11] HU G K, LI Q G, YU S H. Linear minimax prediction of finite population regression coefficient under a balanced loss function [J]. Communications in Statistics-Theory and Methods, 2016, 45(24): 7197-7209.
[12] HU G K, LI Q G, YU S H. Optimal and minimax prediction in multivariate normal populations under a balanced loss function [J]. Journal of Multivariate Analysis, 2014, 128: 154-164.