更全的杂志信息网

基于多元线性回归的众包任务定价

更新时间:2009-03-28

0 引言

随着大数据和互联网技术的发展,以互联网为核心的众包任务逐渐产生.这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的方式可以大大节省相关成本,而且有效地保证了任务完成的及时性,缩短了完成任务的周期.而任务定价又是其核心要素,如果定价不合理,有的任务就会无人问津,而导致任务完成失败.为了提高任务的完成效率,推动这种模式在我国市场经济中的稳定发展,该文通过分析任务点的分布、会员的位置与会员的信誉值等因素,研究任务的定价方案,为现代企业管理带来一定的帮助[1].

1 问题的提出与分析

1.1 数据采集

该文研究对象的原始数据来源于2017年全国大学生数学建模竞赛题目[2].原始数据的采样点主要来自广东省的广州市、深圳市与佛山市等区域.数据表中列出了任务号码、任务标价、任务执行情况等信息,会员号码、会员的位置信息、会员的信誉值等信息.

七是防洪保安能力进一步提高。面对2013年先后经历的10次区域暴雨天气过程,重庆市提前部署,科学应对,全力抗灾减灾,充分发挥水利工程作用,拦蓄洪水近7亿m3,减少受灾人口133万,防灾减灾效益超过13.7亿元。重庆市未发生一起水库垮坝等重大险情,未发生一起因洪水引发的次生灾害。水利在全市经济社会发展,尤其是工业化、城镇化、农业现代化发展中起到重要支撑作用。

1.2 问题的分析(如图1所示)

  

图1 问题的总分析

1.3 问题的假设

(1)区域1具有代表性,其任务未能全部完成的原因与其他地区一致.

(2)假设每个会员都是理性的,即都期望能够最大化自己的收益.

本文研究结果显示,实施优质护理服务模式的观察组患者的骨折愈合时间显著短于实施常规护理的对照组,关节功能恢复情况也显著优于对照组,观察组的护理满意度显著优于对照组,差异均有显著统计学意义(P<0.05)。该研究结果与相关文献[5]报道相符。综上所述,应用优质护理服务模式对骨折患者进行护理干预,促进骨折愈合,能够显著提高患者的骨折恢复优良率,值得临床上广泛应用。

(3)除选取的因素以外,其他影响因素的影响效果可以忽略不计.

2 基于多项式拟合的任务定价规律探究

2.1 研究思路

采用已获得的数据作为样本,利用BDP软件分析任务信息和会员信息.根据任务点的分布,选出若干中心区域,研究任务的定价方案.考虑任务价格与区域任务相对中心点距离的关系、与所在区域GDP的关系、以及与任务的集中程度.对数据进行多项式拟合,可以得到区域1的定价方案.

2.2 研究方法

首先选中数据中任务完成程度较好且任务数量较为密集的区域.利用BDP软件选中广州市的番禺区与东莞市的两处区域,共三处区域并选出中心点.如图2~4所示.

  

图2 区域1、中心点1 图3 区域2、中心点2 图4 区域3、中心点3 图2中,中心点1——A0483,其经纬度为23.04468,113.7887;任务标价为65.5,且任务已经完成.图3中,中心点2——A0489,其经纬度为22.80107,113.7618;任务标价为66.5,且任务已经完成.图4中,中心点3——A0285,其经纬度为22.95321398, 113.3659058;任务标价为66.5,且任务已经完成.

有多个自变量的线性回归模型称为多元线性回归模型[4].

通过上述区域,可以考虑任务价格与所在区域GDP的关系、任务的集中程度及区域任务相对中心点的距离的关系[3].

(4)当任务所在位置的周围的任务量较少时,会降低会员完成任务的意愿,导致任务未完成.

 

1 任务定价与区域经济的关系

  

区域1区域2区域3中心点的价格/元65.566.566.5

(2)任务的定价与任务集中程度有关系(见表2).

 

2 随距离变化的任务量的累计变化

  

1 km2 km3 km4 km5 km6 km7 km8 km9 km区域11312172633424651区域2128121619212432区域331014203036383946

通过表2看出,随着任务点与中心点距离的增大,任务量变化的累积也逐渐增大,即说明任务的定价与周围任务的数量有关系.

 

3 距中心点每一千米距离变化引起的任务量变化

  

1 km2 km3 km4 km5 km6 km7 km8 km9 km区域1129597945区域2116443238区域31746106217

通过表3看出,随着任务点里中心点距离的增大,任务量变化的累积也逐渐增大说明任务量与任务中心点的位置有一定的正相关关系.

(3)任务的定价与区域任务相对中心点的距离有关(见表4).

 

4 随距离变化的任务价格的累计变化价格变化

  

1 km2 km3 km4 km5 km6 km7 km8 km9 km区域100.56112645.581.599113区域205.514.527.535.54261.574.570.5区域3-0.5210.525.531.545.55555.585.5

通过表4看出,随着任务点距中心点距离的增大,价格变化的累积也逐渐增大,说明任务的定价与任务的距离有一定的正相关关系.但是区域2的9 km以外的数据不符合变化趋势.

 

5 每一千米距离变化引起的任务价格变化

  

1 km2 km3 km4 km5 km6 km7 km8 km9 km价格变化00.55.551519.53617.514价格变化05.591386.519.513-4价格变化02.54.5156149.50.530

通过表5看出,随着任务点离中心点距离的增大,任务量变化的累积也逐渐增大,但是增加的幅度并不明显.说明每1 km距离变化引起的任务价格变化与任务的距离有一定的正相关关系,但是3个区域6 km以外的数据不符合变化趋势.

2.2.2 定价方案

 

6 单位任务价格变化率

  

区域1区域2区域31 km0002 km0.255.50.3571433 km0.6111111.51.1254 km13.252.55 km1.66666720.66 km2.7857142.1666672.3333337 km49.754.758 km4.3754.3333330.59 km2.8-0.54.285714

根据数据拟合(见表6),得到区域1的定价方案:y1=0.5356x-0.735,此区域的定价方案的

区域2的定价方案:y2=-0.0736x4+

1.3904x3-8.7918x2+21.55x-13.718,此区域的定价方案

区域3的定价方案:y=0.0015x6-0.3371x5+3.8305x4-21.366x3+60.511x2-790855x+37.276,此区域的定价方案的

2.3 未完成的原因分析

图5~7是区域的会员分布,颜色较深的代表会员的信誉值比较高.认为有部分任务未完成原因如下,并假设区域4是具有代表性的.

(1)任务所在区域的会员信誉值偏低.区域4中的完成程度较高,且定价方案的拟合程度较高.通过图5~7相比较,区域4中会员信誉值较区域5、6中的高.

(2)任务所在的位置较为偏僻,所在区域的会员数量较少,导致任务的完成度较低.

(3)当任务所在的位置距离相对中心点的距离超过6 km时,价格的定价不合理,导致任未完成.

(1)任务的定价与所在区域的GDP有关(见表1).

  

图5 区域4 图6 区域5 图7 区域6

3 基于多元线性拟合的任务定价

3.1 研究思路

为了对任务制定更加合理的定价方案,分析影响其价格制定因素,首先选取三个中心点的其中之一,计算单位任务价格变化率记为y,预定任务限额x1以及会员信誉度均值x2.建立多元线性回归模型,并且绘制出相应图表观察各指标间的关系;其次设定它们之间的三元线性回归模型,进行参数估计,得出定价方案.

3.2 研究方法

2.2.1 定价规律

设因变量Yk个自变量x1,x2,…,xk之间有下述线性关系:

另一方面,考察西方翻译文学对明治日本、近代中国的影响研究,如:王克非、徐静波等学者。[48,49]无论是对梁启超的小说改良思想来源的考察,[50]还是对鲁迅早期思想原点的梳理(李冬木等),都是为了探究和证明明治文学、政治思想对中国的影响,也进一步印证了明治之后中国文学受日本影响的不争事实。

Y=β0+β1x1+…+βkxk+ξ

(1)

对(1)式作n次观测,得到数据(Xi1,Xi2,…,Xik;vi),i=1,2,…,n,其中v1,v2,…,vn分别是Yn次观测值,若记(Y1,Y2,…,Yn)是取自总体Y的一个样本,则(v1,v2,…,vn)是样本(Y1,Y2,…,Yn)的一组观测值,则由式(1)得

Yi=β0+β1xi1+…+βkxik+ξi,i=1,2,…,n

徐云天忙卸掉硬盘藏起来。一会儿徐河进来,要开电脑,徐云天说电脑坏好长时间了。徐河冷笑一声,将儿子推到一边,鼓捣一会儿,确信电脑不能用才作罢,狐疑地撂下一句:“你有精力的话,多干点正事。”

(2)

(1)是未知参数β0,β1,…,βk的线性表示,这也是线性统计分析的本质特征记

 

那么,(2)式的向量和矩阵形式可表示为下式:

(6)采用斜板组模块间歇式高频微振,能定期自动清洗斜板组模块,使斜板上的物料有序下滑,保证斜板板面上不堆积物料,板间不堵塞,从而保证设备长期稳定的工作效能。

5、正文中引用的参考文献序号写在文字右上角方括号内,未公开发表的文献资料请勿引用,参考文献著录项目、顺序及符号如下:

分别作出yx1yx2的散点图(如图8所示).

其中,X是已知的n×(k+1)常数阵,β是(k+1)维的未知参数向量,ξ是期望为0的n维随机向量.

假定:E(ξ)=0,cov(ξ,ξ)=σ2In,该式中σ2是未知参数,Inn阶单位矩阵,即

电压控制策略目的是即时调节区域电网中低压侧电压以及控制区域整体电压水平,使得电压稳定在一定的区间内[6]。低压侧电压低,高压侧电压高时,首先上调主变档位,其次投入电容器;低压侧电压低,高压侧电压正常,首先投入电容器,其次上调主变档位;低压侧电压高,高压侧电压高,首先切除电容器,其次下调主变档位;低压侧电压高,电网负荷下降时,首先切除电容器,其次下调主变档位;低压侧电压高,且高压侧电压正常、电网负荷稳定,首先下调主变档位,其次切除电容器[7]。

①混凝土面板垂直缝。“A”形垂直缝为张性垂直缝,位于面板靠近两岸的张拉区,缝内均设两道止水,即底部铜片止水、顶部柔性填充料止水。“B”形垂直缝为压性垂直缝,位于面板中部挤压区范围内,接缝底部设一道止水铜片。为了吸收压力变形,避免面板混凝土受压破坏,选择其中10条压性缝(位于河床部位),缝内充填2 cm厚沥青杉木板。

这就是说,对随机误差ξ1,ξ2,…,ξn作无偏性、等方差性以及不相关性的假定.

整理数据可以知道表7资料.

由以上3个式子构成的模型成为线性统计模型.

3.3 结果分析

从编目员视角看,视频文件不仅是节目或电视作品,而是待开发的影像内容宝库,要从中寻找有价值的部分,标注有价值的节目、资料或空镜头。这种判断也是一种再创造。将电视作品分解还原,当编目员从标引视角审视这些内容时,能否从中提取有价值的东西关键还在于对内容价值的敏感性,这种敏感性要求编目员在进行著录标引的过程中,需要对资源全方位分析,敏锐地获取外表属性和内特征,并迅速判定其潜在的价值。

 

7 价格变化率与其他要素的关系

  

序号x1预订任务限额x2信誉平均值x3距离y单位任务价格变化率185.403910245.912220.25359.471930.61111145.7510.11954156.21411.32651.66666766.8311.43262.78571477.3312.00757487.428513.94684.37598.215.4592.8107.2820.2103.2

Y=+ξ.

  

图8 散点图

散点图显示它们之间近似线性关系,因此可设定yx1x2的关系为三元线性回归模型y=β0+β1x1+β2x2+β3x3,调用[b,bintr,rints]=regress(yX,alpha),进行参数估计,多元线性回归方程为: y=0.9474+0.0251x1-0.3899x2+0.9908x3.可决系数R2=0.8737>0.8209;p=0.0042<0.05;故回归模型成立且模型的拟合优度高于原方案,因此此时的定价方案更为合理.

4 基于残差分析与点预测的任务定价模型比较

4.1 残差分析

建立了多元线性回归方程,利用残差图进行灵敏度分析,其结果如图9所示.

  

图9 残差分析图

因此新的任务定价方案为 y=0.9474+

0.0251x1-0.3899x2+0.9908x3.

4.2 点预测

(1)预测方法原理[5]

E(ξi)=0,D(ξi)=σ2,Cov(ξ,ξ)=0(ij)(i,j=1,2,…,n)

①点预测

(2)随钻随治、就地固化。西北分公司和中石油某公司有使用的撬装一体化装置的,主要是脱水后做到减量化;中石油某公司的钻井固体废弃物实行就地固化(在井场的泥浆池中固化)后填埋,固化费用为300元/m3左右(若外运处理还得加运费),钻井液体系多为聚合物泥浆体系和“三磺”体系,井深约在4 000~6 000m之间。

求出回归方程对于给定自变量的值来预测称为y*的点预测.

正确实施案例教学的重要环节是做好课程教学设计及相关准备和组织工作。首先,教师要认真斟酌教学案例内容,选取较新且最贴合临床实际的能与专业知识相结合的案例,尽可能地引起学生的共鸣。其次,教师要采用多形式,吸引学生注意力集中到课堂教学中,激发学生的主体性。另外,案例的分析还能启发、推衍出新问题,教师可以跟学生共同分析探讨、研究讨论,增强相互之间的沟通交流,激发学生自发去学习本门课的兴趣。

②区间预测

y的1-α的预测区间其中C=(cij)=(XTX)-1,则

 

(2)方法使用——点预测

System design of air conditioning in temperature and humidity independent control in ward building

方案一的点预测,当x=6时, y=2.4786

Δ1=2.785714-2.4786=0.307114

方案二的点预测,x1=6.83,x2=11.432,x3=6时, y'=2.6063.

Δ2=2.785714-2.6063=0.179414.

因为Δ1>Δ2,方案二比方案一更加合理.

“生活化教学”是一种更具趣味性的教学方法,教师可以从学生的生活实际入手,将生活背景、学生的生活经验等现实的要素融入教学活动,赋予学生在教学环节的主体地位,进而引导学生主动参与化学教学的整个过程.“生活化教学”的核心要素就是要让学生了解到生活需要使他们学习化学的重要目的,进而在生活中更好地学习,在学习中更好地生活.

5 结束语

互联网众包任务作为一个连接企业和社会的平台,将企业和个人密切联系起来,让互联网众包任务的模式呈良性发展.众包任务模式在我国企业中的发展处于刚刚起步的阶段,因此应该加大众包任务管理模式的建设力度,不断摸索进步.互联网众包任务模式可以有效改善企业的生产经营模式,提高企业工作效率及社会经济效益.

该文对所给数据进行分析、处理,在大量的、看似无规律的数据中筛选符合一般规律的数据,并建立多元线性模型,解决了相关问题.在今后对问题作回归分析并建立多元线性模型时,若进行残差分析,尽量作出残差及其置信区间分析图,对原始数据中的异常数据剔除处理后再计算,模型会有一定的改进.该文运用的模型不仅可以分析定价规律,还可以预测实际生活中很多问题,如城市GDP、人口密度,交通便利程度等.

[1] 黎娟. 互联网众包对现代企业管理模式创新的启示及应用[J]. 商业经济研究,2017(02):113-115.

[2] 全国大学生数学建模竞赛组委会.2017年高教社杯全国大学生数学建模竞赛A题[EB/OL]. (2016-09-10)(2017-01-01). http://www.mcm.edu.cn

[3] 刘晓钢. 众包中任务发布者出价行为的影响因素研究[D].重庆大学,2012.

[4] 王小平,孙彩贤. 基于多元回归模型的2010年上海世博会客流量预测分析[J]. 江汉大学学报:自然科学版,2010,38(02):45-47.

[5] 吴礼斌.经济数学实验与建模[M].北京:国防工业出版社,2013.

 
杨梦昕,朱家明,吴伟琦,郑蕴纯
《哈尔滨师范大学自然科学学报》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息