您好,欢迎来到吉趣旅游网。
搜索
您的当前位置:首页例2 回归与回归分析

例2 回归与回归分析

来源:吉趣旅游网
例2.1 回归线与回归函数

假定某个国家的家庭数(总体)由60户组成,即总体为60户,所要研究的问题是,家庭消费支出与家庭可支配收入的关系。用X表示收入,Y表示消费,即对于已知的每周各个家庭收入(X)的数据,要预测总体的消费(Y)支出。假定将收入不等的家庭分为10组,这10组构成了总体即60户家庭的消费。

表2.1 X为每周家庭收入,总体:Y为所有家庭每周消费支出 X Y Y ,(Y) 条件均值 i80 100 120 140 160 180 200 55 65 79 80 60 70 84 93 65 74 90 95 70 80 94 103 75 85 98 108 - 88 - 113 - - - 115 325 462445707 (÷((((5 ÷6÷5÷7 ====65) 77) ) 101 102 107 110 116 118 125 - 678(÷6=113) 110 115 120 130 135 140 - 750(÷6=125) 220 240 260 150 152 175 178 180 185 191 1211(÷7=173) 120 135 137 136 137 145 140 140 155 144 152 165 145 157 175 - 160 1 - 162 - 6851043966((÷(÷÷57=6==149) 161) 137) 表2.1,周收入为80美元的家庭有5户,这5户的每周消费支出分别为55,60,65,70,75.类似地,每周240美元的家庭有6户,其消费支出由150至1不等,这样,表

2.1的列给出的是,对应不同的收入水平,其消费支出的条件分布。所谓条件,是指给定收入水平,如第一列,给定收入水平为80,在这一收入水平下,消费支出分别为为55,另一户为60,还有一户为65,另有一户为70,只有一户为75,于是,这一组数给出了在收入为80下,消费支出的条件(给定收入为80美元)分布,其特点为5户有不同的支出,这个例子用于说明问题的方便。因为表2.1的家庭总数60为假定的家庭总数,而表2.1中Y的数据代表总体即所有家庭的消费支出,即所有不同的收入水平下,所有可能的消费支出。而对于X的不同水平,Y的全体构成了一个子总体,如对于X=80,在这一水平下,Y分别等于55、60、65、70和75共5个不同的值,这即是在X=80的条件下,Y 的条件分布,这5个值构成了一个子总体。类似的,对于X=100、120,….,构成一个相应的子总体。所有子总体构成总体。

条件概率与条件期望。在不同的收入水平下,Y取任一个值的概率即为条件概率,如对于给定收入X=80的条件下,Y共有5个不同的值,条件概率即为Y取任一个值的概率,由于随机样本的特征是Y取每一个值的概率相等,因此在X=80的条件下,Y取每一个值的概率为1/5,即

P(Y=55/X=80)=1/5

类似地,在X=100的条件下,Y共有6个值,所以取任意值的条件概率为1/6,以此类推。

P(Y=60/X=80)=1/5 P(Y=65/X=80)=1/5,

P(Y=70/X=80)=1/5 P(Y=75/X=80)=1/5 进而根据条件概率,我们可计算条件期望(均值),即

E(YXX1)Yip(YiXX1)Yip(YiX80)55(1/5)60(1/5)65(1/5)70(1/5)75(1/5)65相应的,有

E(YXX2)Yip(YiXX2)Yip(YiX100)77

E(YXX3)Yip(YiX120)

E(YXX4)Yip(YiX140)101,

E(YXX5)Yip(YiX160)113,E(YXX6)Yip(YiX180)125,E(YXX7)Yip(YiX200)137,E(YXX8)Yip(YiX220)149,E(YXX9)Yip(YiX240)161,E(YXX10)Yip(YiX260)137,上述所计算的条件均值列入表最下行。但是,从以上可知,随着收入水平的提高,平均消费变化即E(Y/X)呈现出从低至高的趋势,即

65(X=80)――77(X=100)――(X=120)――101(X=140)―113(X=160)――125(180)――137(X=200)-―149(220)-―161(X=240)-―173(X=260)

将上述条件分布绘作图且将Y的条件均值连接,即有图2.1.

Population of 60 families200 160 120 80 40 6080100120140160180200220240weekly income

图2.1 总体回归直线

weekly consumption260280从图2.1可以看出,对应X=80,Y有5个可能的值,但条件均值为E(Y/X=80)=65,在X在不同水平下,将Y的条件均值连起来,构成图2.1中的直线,它所说明的是,对应X的不同水平,Y的条件期望(均值)的变化,由于Y的条件均值是对于给定X的值而对于相应的所有Y的值求条件均值,因此称为总体回归直线(PRL)。注意的是对应X的不同值(如X=80),Y的所有值(在X=80时,Y共有5个)的平均值(期望值)所连接的直线,故称为总体回归线。我们特别说明,这一总体是在假定总体已知时推出的,一般的,我们通常不知总体,在这种条件下,我们实际上是假定总体回归直线,由此导出计象经济学中的假设检验.

一般而言,连接这些Y在给定值下的期望值即条件期望(E(YXi)所形成的线可能为直线,也可能为曲线,我们首先讨论直线,即线性总体。至于曲线即非线性,将是我们以后

学习的内容。

PRL函数和线性的含义 从以上的讨论可知,Y的条件均值

65――77――――101――113――125-137――149-161-173

为Xi函数,因此将Y的条件均值表述为

E(YXi)f(Xi) (2.1)

称(2.1)为双变量总体回归函数,这一式子表示在给定X的不同值的条件下,Y的均值或期望随X的变动而变动。以上例子是对总体为60户的家庭而言,而且是一个线性关系,由图示,即

E(YXi)f(Xi)12Xi (2.2)

2为斜

称(2.2)中的1,2为回归参数,其中的1为截距, 率。

由于(2.2)关于变量和参数均为线性,故也称为线性总体回归直线。回归分析的目的即是通过样本(数据),估计和推断经济变量之间的关系即(2.2)。我们的例子是为了说明问题的方便,将总体假定为60个家庭,一般而言,总体是未知的,如我国家庭总数,不可能统计每一个家庭(成本太大),也没有必要(逐户统计也不可能产生精确的数据),因此总体一般未知,总体是否线性?这里是基于凯恩斯消费理论假定总体为线性函数。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- jqkq.cn 版权所有 赣ICP备2024042794号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务