实验一 Eviews简介和基础
一、EVIEWS简介
1、什么是EVIEWS
EVIEWS是在大型计算机的TSP (Time Series Processor) 软件包基础上发展起来的新版本,是一组处理时间序列数据的有效工具,1981年QMS (Quantitative Micro Software) 公司在Micro TSP基础上直接开发成功EVIEWS并投入使用。
2、启动和运行EVIEWS
EVIEWS4提供了一张光盘。插入光驱既可直接安装,并直接在桌面上建立图标。但是在第一次使用前,EVIEWS4要求你在网上注册。
在WINDOWS下,有下列几种启动EVIEWS的办法:单击任务栏中的开始按钮,然后选择程序中的EVIEWS4进入EVIEWS程序组,再选择EVIEWS4程序符号;双击桌面上的EVIEWS图标;双击EVIEWS的workfile 或database文件名称。
3、EVIEWS窗口
EVIEWS窗口由如下五个部分组成:标题栏、主菜单、命令窗口、状态线、工作区。
标题栏:它位于主窗口的最上方。你可以单击EVIEWS窗口的任何位置使EVIEWS窗口处于活动状态。
主菜单:点击主菜单会出现一个下拉菜单,在下拉菜单中可以单击选择显现项。
命令窗口:菜单栏下面是命令窗口。把EVIEWS命令输入该窗口,按回车键即执行该命令。
状态线:窗口的最底端是状态线,它被分成几个部分。左边部分有时提供EVIEWS发送的状态信息;往右接下来的部分是EVIEWS寻找数据和程序的预设目录;最后两部分显示预设数据库和工作文件的名称。
工作区:位于窗口中间部分的是工作区。EVIEWS在这里显示各个目标窗口。
4、关闭EVIEWS
在主菜单上选择File/Close或按ALT-F4键来关闭EVIEWS;可单击EVIEWS窗口右上角的关闭方块。
二、EVIEWS基础
EVIEWS的核心是对象,对象是指有一定关系的信息或算子捆绑在一起供使用的单元,用EVIEWS工作就是使用不同的对象。对象都放置在对象集合中,其中工作文件(workfile)是最重要的对象集合。
1、工作文件
(1)建立新的工作文件 选择菜单File/New/workfile,则出现数据的频率对话框。可在“Workfile frequency”中选择数据的频率,可选的频率包括年度、半年、季度、月度、星期、天(每周5天、每周7天)以及非时间序列或不规则数据。可在“Start date”文本框中输入起始日期,“End date”文本框中输入终止日期,年度与后面的数字用“:”分隔。日期的表示法为:年度:二十世纪可用两位数,其余全用四位数字;半年:年后加1或2;季度:年后加1-4;月度:年后加1-12;星期:月/日/年;日:月/日/年;非时间序列或不规则数据:样本个数。
(2)打开旧的工作文件利用菜单File/open/workfile可打开已有的工作文件。
(3)保存工作文件 保存工作文件可选菜单File/Save或File/Save as在出现的WINDOWS标准对话框内选择文件要保存的目录及文件名。
(4)设置默认路径 打开EVIEWS文件对话框开始都显示默认路径下的内容。可以通过两种方法改变默认路径,一是选择对话框下端的Update default directory即可使当前目录成为默认路径;二是在命令窗口键入CD后面跟着目录名也可使该目录成为默认路径。
(5)重置工作文件范围为了改变工作文件的范围区间,可选择Procs/Change workfile Range 然后输入新的起始日期和终止日期。也可通过双击工作文件目录中的Range来改变工作文件范围。
(6)工作文件排序工作文件中的基础数据是保存在序列对象(Series)中的。通过单击菜单Procs/Sortseries,可以把工作文件中的所有序列以序列中的数据值大小排序。
(7)显示限制当工作文件中包含很多对象时,工作文件窗口就会显得很乱。可以用显示限制(Filter)来限制窗口中所显示的对象。对象类型和对象名称可作为限制条件。
该窗口分为两部分。在编辑区域(空白部分)可以设置限制条件,其中可以使用通配符“*”和“?”比如X* ,??Y*;在Include中可以选择工作文件窗口中显示的对象的类型。
(8)大小写转换菜单View/Name Display可以实现大小写转换。
(9)显示方式通过View/Display Comments(Label + -)可以在标准显示方式和详细显示方式之间切换。
2、对象基础
EVIEWS中的信息是储存在对象中的。每个对象都包含与一个特定分析领域有关的信息。与每类对象相关联的是一系列视图(Views)和过程(Procedure),它们和对象中的信息一起使用。这种视窗、过程与对象中的数据的相关联被称为是面向对象的EVIEWS设计。
(1)、对象中的数据不同对象包含着多种不同的信息,比如说序列对象、矩阵对象、向量对象等主要包含数值方面的信息;方程对象和系统对象包含方程或系统的完整的信息,除了包含用来做估计的数据外,还包含估计的结果的信息;图对象和表对象包含数值的、文本的和格式的信息。
(2)、对象视图不同的对象有不同的视图。序列对象有图表视图(察看原始数据)、线性坐标视图、柱状坐标视图、直方统计视图、相关视图、分布散点视图、QQ散点视图、核密度图。利用序列的视图还可以进行简单的假设检验和统计分析。
(3)对象过程许多EVIEWS对象还包括过程(Procedure)。与视图一样的是,过程通常以图表或坐标的形式显示在对象窗口中;与视图不同的是,过程改变数据,无论对象本身中的还是其他对象中的。很多过程还创建新的对象。比如说序列对象含有进行平滑与季节调整的过程,该过程可以创建一个新的含有平滑以及调整后的数据的序列。方程对象的过程可以建立新的序列来包含残差、拟合值、以及预测。可以用EVIEWS主菜单上的“Procs”或对象窗口工具栏上的“Procs”来选择过程。
(4)对象类型除了序列对象和方程对象外还有许多其他类型的对象,每种对象在对象集合中都有一个特定的图标表示。对象集合虽然也是对象但对象集合没有图标,因此工作文件和数据库不能放在其他的工作文件或数据库中。
(5)建立对象在建立对象之前必须打开工作文件集合而且工作文件窗口必须是激活的。然后选择主菜单上的“Objects/New Object”将会出现工作文件集合窗口。在“Type of Object”中选择新建对象的类型,在“Name for Object”中输入对象名。
(6)选择对象单击工作文件窗口中的对象图标即可选定对象,也可通过EVIEWS主窗口或工作文件窗口上的“View”菜单来选定对象,该菜单包括“Deselect All”(取消所有选定),“Select all”(选定所有对象),“Select by Filter”(限制条件选定)。
(7)打开对象可以通过双击或菜单“View/Open as One Window”打开选定的对象。打开单个对象会出现对象窗口,打开选定的多个对象则会建立新的对象或把各个对象在各自相应的窗口打开。
(8)显示对象选择并打开对象的另一种方法是使用主菜单上的“Quick/Show”工作文件窗口中的“Show”。假如在对话框中输入单个对象的名字就会打开该对象窗口;如果输入多个对象的名字,EVIEWS会打开一个窗口显示结果在必要的时候还会创建一个新的对象。
(9)对象窗口工具条每个对象窗口都有一个工具条,不同对象的工具条的内容也不相同,但是有些按扭是相同的。“View”按钮用来改变对象窗口的视图形式;“Procs”按钮可以用来执行对象的过程;“Objects”按钮可以储存、命名、复制、删除、打印对象;“Print”按钮打印单前对象的视图;“Name”按钮允许你命名或更改对象的名字;“Freeze”按钮可以以当前视图为准建立新的图形对象、表格对象或文本对象。
(10)对象命名对象窗口工具条中的“Name”可以给对象命名,其中“Display Name”是对象在图形或表格中显示的名字。如果要重命名对象可选择“Objects/Rename Selected”。序列对象不能用下面的名称:ABS, ACOS, AR, ASIN, C, CON, CNORM, COEF, COS, D, DLOG, DNORM, ELSE, ENDIF, EXP, LOG, LOGIT, LPT1, LPT2, MA, NA, NRND, PDL, RESID, RND, SAR, SIN, SMA, SQR, THEN
(11)对象标签对象标签可以显示更详细的对象信息,可通过对象窗口中的“View/Label”打开下面窗口:
(12)对象复制通过“Objects/Copy selected”可以把选定的对象拷贝到当前工作文件指定的对象中,若工作文件中没有该目标对象则创建一个新的对象;要想实现不同工作文件之间对象的复制可选主菜单上的“Edit/copy”从原工作文件中复制对象,然后打开目标工作文件选择主菜单上的“Edit/paste”。也可以通过单击右键使用“Copy”“paste”完成工作文件间复制。
(13)冻结对象另一种复制对象中信息的方法是冻结对象。选择菜单“Object/Freeze Output”或“Freeze”钮冻结对象。冻结对象是把对象当前视图以快照的方式保存在一个新的对象中。
(14)删除对象 “Objects/Delete selected”或“Delete”可以删除选定的对象。
(15)打印对象可以通过对象窗口中的“Objects/print”或“Print”打印选定的对象。
3、命令
可以用命令方式建立工作文件。在命令窗口键入Workfile test1可以建立名为test1的工作文件。也可以用命令保存工作文件。例如:Save test2为保存工作文件test2的命令。
实验二 基本数据处理及操作
一、基本数据处理
1、数据对象
(1)序列
建立序列对象: 点击EVIEWS主菜单中的Objects/New Object,然后选择Series即可;点击EVIEWS主菜单中的Objects/Generate Series,键入一个表达式,可形成一个新的序列。
编辑序列:点击序列名称或Show可以显示序列数据,然后点击Edit+/-按钮,可切换编辑状态。当处于可编辑状态时,可修改数据,按回车确定。
改变表单显示:一般是竖行显示,点击Wide+/-按钮,可切换成表格显示状态。
改变样本区间:点击Smpl+/-按钮,可切换序列的样本区间为当前样本区间或工作区样本区间。
在序列中插入或删除观测值:选中要插入或删除的单元,然后点击InsDel按钮,可以插入或删除。
(2)组
建立组对象:点击EVIEWS主菜单中的Objects/New Object,然后选择Group,键入序列表即可;⑵ 选择组名和序列名后,点击Show,可形成一个新的组。
编辑:点击组名称或Show可以显示组中的数据,然后点击Edit+/-按钮,可切换编辑状态。当处于可编辑状态时,可修改数据,按回车确定。
改变样本区间:点击Smpl+/-按钮,可切换序列的样本区间为当前样本区间或工作区样本区间。
2、样本
(1)工作文件样本 工作文件的样本区间是建立工作区时设定的,重新设定,双击Range后的时间区间。
(2)改变当前样本区间点击工作文件中的Objects/Sample或Sample钮,也可双击Sample后的样本区间,然后在对话框输入时间,可输入条件,使用数学表达式及 AND、OR逻辑表达式。
3、输入数据
(1)键盘输入在主菜单下,选择Quick/Empty Group(Edit Serirs)打开一个新序列后,在编辑状态下,通过键盘输入数据,并给定一个序列名。
(2)粘贴输入通过主菜单中的Edit/Copy和Edit/Paste功能复制—粘贴数据,注意粘贴数据的时间区间要和表单中的时间区间一致。
(3)文件输入可以从其它程序建立的数据文件直接输入数据。点击主菜单中的File/Import /Read Text—Lotus—Excel或工作文件菜单中的Procs/Import/Read Text—Lotus—Excel,可以在WINDOWS子目录中找到你的文本文件或Excel(.XLS) 文件,点击后在出现的对话框中回答序列名,点击OK即可形成新序列,注意原数据文件的时间区间。
4、输出数据
(1)复制粘贴通过主菜单中的Edit/Copy和Edit/Paste功能,对不同工作文件窗口中的编辑菜单进行复制—粘贴。注意复制数据的时间区间要和粘贴的时间区间一致。
(2)文件输出可以直接将数据输出成其它程序建立的数据文件类型。选中要存储的序列,点击主菜单中的File /Export/Write Text—Lotus—Excel或工作文件菜单中的Procs/ Export/Write Text—Lotus—Excel后,可以在WINDOWS子目录中找到存储的目录,文件类型选择Text-ASCII或Excel(*.XLS),并给出文本文件名,点击后出现对话框,可键入要存储的序列名,点击OK即可形成一个新类型的文件,注意原数据文件的时间区间。
5、频率转换
工作文件中的数据都是一个频率的,但是从一个工作文件窗口向另一个不同数据频率的工作文件窗口拷贝数据,或者从数据库提取数据,就有一个频率转换的问题。存在两个数据频率转换方式:从高频率数据向低频率数据转换,如月度数据向季度数据转换;从低频率数据向高频率数据转换,如季度数据向月度数据转换。
在序列窗口的菜单中选择View/Conversion Options,从高频率数据向低频率数据转换,有6种选择:(1)观测值的平均值;(2)观测值的和;(3)第一个观测值;(4)最后一个观测值;(5)观测值的最大值;(6)观测值的最小值。
从低频率数据向高频率数据的转换,有6种插值方法:(1)常数——与平均值相匹配;(2)常数——与和相匹配;(3)二次函数——与平均值相匹配;(4)二次函数——与和相匹配;(5)线性函数——与最后的值相匹配;(6)三次函数——与最后的值相匹配。
二、数据操作
1、使用表达式
(1)表达式的使用
Eviews提供了广泛的运算符集和庞大的内建函数库。Eviews不仅提供了标准的数学运算和统计运算,她也提供了很多能够自动处理时间序列中的先行、滞后、差分等操作的特殊函数。
(2)运算符
Eviews中包含的基本算术运算符分别是 +、-、*、/、^(幂),运算的数可以写为整数形式、十进制形式和科学计数法的形式。另外 +、-还可以作为符号运算符来使用。
(3)序列元素
使用序列中的一个实际观测值。 Eviews提供的@elem函数可实现次操作, @elem有两个参数,第一个参数是序列名,第二个参数是数据或观测值的标识符。
(4)先行指标、滞后指标和差分
处理序列中的先行、滞后指标只要在序列名后加一对小括号,括号中写上先行滞后的数字即可。滞后的数字用负号表示,先行的用正数表示。括号中的数也可以不是整数,这时系统会自动把它转换成整数。如果转换不了系统会警告你。Eviews也有几个函数可以处理差分或先取对数后作差分。D函数和DLOG函数就可以实现此功能。
(5)缺失数据
在处理数据时可能会遇到一些没有值或某一时段观测值没有用,或者进行了一些非法计算,Eviews使用空值NA表示这些情况。在=或<>的逻辑运算中使用NA值,则NA值就象其他类型的值一样使用, 如果在>、>=、<、<=、<>运算中使用NA值,则会返回NA值,而与序列的观测值无关。如果逻辑表达式得出的空值使用在数学运算中,这时NA值当作缺失值来考虑,也会得到空值。另外,如果NA使用在IF判断中,则当FALSE(假)对待。
2、序列的操作
表达式的一个主要用途是从一个存在的序列产生一个新序列或修正已存在的序列值。另外,表达式也允许你进行复杂的数据传送,并可以保存新序列或已经存在序列对象的结果。
(1)建立一个新序列
选择quick/generate series…或者单击工作文件工具条上的“genr”按钮。
(2)基本的分配表达式
你可以写一个序列的名字后加一个=,然后再写一个表达式。Eviews将会使用等号右边的表达式对每一个样本元素进行计算。并把相应的计算结果分配给等号左边的目的序列。
如果等号右端是一个常量表达式,例如:Y=3 则把样本空间中的所有观测值用常量代换。
(3)暗示分配
通过在表达式左端的简单的表达式,你可以完成暗示分配操作。例如:log(y)=x 则按 y=exp(x) 计算。通常Eviews只能处理:+ - * / ^ log( ) xp( ) sqr( ) d( ) dlog( ) @inv( )
这几种运算的暗示操作。另外,Eviews也不能矗立在等号左边多次出现目标序列的情况。
3、序列生成组的操作
用来计算相关矩阵、估计VAR模型、画XY图等。建组方法:
(1)在EVIEWS主菜单中选OBJECT/NEW GROUPS后输入序列名称或表达式。
(2)QUICK/SHOW后输入序列名称或表达式。
实验三 序列和组
一、序列
EWIEWS提供序列的各种统计图、统计方法及过程。可以计算序列的各种统计量并可用表单、图等形式表现出来。通过过程可以用原有的序列创建新的序列。这些过程包括季节调整、指数平滑和Hodrick-Prescott滤波。
打开工作文件,双击序列名或单击序列名后单击“show”即进入序列的对话框。单击“view”可看到菜单分为四个区。
1、表单和图示
·钉形图 钉形图用直立的钉形柱显示数据。
·季度分区图 季度连线图
这些方法适用于频度为季度和月度数据的工作文件。季度分区图把数据按季度分成四个区。季度连线图是在同一坐标轴上把每年同一季度的数据连线显示。
2、描述统计量
直方图及统计量 以直方图显示序列的频率分布。一起显示的还有标准的描述统计量。
中位数 (median) 即从小到大排列的序列的中间值。
标准差(Standard Deviation)标准差衡量序列的离散程度。
偏度(Skewness) 衡量序列分布围绕其均值的非对称性。
如果序列的分布是对称的,S值为0;正的S值意味着序列分布有长的右拖尾,负的S值意味着序列分布有长的左拖尾。
峰度(Kurtosis) 度量序列分布的凸起或平坦程度,计算公式如下
正态分布的K值为3。如果K值大于3,分布的凸起程度大于正态分布;如果K值小于3,序列分布相对于正态分布是平坦的。
Jarque-Bera 检验序列是否服从正态分布。
在正态分布的原假设下,Jarque-Bera统计量是自由度为2的分布。直方图中显示的概率值是Jarque-Bera统计量超出原假设下的观测值的概率。如果该值很小,则拒绝原假设。当然,在不同的显著性水平下的拒绝域是不一样的。
3、统计量的检验
这是对序列均值、中位数、方差的单假设检验。两个样本的检验可参考下面的分类的相等检验(Equality test by classification)。选择View/tests for descriptive stats/simple hypothesis tests。
4、相关图
显示确定滞后期的自相关函数以及偏相关函数。这些方程通常只对时间序列有意义。当你选择View/Correlogram…显示对话框(Correlogram Specification)。
可选择原始数据一阶差分 d(x)=x-x(-1)或二阶差分d(x)-d(x(-1))=x-2x(-1)+x(-2)的相关图。也可指定显示相关图的最高滞后阶数。在框内输入一个正整数, 就可以显示相关图及相关统计量。
(1)自相关(AC)
序列y滞后k阶的自相关由下式估计
是样本y的均值,这是相距k期值的相关系数。如果,意味着序列是一阶相关。如果随着滞后阶数k的增加而呈几何级数减小,表明序列服从低阶自回归过程。如果在小的滞后阶数下趋于零,表明序列服从低阶动平均过程。
虚线之间的区域是由自相关中正负两倍于估计标准差所夹成的。如果自相关值在这个区域内,则在显著水平为5%的情形下与零没有显著区别。
(2)偏相关(PAC)
滞后k阶的偏相关是当对作回归时的系数。如果这种自相关的形式可由滞后小于k阶的自相关表示,那么偏相关在k期滞后下的值趋于零。
一个纯的P阶自回归过程AR(P)的偏相关在P阶截尾,而纯的动平均函数的偏相关过程渐进趋于零。
偏相关中的虚线表示的是估计标准差的正负二倍。如果偏相关落在该区域内,则在5%的显著水平下与零无显著差别(截尾)。
(3)Q-统计量
K阶滞后的Q-统计量是在原假设下的统计量,原假设为序列没有k阶的自相关。如果序列不是以ARIMA估计的结果为基础,在原假设下,Q是渐近分布,自由度与自回归阶数相等。如果序列代表ARIMA估计的残差,合适的自由度就应调整,使之少于先前估计的AR、MA的阶数。
Q-检验经常用于检验一个序列是否是白噪声。要注意选得过大或过小都不好。
5、单位根检验
讨论了Dickey-Fuller和Phillips-Perren单位根检验,可检验序列是否平稳。选择检验类型,决定单位根检验是否用原始数据、一阶差分、二阶差分,是否包括截距或趋势以及检验回归的滞后阶数。
6、标签(label)
这部分是对序列的描述。除了Last Update,你可以编辑序列标签中的任何项。Last Update显示序列上一次修改的时间。每一部分包括一行,只有Remarks and History包括20行,注意如果填入了一行(在20行中),最后一行将被删除。
7、季节调整(Seasonal Adjustment)
在序列窗口的工具栏中单击Procs/Seasonal Adjustment,有4种季节调整方法, X12方法、X11方法、Tramo/Seats方法和移动平均方法。
二、组
1、组窗口
组窗口内的view下拉菜单分为四个部分:第一部分包括组中数据的各种显示形式。第二部分包括各种基本统计量。第三部分为时间序列的特殊的统计量。第四部分为标签项,提供组对象的相关信息。
2、组成员
这部分显示组中的序列,在组窗口内进行编辑就可以改变组。按Update Group键保存改动。
3、表格
以表格形式显示组中的每一序列。通过单击Transpose键,可以使表格的行列互换。单击Transform键,选择下拉菜单中一项,可以用序列的不同形式(如水平或百分比)显示表格。
4、图
以图形的形式显示组中的序列。可以通过freeze创造图形对象。
(1)曲线图和直方图:此项用曲线图或直方图表示组中的序列。
(2)散点图:序列的散点图有五个选项:simple scatter , scatter with regression ,scatter with nearest neighbor fit ,scatter with kernel fit,XY Pairs。
(3)XY线(XY Line):显示组中序列的XY线图。X轴方向显示第一个序列,Y轴方向显示其余的序列。
(4)差距条状图(Error Bar):此项以竖线显示组中前两个或三个序列的差距。第一个序列作为“高”值,第二个作为“低”值。高、低值之间用竖线连接。第三个序列用一个小圆圈表示。
(5)高低点图(High-low(Open-Close))
第一个序列是高值,第二个序列是低值,高值低值之间由一条竖线连接。如果高点值低于低点值,就以线段上的空白来表示。如果使用三个序列,第三个序列作为高-低-收盘图的close值,以竖线右边的横线表示。如果使用四个序列,第三个序列代表开盘价,以左边的横线表示。第四个序列代表收盘价,以右边的横线表示。
(6)圆饼图:以圆饼图的形式显示观测值。以饼中的扇形表示每一序列在组中所占的百分比。
(7)复合图(Multiple graphs)
图(Graph散点图,XY线,分布图。)用一张图显示所有序列,复合图(Multiple Graphs)为每个序列显示一张图。主要有:曲线图和直方图,
5、描述统计量
显示组内序列的简单统计量。Common Sample 用于在组中序列无缺失值的情形下计算统计量(去掉包含缺失项所在时期的样本)。Individual Samples用每一个序列有值的观测值进行统计量计算(去掉缺失项)。
6、相等检验
这一部分的原假设是组内所有的序列具有相同的均值、中位数或方差。只有在组中数据都不存在缺失项时才能选common sample项。
7、相关、协方差及相关图
相关和协方差:显示了组中序列的相关及协方差距阵。Common Sample会去掉序列丢失项所在时期的观察值,Pairwise Sample仅去掉丢失的值。
实验四 基本回归模型
一、方程对象
创建一个方程对象:从主菜单选择Object/New Object/Equation或 Quick/Estimation Equation…,或者在命令窗口中输入关键词equation。
二、在EVIEWS中对方程进行说明
1、列表法 即列出你在方程中要使用的变量列表(因变量,表达式和自变量)。EVIEWS在回归中不会自动包括一个常数,因此你必须明确列出作为回归变量的常数。EVIEWS创建说明列表。先选定因变量和自变量,然后双击,选首先Open/Equation,带有变量名的说明对话框将会出现。
2、公式法 EVIEWS中的公式是一个包括回归变量和系数的数学表达式。EVIEWS会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。要创建新的系数向量,选择Object/New Object… 并从主菜单中选择Matrix-Vector-Coef , 为系数向量输入一个名字。在New Matrix对话框中,选择Coefficient Vector 并说明向量中应有多少行。
三、在EVIEWS中方程估计
1、估计方法 单击Method:进入对话框,你会看到下拉菜单中的估计方法列表。
2、估计样本 EVIEWS会用当前工作文档样本来填充对话框,你可以通过在编辑框改变样本。如果估计中使用的任何一个序列的数据丢失了,EVIEWS会临时调整观测值的估计样本以排除掉这些观测值。
3、估计选项 EVIEWS提供很多估计选项。这些选项允许你进行以下操作:对估计方程加权,计算异方差性和自相关robust协方差,控制估计算法的各种特征。
四、方程输出
根据矩阵的概念, 标准的回归可以写为:
1、系数结果
(1)回归系数 最小二乘估计的系数b是由以下的公式计算得到的
(2)标准差 标准差项列出了系数估计的标准差。估计系数的协方差矩阵是由以下公式计算得到的:
, ,
你可以通过选择View/Covariance Matrix项来察看整个协方差矩阵。
(3)t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。
(4)概率 结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下, 指出t统计量与实际观测值一致的概率。这个概率称为边际显著性水平或p值。
2、统计量总结
(1) 统计量 统计量衡量在样本内预测因变量值的回归是否成功。Eviews计算的公式为:
=1- ,
(2)调整 使用作为衡量工具存在的一个问题,即在你增加新的自变量时不会减少。调整后的通常解释为 ,消除中对模型没有解释力的新增变量。计算方法如下:
(3)回归标准差 回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:
(4)残差平方和 残差平方和可以用于很多统计计算中:
(5)对数似然函数值 对数似然计算如下:
(6)Durbin-Watson 统计量 D-W 统计量衡量残差的序列相关性,计算方法如下:
作为一个规则,如果 DW值小于2,证明存在正序列相关。
(7)因变量均值和标准差 y的均值和标准差由下面标准公式算出:
(8)AIC准则 计算公式如下:
(9)Schwarz准则 Schwarz 准则是AIC准则的替代方法,它引入了对增加系数的更大的惩罚:
(10)F统计量和边际显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:
F统计量下的P值,即Prob(F-statistic), 是F检验的边际显著性水平。
五、方程操作
1、方程视图 方程对象窗口中的视图菜单中的选项分别是方程显示(有三种形式)、显示方程结果、显示因变量的实际值和拟合值及残差、描述目标函数的梯度和回归函数的导数计算的信息、显示系数估计值。
2、方程过程 过程菜单中的选项分别是修改说明、用估计方程预测、创建一个与被估计方程有关的未命名模型、把方程系数的估计值放在系数向量中、创建一个包含方程中使用的所有变量的未命名组、在工作文档中以序列形式保存回归中的残差。
3、缺省方程 我们可以把方程的结果储存起来以便在以后的大量计算中使用。未命名方程不能储存在工作文档中。你可以使用方程工具栏中的Name钮来命名方程。工作文档被存储时,方程也会被存储。
4、方程的残差 缺省方程的残差存储于RESID的序列对象中。RESID可以象普通序列一样直接使用。
5、使用系数的估计值 方程系数列在说明窗口中。缺省时, Eviews 会使用系数变量C。
六、一元线形回归模型案例分析
1、研究的目的要求
居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。
2、模型设定
我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。
因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。
影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。
从2002年《中国统计年鉴》中得到文件“数据.xls”中的数据。
作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如下图:
从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立的计量经济模型为如下线性模型:
3、估计参数
假定所建模型及随机扰动项满足古典假定,可以用OLS法估计其参数。运用计算机软件EViews作计量经济分析十分方便。
利用EViews作简单线性回归分析的步骤如下:
(1)建立工作文件
首先,双击EViews图标,进入EViews主页。在菜单一次点击File\New\Workfile,出现对话框“Workfile Range”。在“Workfile frequency”中选择数据频率:
Annual (年度) Weekly ( 周数据 )
Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 )
Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 )
Monthly (月度) Undated or irreqular (未注明日期或不规则的)
在本例中是截面数据,选择“Undated or irreqular”。并在“Start date”中输入开始时间或顺序号,如“1”在“end date”中输入最后时间或顺序号,如“31”点击“ok”出现“Workfile UNTITLED”工作框。其中已有变量:“c”—截距项 “resid”—剩余项。
在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。
若要将工作文件存盘,点击窗口上方“Save”,在“SaveAs”对话框中给定路径和文件名,再点击“ok”,文件即被保存。
(2)输入数据
在数据编辑窗口中,首先按上行键“↑”,这时对应的“obs”字样的空格会自动上跳,在对应列的第二个“obs”有边框的空格键入变量名,如“Y”,再按下行键“↓”,对因变量名下的列出现“NA”字样,即可依顺序输入响应的数据。其他变量的数据也可用类似方法输入。
也可以在EViews命令框直接键入“data X Y ”(一元时) 或 “data Y … ”(多元时),回车出现“Group”窗口数据编辑框,在对应的Y、X下输入数据。
若要对数据存盘,点击 “fire/Save As”,出现“Save As”对话框,在“Drives”点所要存的盘,在“Directories”点存入的路径(文件名),在“Fire Name”对所存文件命名,或点已存的文件名,再点“ok”。
若要读取已存盘数据,点击“fire/Open”,在对话框的“Drives”点所存的磁盘名,在“Directories”点文件路径,在“Fire Name”点文件名,点击“ok”即可。
(3)估计参数
在EViews主页界面点击“Quick”菜单,点击“Estimate Equation”,出现“Equation specification”对话框,选OLS估计,即选击“Least Squares”,键入“Y C X”,点“ok”或按回车,即出现如下表那样的回归结果。
在本例中,参数估计的结果为:
(287.2649) (0.036928)
t=(0.982520) (20.54026)
F=421.9023 df=29
若要显示回归结果的图形,在“Equation”框中,点击“Resids”,即出现剩余项(Residual)、实际值(Actual)、拟合值(Fitted)的图形,如下图所示。
图2.13
4、模型检验
(1)经济意义检验
所估计的参数,说明城市居民人均年可支配收入每相差1元,可导致居民消费支出相差0.758511元。这与经济学中边际消费倾向的意义相符。
(2)拟合优度和统计检验
用EViews得出回归模型参数估计结果的同时,已经给出了用于模型检验的相关数据。
拟合优度的度量:由上表中可以看出,本例中可决系数为0.935685,说明所建模型整体上对样本数据拟合较好,即解释变量“城市居民人均年可支配收入”对被解释变量“城市居民人均年消费支出”的绝大部分差异作出了解释。
对回归系数的t检验:针对和,由上表中还可以看出,估计的回归系数的标准误差和t值分别为:,;的标准误差和t值分别为:,。取,查t分布表得自由度为的临界值。因为,所以不能拒绝;因为,所以应拒绝。这表明,城市人均年可支配收入对人均年消费支出有显著影响。
七、多元线形回归模型案例分析
1、研究的目的要求
改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,中央和地方的税收收入1978年为519.28亿元,到2002年已增长到17636.45亿元,25年间增长了33倍,平均每年增长 %。为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。
影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定的影响。(3)物价水平。我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。(4)税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984-1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收会产生影响,特别是1985年税收陡增215.42%。但是第二次税制改革对税收增长速度的影响不是非常大。因此,可以从以上几个方面,分析各种因素对中国税收增长的具体影响。
2、模型设定
为了全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量,以反映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。由于财税体制的改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑税制改革对税收增长的影响。所以解释变量设定为可观测的“国内生产总值”、“财政支出”、“商品零售物价指数”等变量。
从《中国统计年鉴》得到文件“数据.xls”中的数据。
设定的线性回归模型为:
3、估计参数
利用EViews估计模型的参数,方法是:
(1)建立工作文件:启动EViews,点击File\New\Workfile,在对话框“Workfile Range”。在“Workfile frequency”中选择“Annual” (年度),并在“Start date”中输入开始时间“1978”,在“end date”中输入最后时间“2002”,点击“ok”,出现“Workfile UNTITLED”工作框。其中已有变量:“c”—截距项 “resid”—剩余项。在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。
(2)输入数据:点击“Quik”下拉菜单中的“Empty Group”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。用同样方法在对应的列命名X2、X3、X4,并输入相应的数据。或者在EViews命令框直接键入“data Y X3 X4 … ”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。
(3)估计参数:点击“Procs“下拉菜单中的“Make Equation”,在出现的对话框的“Equation Specification”栏中键入“Y C X2 X3 X4”,在“Estimation Settings”栏中选择“Least Sqares”(最小二乘法),点“ok”,即出现下表回归结果:
根据上表数据,模型估计的结果为:
(940.6128) (0.0056) (0.0332) (8.7363)
t= (-2.7459) (3.9566) (21.1247) (2.7449)
F=2717.238 df=21
4、模型检验
(1)经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1亿元,税收收入就会增长0.02207亿元;在假定其它变量不变的情况下,当年财政支出每增长1亿元,税收收入会增长0.7021亿元;在假定其它变量不变的情况下,当年零售商品物价指数上涨一个百分点,税收收入就会增长23.9854亿元。这与理论分析和经验判断相一致。
(2)统计检验
(a)拟合优度:由表3.4中数据可以得到:,修正的可决系数为,这说明模型对样本的拟合很好。
(b)F检验:针对,给定显著性水平,在F分布表中查出自由度为k-1=3和n-k=21的临界值。由表3.4中得到F=2717.238,由于F=2717.238>,应拒绝原假设,说明回归方程显著,即“国内生产总值”、“财政支出”、“商品零售物价指数”等变量联合起来确实对“税收收入”有显著影响。
(c)t 检验:分别针对:,给定显著性水平,查t分布表得自由度为n-k=21临界值。由表3.4中数据可得,与、、、对应的t统计量分别为-2.7459、3.9566、21.1247、2.7449,其绝对值均大于,这说明分别都应当拒绝:,也就是说,当在其它解释变量不变的情况下,解释变量“国内生产总值”()、“财政支出”()、“商品零售物价指数”()分别对被解释变量“税收收入”Y都有显著的影响。
表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。
表1 我国制造工业1998年销售利润与销售收入情况 |
行业名称 | 销售利润 | 销售收入 | 行业名称 | 销售利润 | 销售收入 |
食品加工业 | 187.25 | 3180.44 | 医药制造业 | 238.71 | 1264.1 |
食品制造业 | 111.42 | 1119.88 | 化学纤维制品 | 81.57 | 779.46 |
饮料制造业 | 205.42 | 1489.89 | 橡胶制品业 | 77.84 | 692.08 |
烟草加工业 | 183.87 | 1328.59 | 塑料制品业 | 144.34 | 1345 |
纺织业 | 316.79 | 3862.9 | 非金属矿制品 | 339.26 | 2866.14 |
服装制品业 | 157.7 | 1779.1 | 黑色金属冶炼 | 367.47 | 3868.28 |
皮革羽绒制品 | 81.7 | 1081.77 | 有色金属冶炼 | 144.29 | 1535.16 |
木材加工业 | 35.67 | 443.74 | 金属制品业 | 201.42 | 1948.12 |
家具制造业 | 31.06 | 226.78 | 普通机械制造 | 354.69 | 2351.68 |
造纸及纸品业 | 134.4 | 1124.94 | 专用设备制造 | 238.16 | 1714.73 |
印刷业 | 90.12 | 499.83 | 交通运输设备 | 511.94 | 4011.53 |
文教体育用品 | 54.4 | 504.44 | 电子机械制造 | 409.83 | 3286.15 |
石油加工业 | 194.45 | 2363.8 | 电子通讯设备 | 508.15 | 4499.19 |
化学原料纸品 | 502.61 | 4195.22 | 仪器仪表设备 | 72.46 | 663.68 |
一、检验异方差性
1、图形分析检验
观察销售利润(Y)与销售收入(X)的相关图(图1):SCAT X Y
图1 我国制造工业销售利润与销售收入相关图
从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。
2、Gleiser检验
⑴建立回归模型(结果如图3所示)。
图3
⑵生成新变量序列:GENR E=ABS(RESID)
⑶分别建立新残差序列(E)对各解释变量(X/X^2/X^(1/2)/X^(-1)/ X^(-2)/ X^(-1/2))的回归模型:LS E C X,回归结果如图4、5、6、7、8、9所示。
图4
图5
图6
图7
图8
图9
由上述各回归结果可知,各回归模型中解释变量的系数估计值显著不为0且均能通过显著性检验。所以认为存在异方差性。
⑷由F值或 确定异方差类型
Gleiser检验中可以通过F值或 值确定异方差的具体形式。本例中,图6所示的回归方程F值( )最大,可以据次来确定异方差的形式。
二、调整异方差性
1、确定权数变量
GENR weight=1/ abs(RESID)
2、利用加权最小二乘法估计模型
在Eviews命令窗口中依次键入命令:
LS(W=weight) Y C X
或在方程窗口中点击Estimate\Option按钮,并在权数变量栏里依次输入weight,回归结果图10所示。
Dependent Variable: Y |
Method: Least Squares |
Date: 11/09/06 Time: 10:36 |
Sample: 1 28 |
Included observations: 28 |
Weighting series: W |
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 4.168933 | 3.779755 | 1.102964 | 0.2801 |
X | 0.109408 | 0.003533 | 30.96653 | 0.0000 |
Weighted Statistics | | | | |
R-squared | 0.975392 | Mean dependent var | 136.4094 |
Adjusted R-squared | 0.974445 | S.D. dependent var | 107.5469 |
S.E. of regression | 17.19227 | Akaike info criterion | 8.595546 |
Sum squared resid | 7684.926 | Schwarz criterion | 8.690703 |
Log likelihood | -118.3376 | F-statistic | 958.9262 |
Durbin-Watson stat | 1.371647 | Prob(F-statistic) | 0.000000 |
Unweighted Statistics | | | | |
R-squared | 0.852563 | Mean dependent var | 213.4639 |
Adjusted R-squared | 0.846893 | S.D. dependent var | 146.4905 |
S.E. of regression | 57.32016 | Sum squared resid | 85425.61 |
Durbin-Watson stat | 1.271717 | | | |
图10
实验六 序列相关性
一、研究目的
2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农村居民消费模型也能用于农村居民消费水平的预测。
二、模型设定
正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为
(6.43)
式中,Yt为农村居民人均消费支出,X t为农村人均居民纯收入,ut为随机误差项。表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。
表6.3 1985-2003年农村居民人均收入和消费 单位: 元
年份 | 全年人均纯收入 (现价) | 全年人均消费性支出 (现价) | 消费价格指数 (1985=100) | 人均实际纯收入 (1985可比价) | 人均实际消费性支出 (1985可比价) |
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 | 397.60 423.80 462.60 544.90 601.50 686.30 708.60 784.00 921.60 1221.00 1577.70 1923.10 2090.10 2162.00 2214.30 2253.40 2366.40 2475.60 2622.24 | 317.42 357.00 398.30 476.70 535.40 584.63 619.80 659.80 769.70 1016.81 1310.36 1572.10 1617.15 1590.33 1577.42 1670.00 1741.00 1834.00 1943.30 | 100.0 106.1 112.7 132.4 157.9 165.1 168.9 176.8 201.0 248.0 291.4 314.4 322.3 319.1 314.3 314.0 316.5 315.2 320.2 | 397.60 399.43 410.47 411.56 380.94 415.69 419.54 443.44 458.51 492.34 541.42 611.67 648.50 677.53 704.52 717.64 747.68 785.41 818.86 | 317.40 336.48 353.42 360.05 339.08 354.11 366.96 373.19 382.94 410.00 449.69 500.03 501.77 498.28 501.75 531.85 550.08 581.85 606.81 |
注:资料来源于《中国统计年鉴》1986-2004。
为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。
根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得
(6.44)
Se = (12.2238) (0.0214)
t = (8.7332) (28.3067)
R2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706
该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.18,dU= 1.40,模型中DW<dL,显然消费模型中有自相关。这一点残差图中也可从看出,点击EViews方程输出窗口的按钮Resids可得到残差图,如图6.6所示。
图6.6 残差图
图6.6残差图中,残差的变动有系统模式,连续为正和连续为负,表明残差项存在一阶正自相关,模型中t统计量和F统计量的结论不可信,需采取补救措施。
三、自相关问题的处理
为解决自相关问题,选用科克伦—奥克特迭代法。由模型(6.44)可得残差序列et,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为e的残差序列。在主菜单选择Quick/Generate Series或点击工作文件窗口工具栏中的Procs/ Generate Series,在弹出的对话框中输入e = resid,点击OK得到残差序列et。使用et进行滞后一期的自回归,在EViews命今栏中输入ls e e (-1)可得回归方程
et= 0.4960 et-1 (6.45)
由式(6.45)可知 =0.4960,对原模型进行广义差分,得到广义差分方程
(6.46)
对式(6.46)的广义差分方程进行回归,在EViews命令栏中输入ls Y-0.4960*Y (-1) c X-0.4960*X (-1),回车后可得方程输出结果如表6.4。
表6.4 广义差分方程输出结果 |
Dependent Variable: Y-0.496014*Y(-1) |
Method: Least Squares |
Date: 03/26/05 Time: 12:32 |
Sample(adjusted): 1986 2003 |
Included observations: 18 after adjusting endpoints |
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 60.44431 | 8.964957 | 6.742287 | 0.0000 |
X-0.496014*X(-1) | 0.583287 | 0.029410 | 19.83325 | 0.0000 |
R-squared | 0.960914 | Mean dependent var | 231.9218 |
Adjusted R-squared | 0.958472 | S.D. dependent var | 49.34525 |
S.E. of regression | 10.05584 | Akaike info criterion | 7.558623 |
Sum squared resid | 1617.919 | Schwarz criterion | 7.657554 |
Log likelihood | -66.02761 | F-statistic | 393.3577 |
Durbin-Watson stat | 1.397928 | Prob(F-statistic) | 0.000000 |
由表6.4可得回归方程为
(6.47)
(0.0294)
t = (6.7423) (19.8333)
R2 = 0.9609 F= 393.3577 d f = 16 DW = 1.3979
式中, , 。
由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL = 1.16,dU = 1.39,模型中DW = 1.3979> dU,说明广义差分模型中已无自相关,不必再进行迭代。同时可见,可决系数R2、t、F统计量也均达到理想水平。
对比模型(6.44)和(6.47),很明显普通最小二乘法低估了回归系数 的标准误差。[原模型中Se( )= 0.0214,广义差分模型中为Se( )= 0.0294。
经广义差分后样本容量会减少1个,为了保证样本数不减少,可以使用普莱斯—温斯腾变换补充第一个观测值,方法是 和 。在本例中即为 和 。由于要补充因差分而损失的第一个观测值,所以在EViews中就不能采用前述方法直接在命令栏输入Y和X的广义差分函数表达式,而是要生成X和Y的差分序列X*和Y*。在主菜单选择Quick/Generate Series或点击工作文件窗口工具栏中的Procs/Generate Series,在弹出的对话框中输入Y*= Y-0.4960*Y (-1),点击OK得到广义差分序列Y*,同样的方法得到广义差分序列X*。此时的X*和Y*都缺少第一个观测值,需计算后补充进去,计算得 =345.236, =275.598,双击工作文件窗口的X* 打开序列显示窗口,点击Edit+/-按钮,将 =345.236补充到1985年对应的栏目中,得到X*的19个观测值的序列。同样的方法可得到Y*的19个观测值序列。在命令栏中输入Ls Y* c X*得到普莱斯—温斯腾变换的广义差分模型为
(6.48)
(0.0297)
t = (6.5178) (19.8079)
R2 = 0.9585 F = 392.3519 d f = 19 DW = 1.3459
对比模型(6.47)和(6.48)可发现,两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯—温斯腾变换与直接使用科克伦—奥克特两步法的估计结果无显著差异,这是因为本例中的样本还不算太小。如果实际应用中样本较小,则两者的差异会较大。通常对于小样本,应采用普莱斯—温斯腾变换补充第一个观测值。
由差分方程(6.46)有
(6.49)
由此,我们得到最终的中国农村居民消费模型为
Y t = 119.9292+0.5833 X t (6.50)
由(6.50)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,将增加消费支出0.5833元。
实验七 多重共线性
一、研究的目的要求
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。
二、模型设定及其估计
经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数 ,城镇居民人均旅游支出 ,农村居民人均旅游支出 ,并以公路里程 和铁路里程 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型:
其中 : ——第t年全国旅游收入
——国内旅游人数 (万人)
——城镇居民人均旅游支出 (元)
——农村居民人均旅游支出 (元)
——公路里程(万公里)
——铁路里程(万公里)
为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示:
表4.2 1994年—2003年中国旅游收入及相关数据
年 份 | 国内旅游收入Y (亿元) | 国内旅游人数X2 (万人次) | 城镇居民人均旅游支出X3 (元) | 农村居民人均旅游支出X4 (元) | 公路里 程 X5 (万公里) | 铁路里 程X6 (万公里) |
1994 | 1023.5 | 52400 | 414.7 | 54.9 | 111.78 | 5.90 |
1995 | 1375.7 | 62900 | 464.0 | 61.5 | 115.70 | 5.97 |
1996 | 1638.4 | 63900 | 534.1 | 70.5 | 118.58 | 6.49 |
1997 | 2112.7 | 64400 | 599.8 | 145.7 | 122.64 | 6.60 |
1998 | 2391.2 | 69450 | 607.0 | 197.0 | 127.85 | 6.64 |
1999 | 2831.9 | 71900 | 614.8 | 249.5 | 135.17 | 6.74 |
2000 | 3175.5 | 74400 | 678.6 | 226.6 | 140.27 | 6.87 |
2001 | 3522.4 | 78400 | 708.3 | 212.7 | 169.80 | 7.01 |
2002 | 3878.4 | 87800 | 739.7 | 209.1 | 176.52 | 7.19 |
2003 | 3442.3 | 87000 | 684.9 | 200.0 | 180.98 | 7.30 |
数据来源:《中国统计年鉴2004》
利用Eviews软件,输入Y、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS回归,结果如表4.3:
表4.3
由此可见,该模型 , 可决系数很高,F检验值173.3525,明显显著。但是当 时 ,不仅 、 系数的t检验不显著,而且 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。
计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations”得相关系数矩阵(如表4.4):
表4.4
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
三、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示:
表4.5
变量 | X2 | X3 | X4 | X5 | X6 |
参数估计值 | 0.0842 | 9.0523 | 11.6673 | 34.3324 | 2014.146 |
t 统计量 | 8.6659 | 13.1598 | 5.1967 | 6.4675 | 8.7487 |
0.9037 | 0.9558 | 0.7715 | 0.8394 | 0.9054 |
按 的大小排序为:X3、X6、X2、X5、X4。
以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为:
t=(2.9086) (0.46214)
当取 时, ,X6参数的t检验不显著,予以剔除,加入X2回归得
t=(4.2839) (2.1512)
X2参数的t检验不显著,予以剔除,加入X5回归得
t=(6.6446) (2.6584)
X3、X5参数的t检验显著,保留X5,再加入X4回归得
t=(3.944983) (4.692961) (3.06767)
F=231.7935 DW=1.952587
当取 时, ,X3、X4、X5系数的t检验都显著,
这是最后消除多重共线性的结果。
这说明,在其他因素不变的情况下,当城镇居民人均旅游支出 和农村居民人均旅游支出 分别增长1元时,国内旅游收入 将分别增长4.21亿元和3.22亿元。在其他因素不变的情况下,作为旅游设施的代表,公路里程 每增加1万公里时, 国内旅游收入 将增长13.63亿元。