10 Bài tập môn Kinh tế lượng
Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE.
+ Prob của một số biến đưa vào mô hình nh ỏ hơn mức ý nghĩa 10%, điều này chứng tỏ c ác biến đưa vào mô hình đều có tác động gì đến SUB
+ R2=0.924209 cho thấy mô hình đưa ra có ý nghĩa thống kê cao, các biến đưa vào mô hình giải thích được 92.4% biến SUB.
+trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi b ình ph ư ơng thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ t ăng th êm 19 thuê bao
+ khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao. Điều này cho thấy số lượng thuê bao đăng kí sẽ tăng them cùng với số kênh truyền hình nhưng đến một lúc nào đó người ta sẽ chú trọng hơn về chất lượng kênh truyền hình vì thế mà tốc độ tăng số đăng kí thuê bao sẽ giảm dần so với tốc độ tăng kênh truyền hình, đến lúc số kênh truyền hình tăng lên nhưng số đăng kí thuê bao không tăng nữa
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao
65 trang |
Chia sẻ: aloso | Lượt xem: 2423 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu 10 Bài tập môn Kinh tế lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ô hình không có ý nghĩa thống kê, hay các biến: EDU1, INCC, URB đưa vào mô hình không ảnh hưởng đến biến phụ thuộc MORT. Vì vậy ta không nên đưa 3 biến này vào mô hình.
Ước lượng lại mô hình
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:22
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
AGED
4167.319
307.4568
13.55416
0.0000
ALCC
-25.25888
10.23731
-2.467337
0.0177
EDU2
-843.8800
352.4100
-2.394597
0.0211
HEXC
0.089816
0.027059
3.319302
0.0018
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
- Việc đưa 3 biến không có tác động đến biến phụ thuộc MORT gây ra hiện tượng đa cộng tuyến, làm cho mô hình ban đầu (bao gồm tất cả các biến) có R2 cao (cao hơn cả mô hình sau khi ước lượng lại), trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình: chúng ta chấp nhận mô hình có ý nghĩa thống kê, các biến đưa vào đều có tác động đến biến phụ thuộc.
- Sau khi bỏ 3 biến không làm ảnh hưởng đến MORT, ta thấy mô hình phù hợp hơn (R2 = 0.946903), tức là mô hình đưa ra có ý nghĩa thống kê, các biến đưa vào giải thích hầu hết biến phụ thuộc MORT (với mức ý nghĩa 10%, trị thống kê của các hệ số hồi qui ở các biến đều lớn hơn mức tra bảng).
Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại . Đánh giá chất lượng của phép hồi qui mới ?
Bỏ EDU1
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:23
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
92.81956
102.7758
0.903127
0.3717
AGED
4144.662
314.8831
13.16254
0.0000
ALCC
-24.63643
10.36327
-2.377283
0.0222
EDU2
-1057.359
416.9455
-2.535966
0.0151
HEXC
0.078052
0.031636
2.467190
0.0179
INCC
0.004070
0.005617
0.724592
0.4728
PHYS
0.591597
0.221220
2.674242
0.0107
POV
469.5791
203.7221
2.304998
0.0263
TOBC
1.426362
0.326631
4.366888
0.0001
URB
-35.97989
33.81937
-1.063884
0.2936
R-squared
0.948413
Mean dependent var
855.0059
Adjusted R-squared
0.937089
S.D. dependent var
137.9660
S.E. of regression
34.60463
Akaike info criterion
10.09976
Sum squared resid
49096.70
Schwarz criterion
10.47854
Log likelihood
-247.5438
F-statistic
83.75303
Durbin-Watson stat
1.585340
Prob(F-statistic)
0.000000
MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC - 1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC - 35.97989484*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do xảy ra hiện tượng đa cộng tuyến vì mô hình vẫn còn đưa vào mô hình biến không có ảnh hưởng đến MORT, nếu chấp nhận mô hình thì ta sẽ có những kết luận sai lầm.
Với mô hình mới có K-1 biến giải thích, tiếp tục như câu 4 và yêu cầu như trên ?
Bỏ EDU1 Và INCC 5
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:24
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
103.0909
101.2163
1.018521
0.3143
AGED
4127.928
312.2544
13.21976
0.0000
ALCC
-25.19964
10.27548
-2.452404
0.0184
EDU2
-911.4815
363.0489
-2.510630
0.0160
HEXC
0.089616
0.027160
3.299569
0.0020
PHYS
0.550671
0.212676
2.589252
0.0132
POV
396.2853
175.8333
2.253755
0.0295
TOBC
1.533024
0.289927
5.287621
0.0000
URB
-24.63730
29.80849
-0.826520
0.4132
R-squared
0.947753
Mean dependent var
855.0059
Adjusted R-squared
0.937801
S.D. dependent var
137.9660
S.E. of regression
34.40841
Akaike info criterion
10.07326
Sum squared resid
49725.42
Schwarz criterion
10.41417
Log likelihood
-247.8682
F-statistic
95.23350
Durbin-Watson stat
1.629472
Prob(F-statistic)
0.000000
MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến, mô hình này không phải là mô hình đánh giá đúng đắn tác động của một số biến có ý nghĩa đến biến phụ thuộc
Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa. Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì?
bỏ EDU1 Và INCC và URB 6
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:25
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
AGED
4167.319
307.4568
13.55416
0.0000
ALCC
-25.25888
10.23731
-2.467337
0.0177
EDU2
-843.8800
352.4100
-2.394597
0.0211
HEXC
0.089816
0.027059
3.319302
0.0018
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy mô hình thu được hoàn toàn giống mô hình đã ước lượng lại ở câu 3.
Qua kết quả này ta thấy: hậu quả của hiện tượng đa cộng tuyến là rất lớn, nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ý nghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụ thuộc do R2 rất lớn. Nếu chúng ta chấp nhận mô hình thì chúng ta sẽ có những kết luận vội vã và không chính xác tác động của các biến đến MORT.
Bài 5: ( baitâp 6 – bang câu 4)
Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau :
Y : GDP thực của khu vực nông nghiệp ( triệu USD)
X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệu ngày công lao động )
X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD)
YEAR
Y
X2
X3
1958
16607.7
275.5
17803.7
1959
17511.3
274.4
18096.8
1960
20171.2
269.7
18271.8
1961
20932.9
267
19167.3
1962
20406
267.8
19647.6
1963
20831.6
275
20803.5
1964
24806.3
283
22076.6
1965
26465.8
300.7
23445.2
1966
27403
307.5
24939
1967
28628.7
303.7
26713.7
1968
29904.5
304.7
29957.8
1969
27508.2
298.6
31585.9
1970
29035.5
295.5
33474.5
1971
29281.5
299
34821.8
1972
31535.8
288.1
41794.3
Hãy ước lượng hàm Cobb-Duoglas có dạng như sau :
Y= A.eR.T.X21. X3 2
Trong đó T là biến xu thế theo thời gian
Trả lời:
Lấy ln hai vế ta được
lnY = lnA + RT + 1lnX2 + 2lnX3
đặt Y* = lnY
X2* = lnX2
X3* = lnX3
b1* = lnA
ta có phương trình: Y* = b1* + RT + 1X2 + 2X3 (1)
T = năm - 1958
ước lượng phương trình (1) ta được:
Dependent Variable: LNGDP
Method: Least Squares
Date: 05/26/10 Time: 18:54
Sample: 1958 1972
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
9.412886
4.129936
2.279185
0.0436
T
0.064795
0.018935
3.421919
0.0057
LNLAODONG
0.878171
0.432277
2.031500
0.0671
LNVON
-0.468799
0.289806
-1.617632
0.1340
R-squared
0.946249
Mean dependent var
10.09653
Adjusted R-squared
0.931589
S.D. dependent var
0.207914
S.E. of regression
0.054381
Akaike info criterion
-2.762431
Sum squared resid
0.032530
Schwarz criterion
-2.573617
Log likelihood
24.71823
F-statistic
64.54878
Durbin-Watson stat
1.938628
Prob(F-statistic)
0.000000
LNGDP = 9.412886114 + 0.06479543845*T + 0.8781710093*LNLAODONG - 0.4687993113*LNVON
lấy e mũ 2 vế ta được:
GDP = e 9.412886114*e 0.06479543845*T *LAODONG 0.8781710093*VON -0.4687993113 (2)
Phương trình (2) là phương trình hồi qui ước lượng từ hàm Cobb-Duoglas có dạng: Y= A.eR.T.X21. X3 2
Trong đó:
A = e 9.412886114
R = 0.06479543845
hệ số 1 = 0.8781710093
hệ số 2 = -0.4687993113
Hãy giải thích các hệ số ước lượng R , 1 và 2 theo ý nghĩa kinh tế.
Ý nghĩa của các hệ số ước lượng:
+ Hệ số ước lượng R: trong điều kiện vốn và số ngày lao động hằng năm của khu vực nông nghiệp không thay đổi, qua mỗi năm năng suất trung bình R tăng them 1 đơn vị thì về trung bình GDP thực của khu vực nông nghiệp ở Đài Loan tăng e0.06479543845 triệu USD.
+ Hệ số ước lượng 1: trong điều kiện vốn và năng suất trung bình không thay đổi (tức là không có sự đầu tư thêm hoặc rút vốn ở khu vực nông nghiệp của Đài Loan) khi Số ngày lao động hằng năm tăng thêm 1 triệu ngày công lao động thì về trung bình GDP thực của khu vực nông nghiệp tăng thêm 10.8781710093 triệu USD.
+ Hệ số ước lượng 2: trong điều kiện số ngày lao động hằng năm không thay đổi, khi đàu tư thêm 1 triệu USD vào khu vực nông nghiệp thì về trung bình GDP giảm
1/10.4687993113 triệu USD.
Chỉ ra rằng khu vực nông nghiệp Đài loan có phát triển hiệu quả không ? Giải thích tại sao anh chị có nhận định như vậy? Ngòai những lý do về vốn, lao động , anh chị còn có giả thiết nào khác về nguyên nhân tác động đến sự phát triển của khu vực Đài loan ?
Mô hình trên cho thấy khu vực nông nghiệp Đài Loan phát triển không hiệu quả. Bởi vì qua mô hình ta thấy: khi vốn đầu tư càng tăng thêm thì GDP lại giảm đi, điều này cho thấy vốn đầu tư cho nông nghiệp của Đài Loan được sử dụng chưa hiệu quả do chưa đầu tư đúng, hợp lý, chưa chú trọng đầu tư vào công nghệ, giống, kĩ thuật sản xuất…
Nông nghiệp Đài Loan không phát triển một phần là do khí hậu và thổ nhưỡng ở đây không phù hợp để sản xuất một số loại giống cây trồng. Việc đầu tư thêm vốn chỉ làm gia tăng thêm chi phí sản xuất, từ đó đẩy giá thành sản phẩm lên cao khó cạnh tranh được với các mặt hàng nông sản nhập khẩu. Vì vậy việc đầu tư vào khu vực nông nghiệp cần chú trọng hơn trong việc nghiên cứu sản xuất những giống cây trồng năng suất cao, phù hợp với điều kiện tự nhiên ở đây, đưa công nghệ vào sản xuất,… không nên đầu tư dàn trãi, đầu tư vào sản xuất giống cây trồng mang lại năng suất không cao.
Ngoài những lý do về vốn và lao động nông nghiệp Đài Loan cần chú trọng đến việc đầu tư về công nghệ trong sản xuất, giống… từ đó có thể làm tăng năng suất lao động, ngoài ra còn có các yếu tố khác cũng ảnh hưởng đến nông nghiệp Đài Loan như đất đai, khí hậu, kĩ thuật sản xuất…đây là những yếu tố thiết yếu nhất đối với sự phát triển nông nghiệp.
Bài tập 6: (baitap 5- cau 4 - luan)
Một quốc gia có dữ liệu về tiết kiệm và tiêu dùng như sau :
YEAR
SAVINGS
INCOME
YEAR
SAVINGS
INCOME
1970
61
727.1
1983
167
2522.4
1971
68.6
790.2
1984
235.7
2810
1972
63.6
855.3
1985
206.2
3002
1973
89.6
965
1986
196.5
3187.6
1974
97.6
1054.2
1987
168.4
3363.1
1975
104.4
1159.2
1988
189.1
3640.8
1976
96.4
1273
1989
187.8
3894.5
1977
92.5
1401.4
1990
208.7
4166.8
1978
112.6
1580.1
1991
246.4
4343.7
1979
130.1
1769.5
1992
272.6
4613.7
1980
161.8
1973.3
1993
214.4
4790.2
1981
199.1
2200.2
1994
189.4
5021.7
1982
205.5
2347.3
1995
249.3
5320.8
Saving :Tiết kiệm quốc gia tính bằng tỉ USD
Income: Thu nhập quốc gia tính bằng tỉ USD
Yêu cầu :
Giai đọan 1970-1981 chính sách tiền tệ thắt chặt và mưc lãi suất rất cao , anh chi xác định Dum = 0 cho giai đọan nầy . Và Dum = 1 cho giai đọan 1982-1995 đây là giai đọan chính sách tiền tệ nới lỏng và lãi suất thấp .
Xây dựng hàm hồi qui đơn tuyến tính cho từng giai đọan nói trên theo mô thức :
Saving = 1 + 2* Income + u
Có nghĩa là anh chị xây dựng dạng hàm nầy cho giai đọan 1970-1981 và giai đọai 1982-1995. ý nghĩa kinh tế của 2 đo lường đại lượng gì trong hàm hồi qui?
Giai đọan 1970-1981:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:34
Sample: 1970 1981
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
11.63771
0.087313
0.9321
INCOME
0.080332
0.008367
9.601576
0.0000
R-squared
0.902143
Mean dependent var
106.4417
Adjusted R-squared
0.892358
S.D. dependent var
40.72222
S.E. of regression
13.36051
Akaike info criterion
8.173495
Sum squared resid
1785.032
Schwarz criterion
8.254313
Log likelihood
-47.04097
F-statistic
92.19026
Durbin-Watson stat
0.864230
Prob(F-statistic)
0.000002
SAVINGS = 1.016117401 + 0.08033187867*INCOME
Giai đọan 1982-1995:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:35
Sample: 1982 1995
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
153.4947
32.71227
4.692266
0.0005
INCOME
0.014862
0.008393
1.770773
0.1020
R-squared
0.207169
Mean dependent var
209.7857
Adjusted R-squared
0.141100
S.D. dependent var
31.15670
S.E. of regression
28.87505
Akaike info criterion
9.695396
Sum squared resid
10005.22
Schwarz criterion
9.786690
Log likelihood
-65.86777
F-statistic
3.135639
Durbin-Watson stat
1.786588
Prob(F-statistic)
0.101972
SAVINGS = 153.49467 + 0.01486243404*INCOME
Ý nghĩa của hệ số hồi qui 2: cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. hệ số 2 đo lường đại lượng tiết kiệm quốc dân, nó cho biết mức độ tiết kiệm quốc dân tăng thêm khi thu nhập quốc dân tăng thêm 1 tỉ USD
+ Trong giai đoạn 1970-1981: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.08 tỉ USD
+ Trong giai đoạn 1982-1995: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.015 tỉ USD
Hãy xây dựng hàm hồi qui dạng bội (đa biến) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3* Income + u
ý nghĩa kinh tế của 3 đo lường đại lượng gì trong hàm hồi qui?
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:36
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
71.70587
13.54567
5.293639
0.0000
DUM
37.83347
22.90507
1.651751
0.1122
INCOME
0.026468
0.007925
3.339604
0.0028
R-squared
0.791900
Mean dependent var
162.0885
Adjusted R-squared
0.773804
S.D. dependent var
63.20446
S.E. of regression
30.06008
Akaike info criterion
9.752440
Sum squared resid
20783.00
Schwarz criterion
9.897605
Log likelihood
-123.7817
F-statistic
43.76180
Durbin-Watson stat
1.045517
Prob(F-statistic)
0.000000
SAVINGS = 71.70587083 + 37.83347007*DUM + 0.026467889*INCOME
Ý nghĩa kinh tế của đại lượng 3 : cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. đại lượng 3 đo lường đại lượng tiết kiệm quốc dân trong các giai đoạn với các chính sách tiền tệ khác nhau, nó cho biết mức độ tiết kiệm quốc dân tăng thêm 0.0265 Tỉ USD khi thu nhập quốc dân tăng thêm 1 tỉ USD trong điều kiện không có sự thay đổi gì về chính sách tiền tệ của quốc gia.
Từ câu 2 anh chị hãy viết phương trình hồi qui cho truờng hợp Dum=1 và Dum = 0 . So sánh kết quả nầy với kết quả mà anh chị đã tìm ra ở câu 1 . Nêu nhận xét của anh chị về kết quả tìm được ?
kết quả hồi qui 2 trường hợp dum = 0 và dum = 1 giai đoạn 1970 – 1995:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 22:24
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
62.42267
12.76075
4.891772
0.0001
INCOME
0.037679
0.004237
8.893776
0.0000
R-squared
0.767215
Mean dependent var
162.0885
Adjusted R-squared
0.757515
S.D. dependent var
63.20446
S.E. of regression
31.12361
Akaike info criterion
9.787614
Sum squared resid
23248.30
Schwarz criterion
9.884391
Log likelihood
-125.2390
F-statistic
79.09925
Durbin-Watson stat
0.859717
Prob(F-statistic)
0.000000
SAVINGS = 62.42267117 + 0.03767912963*INCOME
Trường hợp dum=0 (1970 – 1995)
hàm hồi qui có dạng:
SAVINGS = 1 + 2* INCOME + u
SAVINGS = 62.42267117 + 0.03767912963*INCOME
+ So với trường hợp dum = 0 giai đoạn năm 1970 – 1981 của câu 1 ta thấy:
Mức tiết kiệm trung bình giai đoạn 1970 – 1995 ít hơn hơn mức tiết kiệm trong giai đoạn 1970 – 1981 khi thu nhập quốc dân tăng thêm 1 tỉ USD, bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ mở rộng, lãi suất thấp (1982 – 1995) nên người dân có xu hướng đầu tư do vay được tiền với lãi suất thấp kéo theo cả giai đoạn 1970 – 1995 tiết kiệm quốc dân giảm. Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm 0.08 tỉ USD (1970 – 1981), gần 0.04 tỉ USD (1970 – 1995)
Trường hợp dum=1 (1970 – 1995):
hàm hồi qui có dạng:
SAVINGS = (1 + 2) + 3* INCOME + u
SAVINGS = 100.2561412 + 0.03767912963*INCOME
Hệ số b1 = 1 + 2 = 62.42267117 + 37.83347007 = 100.2561412
+ So với trường hợp dum = 1 giai đoạn năm 1982 – 1995 của câu 1 ta thấy:
Mức tiết kiệm trung bình giai đoạn 1970 – 1995 nhiều hơn hơn mức tiết kiệm trong giai đoạn 1982 – 1995 khi thu nhập quốc dân tăng thêm 1 tỉ USD. bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ thắt chặt, lãi suất cao (1970 – 1981) kéo theo cả giai đoạn 1970 – 1995 mức tiết kiệm tăng do người dân có xu hướng gửi tiết kiệm nhiều (bởi vì lãi suất cao kéo theo chi phí cơ hội của việc giữ tiền cao). Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm khoảng 0.015 tỉ USD (1982 – 1995), khoảng 0.04 tỉ USD (1970 – 1995)
Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3.Income + 4* Dum* Income + u
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:56
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
20.16483
0.050391
0.9603
DUM
152.4786
33.08237
4.609058
0.0001
INCOME
0.080332
0.014497
5.541347
0.0000
DUM_X_INCOME
-0.065469
0.015982
-4.096340
0.0005
R-squared
0.881944
Mean dependent var
162.0885
Adjusted R-squared
0.865846
S.D. dependent var
63.20446
S.E. of regression
23.14996
Akaike info criterion
9.262501
Sum squared resid
11790.25
Schwarz criterion
9.456055
Log likelihood
-116.4125
F-statistic
54.78413
Durbin-Watson stat
1.648454
Prob(F-statistic)
0.000000
SAVINGS = 1.016117401 + 152.4785526*DUM + 0.08033187867*INCOME - 0.06546944463*DUM_X_INCOME
5. Từ kết quả của câu 4 hãy cho biết giữa 2 giai đọan có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 hay không ? Sự khác biệt nầy được giải thích bằng ý nghĩa kinh tế là 2 giai đọan chính sách khác nhau ảnh hưởng thế nào đến hành vi tiết kiệm của công chúng
Từ kết quả câu 4 ta thấy: giữa 2 giai đoạn có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 : cho thấy mối quan hệ tỉ lệ nghich gữa tiết kiệm với thu nhập. Trong trường hợp dum = 0, khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm tăng thêm 0.08 USD
Trong trường hợp dum = 1: khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm giảm đi (0.08 – 0.065) = 0.015 USD
do sự tác động của 2 chính sách tiền tệ khác nhau:
+ Đối với giai đoạn 1970 – 1981: khi chính phủ thực hiện chính sách tiền tệ thắt chặt, với mức lãi suất cao thì người dân sẽ gia tăng gửi tiết kiệm, hạn chế đầu tư vì vậy mà làm cho tiết kiệm quốc gia tăng lên.
+ Đối với giai đoạn 1982 – 1995: khi chính phủ thực hiện chính sách tiền tệ nới lỏng, với mức lãi suất thấp làm cho người dân vay tiền nhiều hơn để đầu tư, tái sản xuất mở rộng, với mức lãi suất thấp không hấp dẫn người dân, người dân sẽ hạn chế gửi tiết kiệm vì vậy mà làm cho tiết kiệm quốc gia giảm đi.
Bài tập 7:
Các dữ liệu hằng năm về sản xuất cá Ngừ Trắng tại vùng Basque Tây Ban Nha trong giai đọan 1961-1994 .
Trong đó : CATCH – Tổng lượng cá đánh bắt tính bằng đơn vị 1000 Tấn
EFFORT - Tổng số ngày đánh cá theo đơn vị Ngàn ngày
obs
CATCH
EFFORT
obs
CATCH
EFFORT
1
41.4
45.03512
18
35.804
31.36205
2
51.8
50.05673
19
38.95
25.68735
3
44.3
44.3
20
29.157
19.38004
4
48
44.54
21
23.748
21.78884
5
44.826
59.97878
22
28.333
20.1047
6
39.208
45.37687
23
31.945
27.18085
7
48.278
46.60833
24
18.434
17.92367
8
37.819
52.24526
25
22.531
18.97028
9
31.992
54.11967
26
25.587
22.37778
10
29.894
35.60816
27
29.777
16.89844
11
39.406
61.24754
28
27.906
20.19613
12
34.279
54.76161
29
25.757
16.42839
13
27.958
46.56643
30
24.503
15.57284
14
36.407
28.51477
31
16.608
17.14402
15
27.827
27.16532
32
18.162
15.78574
16
33.71
38.83327
33
18.371
12.12064
17
32.888
22.07106
34
16.993
10.31185
Yêu cầu :
Ước lượng mô hình tuyến tính đơn :
Catchi = 1 + 2* Efforti + ui
ước lượng mô hình:
Dependent Variable: CATCH
Method: Least Squares
Date: 05/14/10 Time: 21:41
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
16.72586
2.447216
6.834648
0.0000
EFFORT
0.473070
0.069201
6.836215
0.0000
R-squared
0.593567
Mean dependent var
31.83994
Adjusted R-squared
0.580866
S.D. dependent var
9.449949
S.E. of regression
6.117947
Akaike info criterion
6.517353
Sum squared resid
1197.737
Schwarz criterion
6.607139
Log likelihood
-108.7950
F-statistic
46.73384
Durbin-Watson stat
1.135208
Prob(F-statistic)
0.000000
CATCH = 16.72586416 + 0.4730703715*EFFORT
+ Khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 0.473 ngàn tấn
+ Khi tổng ngày đánh cá không thay đổi thì trung bình tổng lượng các đánh bắt là 16.72586416 ngàn tấn
Ước lượng mô hình tuyến tính bội :
Catchi = 1 + 2* Efforti + 3* (Efforti )2 + ui
Dependent Variable: CATCH
Method: Least Squares
Date: 05/16/10 Time: 22:38
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.339564
5.785686
0.404371
0.6887
EFFORT
1.491794
0.383074
3.894275
0.0005
EFFORT2_MU
-0.014521
0.005386
-2.696384
0.0112
R-squared
0.670780
Mean dependent var
31.83994
Adjusted R-squared
0.649540
S.D. dependent var
9.449949
S.E. of regression
5.594338
Akaike info criterion
6.365484
Sum squared resid
970.1953
Schwarz criterion
6.500163
Log likelihood
-105.2132
F-statistic
31.58097
Durbin-Watson stat
1.453119
Prob(F-statistic)
0.000000
CATCH = 2.339564155 + 1.491794483*EFFORT - 0.0145214702*EFFORT2_MU
3. Giải thích các hệ số 2, 3 tìm được trong câu trên?
Ý nghĩa của hệ số ước lượng:
+ hệ số 2: trong điều kiện bình phương tổng ngày đánh cá không thay đổi, khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 1.492 ngàn tấn
+ hệ số 3: trong điều kiện tổng ngày đánh cá không thay đổi, khi bình phương tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt giảm 0.0145 ngàn tấn.
4. Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó anh chị lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn gì? Hãy giải thích và thực hiện những kiểm định cần thiết ?
Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn: chúng ta không đánh giá đúng tình hình đánh bắt cá ở đây từ đó sẽ đưa ra những chính sách không đúng về việc đánh bắt cá ở đây do xảy ra hiện tượng phương sai sai số thay đổi, do lượng đánh bắt cá ở thời điểm khác nhau thì khác nhau.
Kiểm định lại mô hình 1
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
2.883619
Prob. F(2,31)
0.071033
Obs*R-squared
5.333174
Prob. Chi-Square(2)
0.069489
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/25/10 Time: 22:57
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-9.028710
38.31446
-0.235648
0.8153
EFFORT
1.877263
2.536823
0.740005
0.4649
EFFORT^2
-0.012570
0.035665
-0.352450
0.7269
R-squared
0.156858
Mean dependent var
35.22756
Adjusted R-squared
0.102462
S.D. dependent var
39.10480
S.E. of regression
37.04730
Akaike info criterion
10.14637
Sum squared resid
42547.57
Schwarz criterion
10.28104
Log likelihood
-169.4882
F-statistic
2.883619
Durbin-Watson stat
2.444300
Prob(F-statistic)
0.071033
với mức ý nghĩa 10%
nR2 > Chi-Square(2) -----à bác bỏ Ho -----à có hiện tượng phương sai sai số thay đổi -------à mô hình câu 1 không có ý nghĩa thống kê.
Bài tập 8 :
Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA . Các Biến trong tập dữ liệu nầy là :
- Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD
Income : Thu nhập cá nhân tính bằng tỉ USD
POP : Dân số tính bằng triệu người
EXPTRAV
INCOME
POP
EXPTRAV
INCOME
POP
1.142
9.3
0.47
6.122
76.6
3.564
1.03
11.2
0.576
4.831
61.2
3.63
3.169
17.1
0.579
3.567
64.1
3.794
1.085
13.8
0.598
5.525
71.3
3.945
0.828
10.9
0.637
3.682
71.6
4.181
0.836
15.3
0.698
4.848
71.3
4.29
0.834
12.8
0.716
4.492
94.9
4.524
1.434
14.6
0.841
4.922
118.5
4.958
0.708
21.2
1
4.453
99.9
5.044
1.462
19.3
1.1
6.779
93.9
5.094
1.408
25.1
1.124
6.215
102.4
5.235
5.866
27.4
1.166
5.318
114.5
5.259
1.483
23.3
1.24
4.22
109.6
5.706
12.539
31.6
1.382
7.452
146.9
6.018
1.751
31.7
1.613
9.076
140.2
6.473
2.695
26.4
1.616
9.186
132.9
6.902
1.371
29.4
1.818
7.884
129.8
6.952
2.712
30
1.86
11.134
211.2
7.859
2.745
38.8
2.426
7.498
194.7
9.46
2.457
50.3
2.535
8.546
217.9
11.061
2.236
38.9
2.64
13.804
263.6
11.686
2.746
51.6
2.821
10.06
256
12.03
3.795
59
3.035
28.629
283.4
13.726
2.698
55
3.233
20.215
345
18.022
3.458
92.3
3.278
19.95
450.6
18.153
42.48
683.5
31.217
Yêu cầu :
Thực hiện mô hình đơn giản xác định rằng Exptrav là một hàm tuyến tính theo Income ?
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 21:44
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.498120
0.535515
0.930170
0.3568
INCOME
0.055573
0.003293
16.87558
0.0000
R-squared
0.853199
Mean dependent var
6.340706
Adjusted R-squared
0.850203
S.D. dependent var
7.538343
S.E. of regression
2.917611
Akaike info criterion
5.017834
Sum squared resid
417.1103
Schwarz criterion
5.093591
Log likelihood
-125.9548
F-statistic
284.7850
Durbin-Watson stat
2.194928
Prob(F-statistic)
0.000000
EXPTRAV = 0.4981199552 + 0.05557310647*INCOME
Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó
Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó
hãy tiến hành kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn nhau hay không ?
kiểm định White
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
2.537633
Prob. F(2,48)
0.089614
Obs*R-squared
4.876820
Prob. Chi-Square(2)
0.087300
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/14/10 Time: 21:46
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.689561
5.950486
-0.283937
0.7777
INCOME
0.126986
0.073163
1.735656
0.0890
INCOME^2
-0.000132
0.000127
-1.039498
0.3038
R-squared
0.095624
Mean dependent var
8.178634
Adjusted R-squared
0.057942
S.D. dependent var
26.00254
S.E. of regression
25.23798
Akaike info criterion
9.351600
Sum squared resid
30573.88
Schwarz criterion
9.465237
Log likelihood
-235.4658
F-statistic
2.537633
Durbin-Watson stat
2.147294
Prob(F-statistic)
0.089614
n.R2=4.876820 > Chi-Square(2) = 0.210720 ---à bác bỏ Ho --àcó hiện tượng phương sai thay đổi
qua đồ thị và qua kiểm định ta thấy mô hình đưa ra có hiện tượng phương sai sai số thay đổi
kiểm định Goldseld - Quant
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
Chia mẫu thành ba nhóm
Nhóm 1: từ n1 – n17
Nhóm 2: từ n18 –n34 (loại bỏ)
Nhóm 3 : từ n35 – n51
Ước lượng phương trình hồi quy nhóm 1và 3
Nhóm 1:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 21:55
Sample: 1 17
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.765089
1.793694
-0.984052
0.3407
INCOME
0.204605
0.084089
2.433181
0.0279
R-squared
0.282996
Mean dependent var
2.331824
Adjusted R-squared
0.235195
S.D. dependent var
2.914951
S.E. of regression
2.549216
Akaike info criterion
4.819579
Sum squared resid
97.47750
Schwarz criterion
4.917604
Log likelihood
-38.96642
F-statistic
5.920371
Durbin-Watson stat
2.587301
Prob(F-statistic)
0.027949
Ta có: RSS1 = 97,4775
Nhóm 3:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:00
Sample: 35 51
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.763340
1.862588
-0.409827
0.6877
INCOME
0.059705
0.006856
8.708565
0.0000
R-squared
0.834873
Mean dependent var
12.84976
Adjusted R-squared
0.823864
S.D. dependent var
9.949654
S.E. of regression
4.175722
Akaike info criterion
5.806583
Sum squared resid
261.5498
Schwarz criterion
5.904608
Log likelihood
-47.35595
F-statistic
75.83910
Durbin-Watson stat
2.250119
Prob(F-statistic)
0.000000
Ta có RSS2 = 261,5498
Fc= = 0.373
Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72
Ta có Fc < F è bác bỏ Ho ---àcó hiện tượng phương sai thay đổi
Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số thay đổi hãy sử dụng thủ tục bình phương có trọng số theo White để ước lượng lại phương trình hồi qui ?
ước lượng lại phương trình hồi qui bằng phương pháp bình phương có trọng số theo White.
1. Hồi quy Exptrav theo Income
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:05
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.498120
0.535515
0.930170
0.3568
INCOME
0.055573
0.003293
16.87558
0.0000
R-squared
0.853199
Mean dependent var
6.340706
Adjusted R-squared
0.850203
S.D. dependent var
7.538343
S.E. of regression
2.917611
Akaike info criterion
5.017834
Sum squared resid
417.1103
Schwarz criterion
5.093591
Log likelihood
-125.9548
F-statistic
284.7850
Durbin-Watson stat
2.194928
Prob(F-statistic)
0.000000
2. Tính các phần dư ei
3. Chạy mô hình hồi quy e2 theo Income
Dependent Variable: SIGMA2_MU
Method: Least Squares
Date: 05/14/10 Time: 22:13
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.192914
4.636127
0.473006
0.6383
INCOME
0.056935
0.028510
1.997036
0.0514
R-squared
0.075265
Mean dependent var
8.178634
Adjusted R-squared
0.056393
S.D. dependent var
26.00254
S.E. of regression
25.25872
Akaike info criterion
9.334646
Sum squared resid
31262.14
Schwarz criterion
9.410404
Log likelihood
-236.0335
F-statistic
3.988154
Durbin-Watson stat
2.126292
Prob(F-statistic)
0.051391
SIGMA2_MU= 2.192914408 + 0.05693455557*INCOME
ước lượng lại phương trình hồi qui với trọng số SIGMA
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:17
Sample: 1 51
Included observations: 51
Weighting series: SIGMA
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.199715
0.784310
-0.254638
0.8001
INCOME
0.058860
0.002715
21.67839
0.0000
Weighted Statistics
R-squared
0.905579
Mean dependent var
8.803754
Adjusted R-squared
0.903652
S.D. dependent var
16.34141
S.E. of regression
4.053436
Akaike info criterion
5.675433
Sum squared resid
805.0867
Schwarz criterion
5.751191
Log likelihood
-142.7235
F-statistic
469.9526
Durbin-Watson stat
2.291150
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.847987
Mean dependent var
6.340706
Adjusted R-squared
0.844884
S.D. dependent var
7.538343
S.E. of regression
2.968956
Sum squared resid
431.9203
Durbin-Watson stat
2.101548
EXPTRAV = -0.1997152197 + 0.05886047842*INCOME
Hãy kiểm định White về hiện tượng phương sai của sai số thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10%
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
5.527501
Prob. F(4,46)
0.001017
Obs*R-squared
16.55572
Prob. Chi-Square(4)
0.002357
Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 05/16/10 Time: 22:19
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-13.29557
375.3913
-0.035418
0.9719
WGT
246.7482
1257.745
0.196183
0.8453
WGT^2
-374.0439
1135.303
-0.329466
0.7433
INCOME*WGT
1.643537
2.944241
0.558221
0.5794
INCOME^2*WGT^2
-0.000408
0.000364
-1.122599
0.2674
R-squared
0.324622
Mean dependent var
15.78601
Adjusted R-squared
0.265893
S.D. dependent var
57.33304
S.E. of regression
49.12296
Akaike info criterion
10.71942
Sum squared resid
111001.0
Schwarz criterion
10.90882
Log likelihood
-268.3453
F-statistic
5.527501
Durbin-Watson stat
2.649477
Prob(F-statistic)
0.001017
nR2=2.352386 > Chi-Square(4) = 1.063623---à bác bỏ Ho --àphương sai thay đổi
Bài tập 9 :
Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một quốc gia Châu Au trong giai đọan 1950-1991 :
YEAR SALES INVENTORIES
1950 38596 59822
1951 43356 70242
1952 44840 72377
1953 47987 76122
1954 46443 73175
1955 51694 79516
1956 54063 87304
1957 55879 89052
1958 54021 87055
1959 59729 92097
1960 60827 94719
1961 61159 95580
1962 65662 101049
1963 68995 105463
1964 73682 111504
1965 80283 120929
1966 87187 136824
1967 90918 145681
1968 98794 156611
1969 105812 170400
1970 108352 178594
1971 117023 188991
1972 131227 203227
1973 153881 234406
1974 178201 287144
1975 182412 288992
1976 204386 318345
1977 229786 350706
1978 260755 400929
1979 298328 452636
1980 328112 510124
1981 356909 547169
1982 348771 575486
1983 370501 591858
1984 411427 651527
1985 423940 665837
1986 431786 664654
1987 459107 711745
1988 496334 767387
1989 522344 813018
1990 540788 835985
1991 533838 828184
---------------------------------------------
Sales : Doanh Số của ngành công nghiệp (triệu $ )
Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ )
Yêu cầu :
a.Thực hiện một mô hình đơn giản xác định rằng số sales là một hàm tuyến tính theo Inventories.
Dependent Variable: SALES
Method: Least Squares
Date: 05/14/10 Time: 22:01
Sample: 1950 1991
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-911.6914
1165.337
-0.782342
0.4386
INVENTORIES
0.642845
0.002889
222.5282
0.0000
R-squared
0.999193
Mean dependent var
199479.4
Adjusted R-squared
0.999173
S.D. dependent var
166654.0
S.E. of regression
4793.439
Akaike info criterion
19.83433
Sum squared resid
9.19E+08
Schwarz criterion
19.91708
Log likelihood
-414.5210
F-statistic
49518.79
Durbin-Watson stat
1.374931
Prob(F-statistic)
0.000000
SALES = -911.691393 + 0.6428449796*INVENTORIES
b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ?
Qua đồ thị ta thấy:
c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của phương trình trên có tương quan chuỗi bậc nhất hay không ?
giả thiết: Ho: p =0
H1: p # 0
theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931
với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có:
dL = 1.442
dU = 1.544
d < dL ----à bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc nhất
d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên nếu có ?
hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS :
- phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch.
- kiểm định t và F nói chung không đáng tin cậy.
- Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực.
- cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả.
Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên:
Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất
Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các
* khắc phục
Ước lượng p dựa trên thống kê Durbin – Watson
p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345
phương trình hồi qui SALES phụ thuộc vào INVENTORIES viết lại:
SALES = b`1 + b`2*INVENTORIES + et
với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793
b`2 = b2 = 0.6428449796
hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES
Bài Tập 10 :
Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây :
AGE
AIR
HOME
INST
SUB
SVC
TV
Y
11.83
13
350
14.95
105
10
16
9839
11.42
11
255.631
15
90
7.5
15
10606
7.33
9
31
15
14
7
11
10455
6.92
10
34.84
10
11.7
7
22
8958
26
12
153.434
25
46
10
20
11741
8.83
8
26.621
15
11.217
7.66
18
9378
13.08
8
18
15
12
7.5
12
10433
5.58
7
9.324
15
6.428
7
17
10167
12.42
8
32
10
20.1
5.6
10
9218
4.92
6
28
15
8.5
6.5
6
10519
4.08
6
8
17.5
1.6
7.5
8
10025
4.25
9
5
15
1.1
8.95
9
9714
10.67
7
15.204
10
4.355
7
7
9294
17.58
7
97.889
24.95
78.91
9.49
12
9784
8.08
7
93
20
19.6
7.5
9
8173
0.17
6
3
9.95
1
10
13
8967
13.25
5
2.6
25
1.65
7.55
6
10133
12.67
5
18.284
15.5
13.4
6.3
11
9361
5.25
6
55
15
18.708
7
16
9085
15
6
1.7
20
1.352
5.6
6
10067
17
5
270
15
170
8.75
15
8908
6.83
6
46.54
15
15.388
8.73
9
9632
5.67
6
20.417
5.95
6.555
5.95
10
8995
7
5
120
25
40
6.5
10
7787
11.25
7
46.39
15
19.9
7.5
9
8890
2.92
4
14.5
9.95
2.45
6.25
6
8041
2.17
5
9.5
20
3.762
6.5
6
8605
7.08
4
81.98
18
24.882
7.5
8
8639
12.17
4
39.7
20
21.187
6
9
8781
13.08
4
4.113
10
3.487
6.85
11
8551
0.17
6
8
10
3
7.95
9
9306
7.67
5
99.75
9.95
42.1
5.73
8
8346
10.33
4
33.379
15
20.35
7.5
8
8803
12.25
5
35.5
17.5
23.15
6.5
8
8942
2
4
34.775
15
9.866
8.25
11
8591
13.08
6
64.84
10
42.608
6
11
9163
1
6
30.556
20
10.371
7.5
8
7683
4
5
16.5
14.95
5.164
6.95
8
7924
4.67
4
70.515
9.95
31.15
7
10
8454
3
4
42.04
20
18.35
7
6
8429
Trong đó:
SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình
Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua
Inst : phí lắp đặt ( USD/Lần)
SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng )
TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp )
Age : thời gian hệ thống đã họat động ( năm )
Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp
Y : thu nhập bình quân đầu người (USD/ người )
Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ?
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:22
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-6.807726
26.65981
-0.255355
0.8001
AGE
1.193511
0.502651
2.374434
0.0237
AIR
-5.111142
1.518459
-3.366005
0.0020
HOME
0.405549
0.035003
11.58599
0.0000
INST
-0.526420
0.476074
-1.105751
0.2771
SVC
2.038732
2.126968
0.958516
0.3450
TV
0.756508
0.687811
1.099877
0.2796
Y
0.001655
0.003469
0.477101
0.6365
R-squared
0.887748
Mean dependent var
24.50850
Adjusted R-squared
0.863193
S.D. dependent var
33.53720
S.E. of regression
12.40453
Akaike info criterion
8.050857
Sum squared resid
4923.914
Schwarz criterion
8.388633
Log likelihood
-153.0171
F-statistic
36.15343
Durbin-Watson stat
2.182694
Prob(F-statistic)
0.000000
SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR + 0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y
Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình sẽ tăng thêm 1.19 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao
+ Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao
+ SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao
+ TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao
+ Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao.
Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ?
+ ước lượng mô hình với các biến bổ sung
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:31
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
kiểm định WALD:
giả thiết: Ho: R2 = 0
H1: R2 # 0
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
4.336042
(7, 25)
0.0029
Chi-square
30.35229
7
0.0001
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(3)
0.139275
0.073366
C(5)
-1.582278
0.373179
C(7)
0.000221
0.000284
C(8)
0.391969
2.124189
C(11)
-0.778979
1.285439
C(13)
0.048444
0.101687
C(15)
-4.55E-06
2.83E-06
Restrictions are linear in coefficients.
Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 ---à bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB. Vì vậy ta cần xem xét nên đưa biến nào vào và nên loại bỏ biến nào.
Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa.
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:38
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST - 0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e-006*Y2_MU
nhận xét: ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB
R2 = 0.949466 cao, trị thống kê thấp do xảy ra hiện tượng đa cộng tuyến. hay nói cách khác mô hình đưa ra bị sai lệch, không còn đúng với mô hình thực.
* ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa:
Dependent Variable: SUB
Method: Least Squares
Date: 05/27/10 Time: 10:50
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-60.49268
16.26712
-3.718709
0.0007
AGE2_MU
0.054963
0.014206
3.868916
0.0005
AIR
19.00283
4.529471
4.195376
0.0002
AIR2_MU
-1.551656
0.306301
-5.065791
0.0000
HOME
0.496449
0.028582
17.36914
0.0000
R-squared
0.924209
Mean dependent var
24.50850
Adjusted R-squared
0.915547
S.D. dependent var
33.53720
S.E. of regression
9.746190
Akaike info criterion
7.508098
Sum squared resid
3324.587
Schwarz criterion
7.719208
Log likelihood
-145.1620
F-statistic
106.6985
Durbin-Watson stat
2.585383
Prob(F-statistic)
0.000000
SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR - 1.551655918*AIR2_MU + 0.4964486269*HOME
Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ?
Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE.
+ Prob của một số biến đưa vào mô hình nh ỏ hơn mức ý nghĩa 10%, điều này chứng tỏ c ác biến đưa vào mô hình đều có tác động gì đến SUB
+ R2=0.924209 cho thấy mô hình đưa ra có ý nghĩa thống kê cao, các biến đưa vào mô hình giải thích được 92.4% biến SUB.
+trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi b ình ph ư ơng thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ t ăng th êm 19 thuê bao
+ khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao. Điều này cho thấy số lượng thuê bao đăng kí sẽ tăng them cùng với số kênh truyền hình nhưng đến một lúc nào đó người ta sẽ chú trọng hơn về chất lượng kênh truyền hình vì thế mà tốc độ tăng số đăng kí thuê bao sẽ giảm dần so với tốc độ tăng kênh truyền hình, đến lúc số kênh truyền hình tăng lên nhưng số đăng kí thuê bao không tăng nữa
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao
Các file đính kèm theo tài liệu này:
- 10 Bài tập môn Kinh tế lượng.doc