Bài giảng Chương 11: Hồi quy đơn biến -Tương quan

2.1.4. Sự tương tác giữa các biến giả Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến điều đó ta thêm vào mô hình biến tương tác. Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc? Mô hình 1:

pdf62 trang | Chia sẻ: chaien | Lượt xem: 3616 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Bài giảng Chương 11: Hồi quy đơn biến -Tương quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
6/11/2015 1 CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN 1. HỒI QUY ĐƠN BIẾN Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp: Xi 8.0 8.5 9.0 9.5 10.0 10.5 11.0 12.0 13.0 14.0 Yi 45.0 38.0 40.0 39.0 32.0 29.0 28.0 27.0 25.0 23.0 6/11/2015 2 1. HỒI QUY ĐƠN BIẾN 6/11/2015 3 1. HỒI QUY ĐƠN BIẾN Phương trình: Yi = β1 + β2Xi + ui Trong đó : X, Y: Được gọi là biến. X được gọi là biến giải thích (độc lập); Y: Biến được giải thích (phụ thuộc). β1: Hệ số chặn, tham số chặn β2: Hệ số góc, tham số biến ui: Là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên 6/11/2015 4 2. MÔ HÌNH HỒI QUY TUYẾN TÍNH MẪU Phương trình hồi quy mẫu: nên ta có: Yi = + ei ii XY   21   iY MinXYYYe iiiii    2 21 22 )()(               222 21 )(XnX YXnYX XY i ii   6/11/2015 5 Hãy ước lượng phương trình hồi quy mẫu? Xi Yi XY X 2 8 45 360 64 8.5 38 323 72.25 9 40 360 81 9.5 39 370.5 90.25 10 32 320 100 10.5 29 304.5 110.25 11 28 308 121 12 27 324 144 13 25 325 169 14 23 322 196 Σ105.5 Σ326 Σ3317 Σ1147.75 55,10 10 5,105 X 6,32 10 326 YTa có n =10, 5220,3 )55,10(1075,1147 6,3255,10103317 )( 2222          XnX YXnYX i ii  XY   21  = 32,6 + 3,5220 x 10,55 = 69,7571 Phương trình hồi quy mẫu:  iY = 69,7571 – 3,5220Xi 6/11/2015 6 3. HỆ SỐ XÁC ĐỊNH VÀ HỆ SỐ TƯƠNG QUAN 222 )()()(    iiii YYYYYY TSS = ESS + RSS Xi Yi XY X 2 8 45 360 64 153.76 80.6602 8.5 38 323 72.25 29.16 52.1298 9 40 360 81 54.76 29.8018 9.5 39 370.5 90.25 40.96 13.6759 10 32 320 100 0.36 3.7524 10.5 29 304.5 110.25 12.96 0.0310 11 28 308 121 21.16 2.5119 12 27 324 144 31.36 26.0804 13 25 325 169 57.76 74.4579 14 23 322 196 92.16 147.6444 Σ105.5 Σ326 Σ3317 Σ1147.75 Σ 494.4 Σ 430.7457 8712,0 4,494 7457,4302  TSS ESS R Hệ số tương quan: r = ± 2R 9334,08712,0 r 2)( YYi  2)( YYi   6/11/2015 7 4. PHƯƠNG SAI VÀ SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG 2 22 2 1 ))(( )var(  XnXn X i i     )var()( 11   se 22 2 2 )( )var( XnX i       )var()( 22   se 22 2 2      n RSS n ei 6/11/2015 8 5. KHOẢNG TIN CẬY CỦA β1, β2 Khoảng tin cậy của β1: ± tα/2se( ) Khoảng tin cậy của β2: ± tα/2se( ) Ví dụ: Tiếp tục ví dụ 1, Hãy xác định khoảng tin cậy của β1, β2.  1  1  2  2 6/11/2015 9 6. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA HÀM HỒI QUY Chúng ta kiểm định giả thuyết: H0: 2 = 0 F R nR F        1118,54 8712,01 )210(8712,0 1 )2( 2 2 6/11/2015 10 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO Dự báo điểm: Cho X0, tìm thông qua phương trình hồi quy Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư là bao nhiêu? 6/11/2015 11 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO Dự báo giá trị trung bình: Dự báo giá trị trung bình: ± t/2se( ) Ví dụ: Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư trung bình là khoảng bao nhiêu ?              22 2 02 0 )( )(1 )var( XnX XX n Y i  )var()( 00   YYse  0Y  0Y 6/11/2015 12 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO Dự báo giá trị riêng biệt: ± t/2se Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% hãy dự báo giá trị riêng biệt của tổng vốn đầu tư. )( 00  YY  0Y              22 2 02 00 )( )(1 1)var( XnX XX n YY i  )var()( 0000   YYYYse 6/11/2015 13 CHƯƠNG 12. HỒI QUY ĐA BIẾN 1. TỔNG QUAN VỀ MÔ HÌNH HỒI QUY ĐA BIẾN Mô hình: Yi = β1 + β2X1t + β3X2t ++ βkXkt + ut Trong đó : Y là biến phụ thuộc X là các biến độc lập β1: Hệ số từ do βj: Hệ số hồi quy riêng 6/11/2015 14 Các giả định (điều kiện) phân tích mô hình hồi quy đa biến 1. Tuyến tính các tham số hồi quy 2. Các giá trị mẫu của xtj được ước lượng đúng, không có sai số 3. Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 4. Các sai số u độc lập với biến giải thích 5. Các sai số u có phương sai bằng nhau 6. Các sai số u từng cặp độc lập với nhau 7. Vector sai số u theo phân phối chuẩn nhiều chiều 8. Không có biến độc lập nào là hằng số, và không tồn tại các mối liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập 6/11/2015 15 2. PHÂN TÍCH HỒI QUY ĐA BIẾN BẰNG PHẦN MỀM SPSS Để phân tích hồi quy ta cần một số bước như sau: Bước 1: Xác định vấn đề cần nghiên cứu Bước 2: Xác định được đâu là biến Y, đâu là các biến X. Bước 3: Lập bảng câu hỏi hoặc phiếu khảo sát để thu thập số liệu. Bước 4: Xử lý số liệu và nhập liệu Bước 5: Phân tích tương quan hồi quy. Bước 6: Báo cáo kết quả 6/11/2015 16 Ví dụ Yi = β1 + β2X1 + β3X2 + β4X3 + β5X4 + β6X5 + β7X6 + ei Với: Yi: Lợi nhuận bình quân (triệu đồng) X1: Vốn kinh doanh hiện tại (triệu đồng) X2: Tài sản cố định (triệu đồng) X3: Tuổi chủ nhiêm HTX (tuổi) X4: Chuyên môn của chủ nhiệm HTX X5: Lương của chủ nhiệm HTX (triệu đồng) X6: Quan tâm của chính quyền địa phương đối với hoạt động của HTX 6/11/2015 17 Kết quả chạy phần mềm SPSS Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate 1 .898 a .807 .662 102.83959 a. Predictors: (Constant), X6, X4, X5, X3, X2, X1 b. Dependent Variable: Y ANOVAb Model Sum of Squares df Mean Square F Sig. Regression 352891.599 6 58815.267 5.561 .015 a Residual 84607.847 8 10575.981 1 Total 437499.446 14 a. Predictors: (Constant), X6, X4, X5, X3, X2, X1 b. Dependent Variable: Y 6/11/2015 18 Kết quả chạy phần mềm SPSS Coefficients a Unstandardized Coefficients Standardized Coefficients 95% Confidence Interval for B Model B Std. Error Beta t Sig. Lower Bound Upper Bound (Constant) 172.028 262.471 .655 .531 -433.231 777.287 X1 -.224 .094 -.906 -2.389 .044 -.439 -.008 X2 .335 .113 1.120 2.956 .018 .074 .597 X3 -10.728 5.579 -.398 -1.923 .091 -23.594 2.138 X4 49.052 42.833 .290 1.145 .285 -49.721 147.824 X5 185.751 60.536 .615 3.068 .015 46.154 325.348 1 X6 25.364 27.582 .173 .920 .385 -38.241 88.968 a. Dependent Variable: Y 6/11/2015 19 Kết quả dự báo bằng phần mềm SPSS 6/11/2015 20 ĐA CỘNG TUYẾN 1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN Đa cộng tuyến là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy. 6/11/2015 21 2. HẬU QUẢ CỦA ĐA CỘNG TUYẾN Không xác định được hệ số quan hệ  Độ lệch chuẩn của hệ số hồi quy ước lượng sẽ rất lớn. Điều này có nghĩa là ước lượng của chúng ta kém chính xác và khoảng tin cậy sẽ rộng hơn Khi độ lệch chuẩn của hệ số hồi quy ước lượng lớn, giá trị t-test thường nhỏ nhưng mô hình lại thường có R2 cao nên ta dễ đưa ra các quyết định sai lầm về độ tốt của mô hình hồi quy Ước lượng hệ số hồi quy sẽ dễ bị thay đổi khi ta bỏ một vài quan sát hay bỏ một biến độc lập được cho là không có giá trị. 6/11/2015 22 3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN Cách 1: Một cách đơn giản để xác định đa cộng tuyến là ta tính hệ số tương quan giữa các cặp biến độc lập. Nếu ta thấy hệ số tương quan trên 0,8, ta có thể coi đó là quan hệ gần như hoàn hảo. Nếu ta thấy hệ số tương quan trên 0,5, ta có thể coi đó là quan hệ chặt chẽ 6/11/2015 23 3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN Cách 2: Sử dụng yếu tố phóng đại phương sai (VIF): Nếu VIF > 10 thì xảy ra hiện tượng đa cộng tuyến. Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 3.348 .466 7.186 .000 I -.073 .037 -.086 -1.989 .070 .252 3.962 W .208 .008 1.071 24.796 .000 .252 3.962 a. Dependent Variable: C 6/11/2015 24 4. CÁCH KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN Thu thập thêm dữ liệu hoặc thu thập dữ liệu chính xác hơn Tái cấu trúc mô hình bằng cách đưa thêm thông tin bổ trợ vào Xác định cặp biến độc lập nào có quan hệ gần hoàn hảo, ta có thể bỏ bớt một biến độc lập. Tính R2 đối với các hàm hồi quy: có mặt cả hai biến; không có mặt một trong hai biến. Ta loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn 6/11/2015 25 PHƯƠNG SAI SAI SỐ THAY ĐỔI VÀ HẬU QUẢ 1. TỔNG QUAN VỀ PHƯƠNG SAI SAI SỐ THAY ĐỔI 6/11/2015 26 2. HẬU QUẢ CỦA PHƯƠNG SAI SAI SỐ THAY ĐỔI Ước lượng OLS vẫn tuyến tính, chúng vẫn là ước lượng không chệch. Tuy nhiên, chúng sẽ không còn có phương sai nhỏ nhất nữa Công thức thông thường để ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ chệch Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa 6/11/2015 27 CÁCH PHÁT HIỆN VÀ KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 1. CÁCH PHÁT HIỆN PHƯƠNG SAI SAI SỐ THAY ĐỔI 1.1. Xem xét đồ thị của phần sai số 6/11/2015 28 1.2. Kiểm định Park Park cho rằng i 2 là một hàm số nào đó của biến giải thích X. Trong trường hợp mô hình hai biến, Park đã đưa ra dạng hàm số giữa i 2 và X như sau: lni 2 = 1 + 2lnXi + vi (1) Park đã đề nghị chúng ta có thể sử dụng ei thay cho i và chạy mô hình hồi quy sau: lnei 2 = 1 + 2lnXi + vi (2) ei 2 có thể được thu thập từ mô hình hồi quy gốc. Theo đó, kiểm định Park được tiến hành theo các bước sau đây: 6/11/2015 29 1.2. Kiểm định Park 6/11/2015 30 1.3. Kiểm định Glejser 6/11/2015 31 1.4. Kiểm định tương quan hạng của Spearman 6/11/2015 32 1.4. Kiểm định tương quan hạng của Spearman 6/11/2015 33 Kết quả phát hiện PSSSTĐ bằng SPSS H0: Hệ số tương quan hạng của tổng thể bằng 0 Nhìn vào giá trị sig. của kiểm định là 0,489 > mức ý nghĩa  = 5%  Chấp nhận giả thuyết H0, tức là mô hình không xảy ra hiện tượng phương sai sai số thay đổi. Correlations Lai suat ABSres Correlation Coefficient 1.000 -.248 Sig. (2-tailed) . .489 Lai suat N 10 10 Correlation Coefficient -.248 1.000 Sig. (2-tailed) .489 . Spearman's rho ABSres N 10 10 6/11/2015 34 1.5. Kiểm định Goldfeld – Quandt 6/11/2015 35 1.5. Kiểm định Goldfeld – Quandt Bước 3: Sử dụng phương pháp bình phương bé nhất để ước lượng tham số của các hàm hồi quy đối với 2 cn  quan sát đầu và cuối; thu thập tổng bình phương của các phần dư RSS1 và RSS2 tương ứng. Trong đó RSS1 đại diện cho RSS từ hồi quy ứng với các giá trị của Xi nhỏ hơn và RSS2 ứng với các giá trị Xi lớn hơn. Bậc tự do tương ứng là 2 cn  - k hoặc 2 2kcn  . Trong đó, k là các tham số được ước lượng kể cả hệ số chặn. 6/11/2015 36 1.5. Kiểm định Goldfeld – Quandt Bước 4: Tính tỷ số dfRSS dfRSS / / 1 2 Nếu ui theo phân phối chuẩn và nếu giả định về phương sai có điều kiện không đổi được thỏa mãn thì λ tuân theo phân phối F với bậc tự do ở tử số và mẫu số là 2 2kcn  . Khi thực hành, nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa mong muốn, thì chúng ta có thể bác bỏ giả thuyết H0: phương sai có điều kiện không đổi, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi. 6/11/2015 37 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 6/11/2015 38 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 2.2. Trường hợp chưa biết i 2 Trường hợp 1: Phương sai sai số tỷ lệ với bình phương biến giải thích: E(ui 2) = 2 Xi 2 Trong đó, hằng số i 2 là nhân tố tỷ lệ. Chia 2 vế mô hỉnh (13) cho Xi:  i i v XX u XX 2 i 1 i 2 i 1 i i 1 Y   (15). Tương tự như trường hợp đã biết i 2 trên, chúng ta có thể dễ dàng chứng minh phần dư vi này là đồng đều và chúng ta có thể áp dụng phương pháp WLS để ước lượng (15) như phần trước. 6/11/2015 39 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI Trường hợp 2: Phương sai sai số tỷ lệ với biến giải thích: E(ui 2) = 2 Xi. Chia 2 vế mô hỉnh (13) cho iX :  i i vX XX u X XX i2 i 1 i i2 i 1 i i 1 Y   (16) Trong đó vi = iX ui và có thể thấy ngay rằng E(vi 2) = 2 6/11/2015 40 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI Trường hợp 3: Phương sai của sai số tỷ lệ với bình phương của giá trị kỳ vọng của Y. Điều này nghĩa là: E(ui 2) = 2[E(Yi)] 2 . Trong trường hợp này, chúng ta thực hiện việc biến đổi như sau:  ii iii i i iii vX YEYEYE u X YEYEYE )( 1 )( 1 )()()( )( Y 21 21i   (17) Trong đó vi = )( i i YE u , var(vi) =  2 6/11/2015 41 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI Bước 1: Ước lượng mô hình hồi quy Yi = β1 + β2Xi + ui bằng phương pháp OLS thông thường, từ đó ta thu được  iY . Sau đó, sử dụng  iY để biến đổi mô hình gốc về dạng như sau:   i i i ii v Y X YY 21 i 1 Y  (18) Trong đó, vi =  i i Y u Bước 2: Ước lượng hồi quy (18), dù  iY không chính xác là E(Yi), nhưng chúng là ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi). Do vậy, phép biến đổi (18) có thể dùng được khi cỡ mẫu tương đối lớn. 6/11/2015 42 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI Trường hợp 4: Phép biến đổi loga Đôi khi thay vì dự đoán về i 2, chúng ta có thể định lại dạng của mô hình để làm giảm ảnh hưởng của phương sai sai số không đồng nhất. Chẳng hạn, thay vì ước lượng mô hình hồi quy gốc (13), ta có thể ước lượng mô hình hồi quy: lnYi = β1 + β2lnXi + ui (19) 6/11/2015 43 HIỆN TƯỢNG TỰ TƯƠNG QUAN 1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN Thuật ngữ tự tương quan có thể được định nghĩa như là “quan hệ tương quan giữa các thành viên của chuỗi của các quan sát được sắp xếp theo thời gian [như trong dữ liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu chéo].” 6/11/2015 44 1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN Hình 1: Các dạng phân phối của sai số ui hoặc (ei) 6/11/2015 45 *Nguyên nhân của sự tự tương quan Tính ì Hiện tượng mạng nhện Các độ trễ Xử lí số liệu Một cách xử lý khác là phép nội suy và ngoại suy số liệu Sai lệch do lập mô hình 6/11/2015 46 2. HẬU QUẢ CỦA TỰ TƯƠNG QUAN Ước lượng hệ số hồi quy vẫn là ước lượng không thiên lệch, nhưng không còn là ước lượng hiệu quả nhất Công thức ta dùng để tính phương sai ở các chương trước không thể áp dụng trong trừơng hợp này. Do đó, kiểm định giả thuyết, tính khoảng tin cậy, khoảng dự báo sẽ sai. 6/11/2015 47 CÁCH PHÁT HIỆN VÀ KHẮC PHỤC TỰ TƯƠNG QUAN 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 6/11/2015 48 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 6/11/2015 49 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 6/11/2015 50 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .927a .859 .855 11.17237 .234 Tra bảng Durbin-Watson, ở mức ý nghĩa α = 5%, dL= 1,393 và dU = 1,514. Theo kết quả chạy mô hình 0 < d = 0,234 < dL nên mô hình xảy ra hiện tượng tự tương quan dương. 6/11/2015 51 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 2.1. Trường hợp đã biết cấu trúc của tự tương quan Giả sử yếu tố nhiễu ui có tự tương quan bậc 1, nghĩa là: ut = ρut-1 + et (1) Trong đó  < 1 và et thoả mãn các giả định của phương pháp OLS. Giả sử (1) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tương quan ρ đã biết. Để làm sáng tỏ vấn đề này, ta xét mô hình hai biến: Yt = β1 + β2Xt + ut (2) Nếu (2) đúng với t thì cũng đúng với t – 1 nên: Yt-1 = β1 + β2Xt-1 + ut-1 (3) Nhân 2 vế phương trình (3) cho ρ, ta được: ρYt-1 = ρβ1 + ρβ2Xt-1 + ρut-1 (4) 6/11/2015 52 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 6/11/2015 53 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 6/11/2015 54 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN Phương pháp Durbin-Watson hai bước để ước lượng ρ Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng quát dưới dạng sau: Yt = β1(1- ρ) + β2Xt - ρ β2Xt-1 + ρYt-1 + et (5) Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ: Bước 1: Coi (5) như một mô hình hồi quy đa biến, hồi quy Yt theo Xt, Xt-1, Yt-1 và giá trị ước lượng được của các hệ số hồi quy của Yt-1 là giá trị ước lượng của ρ. Mặc dầu là ước lượng chệch nhưng ta có ước lượng vững của ρ. Bước 2: Sau khi ước lượng được   , hãy đổi biến Yt * = Yt -   Yt-1 , Xt * = Xt -   Xt-1 Và ước lượng hồi quy Yt * = β1 * + β2 *Xt * + et bằng phương pháp bình phương nhỏ nhất thông thường. 6/11/2015 55 BIẾN GIẢ VÀ CÁCH XÁC ĐỊNH MÔ HÌNH HỒI QUY CÓ SỰ XUẤT HIỆN CỦA BIẾN GIẢ 1. TỔNG QUAN VỀ BIẾN GIẢ Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính. Ví dụ khi nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của chính phủ là các biến không định lượng được. 6/11/2015 56 2. KỸ THUẬT BIẾN GIẢ 2.1. Hồi quy với biến giải thích là biến định tính 2.1.1. Biến định tính có hai phạm trù VD: Thu nhập có phụ thuộc giới tính ? Yi : thu nhập Di =    0 1 Nếu quan sát là Nam Nếu quan sát là Nữ Mô hình : Yi = 1 + 2Di + ui Thu nhập trung bình của nam E(Y/Di = 1) = 1 + 2 Thu nhập trung bình của nữ E(Y/Di = 0) = 1 Nếu 2  0 thì thu nhập trung bình có phụ thuộc giới tính Biến D dùng như trên gọi là biến giả. 6/11/2015 57 2. KỸ THUẬT BIẾN GIẢ Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm. STT Lương (Y: nghìn $) Giới D 1 22 Nam 1 2 19 Nữ 0 3 18 Nữ 0 4 21,7 Nam 1 5 18,5 Nữ 0 6 21 Nam 1 7 20,5 Nam 1 8 17 Nữ 0 9 17,5 Nữ 0 10 21,2 Nam 1 Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei 6/11/2015 58 Quy tắc đặt biến giả Biến giả chỉ nhận giá trị 0 và 1 Cá thể nào cũng phải có giá trị Biến giả chia tổng thể thành những thành phần riêng biệt 6/11/2015 59 2.1. Hồi quy với biến giải thích là biến định tính 1.1.2. Biến định tính có k phạm trù Lúc đó dùng k-1 biến giả để thay thế cho chúng. Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn? Yi: Chi phí cho văn hoá phẩm. D2i = 1: Trình độ tiểu học 0: Trình độ khác D3i = 1: Trình độ trung học 0: Trình độ khác D4i = 1: Trình độ đại học 0: Trình độ khác Mô hình có dạng: Yi = 1 + 2D2i + 3D3i + 4D4i + ui 6/11/2015 60 2.1. Hồi quy với biến giải thích là biến định tính 2.1.3. Mô hình có hai biến định tính Ví dụ: Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, giữa nam và nữ? D2 =    0 1 Nếu là nam Nếu là nữ D3 =    0 1 Nếu làm việc ở thành thị Nếu làm việc ở nông thôn E(Y/D2i, D3i) = 1 + 2D2i + 3D3i + ui Các chú ý:  Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1, n2, . . . nk thì phải dùng k – 1 biến giả.  Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùng để so sánh với các phạm trù khác.  Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.  Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ. 6/11/2015 61 2.1. Hồi quy với biến giải thích là biến định tính 2.1.4. Sự tương tác giữa các biến giả Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến điều đó ta thêm vào mô hình biến tương tác. Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc? Mô hình 1: Yi = 1 + 2D2i + 3D3i + 5Xi + ui Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác. Mô hình 2: Yi = 1 + 2D2i + 3D3i + 4D2i*D3i + 5Xi + ui Kiểm định H0: 4 = 0 (không có tương tác) H1: 4  0 (có tương tác) Lúc đó mức độ tương tác bằng 4. 6/11/2015 62 2.2. Dùng biến giả để phân tích biến động mùa vụ Xét mô hình: Yi = 1 + 2Xi + ui Nếu có sự biến động mùa vụ, chẳng hạn theo quý thì dùng 3 biến giả để đặc trưng cho chúng: D2 = 1: Quý II 0: Quý khác D3 = 1: Quý III 0: Quý khác D4 = 1: Quý II 0: Quý khác Ta có mô hình: Yi = 1 + 2D2i + 3D3i + 4D4i + 5Xi + ui Như vậy phạm trù cơ sở là quý I, nếu có ảnh hưởng theo mùa của từng quý khác nhau thì các hệ số 2, 3, 4 khác nhau có ý nghĩa thống kê.

Các file đính kèm theo tài liệu này:

  • pdfthong_ke_kinh_te_2_2167.pdf