Bài giảng Kinh tế lượng - Chương 6 Kiểm định và lựa chọn mô hình

R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình. R2 càng gần 1, mô hình cành phù hợp. Lưu ý: Nó chỉ đo lường sự phù hợp “trong mẫu” Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau. R2 không giảm khi tăng thêm biến độc lập.

ppt37 trang | Chia sẻ: truongthinh92 | Lượt xem: 7246 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng - Chương 6 Kiểm định và lựa chọn mô hình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 6 KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNHCác loại sai sót của dạng mô hình hồi quiHậu quả của sai sót mô hìnhPhương pháp phát hiện các sai sót của dạng mô hình hồi quiTiêu chuẩn lựa chọn mô hình Các loại sai sót của dạng mô hình hồi quiCác dạng sai sót của dạng mô hình như sau:Bỏ sót biến quan trọng, Đưa biến không liên quan vào mô hình, Sử dụng dạng hàm số không đúng, Sai số trong đo lường, vàXác định dạng của phần sai số không đúng. Ví dụ về hàm chi phí của doanh nghiệp, dạng hàm đúng sẽ là: Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (6.1) Bỏ sót biến quan trọng (Xi3):  Yi = a1 + a2Xi + a3Xi2 + u2i (6.2)Đưa biến không liên quan vào mô hình (Xi4): Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 +  u3i (6.4)Dạng hàm sai.   lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i (6.6)Sai lệch về đo lường. Yi* = b1* + b2*Xi* + b3*Xi*2 + b4*Xi*3 + ui*  trong đó Yi* = Yi + εi và Xi* = Xi + wi; εi và wi là sai số của phép đo lường. Như vậy, thay vì sử dụng các biến số đúng là Yi và Xi, chúng ta lại sử dụng các biến thay thế là Yi* và Xi* có chứa các sai số. dạng ngẫu nhiên không thích hợp của phần sai số: Yi = Xiui khác với Yi = Xi + ui,Theo trường phái trọng tiền, sự thay đổi của GDP của nền kinh tế chịu ảnh hưởng bởi sự thay đổi của lượng cung tiền, trong khi đó, theo Keynes, sự thay đổi của lượng chi mua hàng hóa dịch vụ của chính phủ sẽ ảnh hưởng lớn đến GDP. khi có sự sai sót, kết quả của phép ước lượng sẽ không thỏa mãn các đặc điểm của “ước lượng không chệch tuyến tính tốt nhất” (BLUE). chúng tôi chỉ tập trung phát hiện hai loại sai sót đầu tiên. Hậu quả của sai sót mô hìnhĐể minh họa, ta dùng mô hình 3 biến và xem xét 2 loại sai sót đầu tiên:Bỏ sót biến có liên quan: Giả sử dạng đúng của mô hình là: Yi = 1 + 2X2i + 3X3i + ui (1) Nhưng ta lại sử dụng mô hình: Yi = 1 + 2X2i + vi (2)Hậu quả của sai sót mô hìnhTa gặp những hậu quả sau:Nếu biến bị bỏ sót có tương quan với biến sẵn có trong mô hình, tức là r23  0, 1 và 2 sẽ bị chệch và không vững.Thậm chí nếu X2 và X3 không có tương quan thì 1 cũng bị chệch, mặc dù 2 không chệch.Var(ui) = 2 bị ước lượng sai.Var(2) là ước lượng chệch của var(2).Do vậy, khoảng tin cậy và các kiểm định không chính xác.Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.Hậu quả của sai sót mô hìnhĐưa vào mô hình biến không có liên quan Giả sử mô hình đúng như sau: Yi = 1 + 2X2i + ui (3) Nhưng ta lại ước lượng mô hình: Yi = 1 + 2X2i + 3X3i + vi (4)Những hậu quả:Các ước lượng OLS sẽ không chệch và vững, tức là: E(1)=1; E(2)=2; và E(3)=0; Hậu quả của sai sót mô hìnhPhương sai sai số, 2, được ước lượng đúng;Khoảng tin cậy và các kiểm định vẫn đáng tin cậy;Tuy nhiên, các ước lượng  không hiệu quả, tức là, phương sai của chúng có thể lớn hơn phương sai của .Phương pháp phát hiện các sai sót của dạng mô hình hồi qui1. Phát hiện sự hiện diện của các biến không liên quan Yi = b1 + b2X2i + + bkXki + ui Xk có thực sự nằm trong mô hình hay không, dùng kiểm định t:=> khai thác dữ liệu =>có thể dẫn tới sai lầm sau khai thác dữ liệu (data mining)chúng ta lựa ra k biến (k ≤ c) mức ý nghĩa thực sự (*) từ mức ý nghĩa danh nghĩa () có thể được tính theo công thức sau:             * ≈ (c/k).                nếu c = 15, k = 5, và  = 5%, ta có thể tính được mức ý nghĩa thực sự là (15/5).(5) = 15%. lưu ý rằng khi c = k thì sẽ không có hiện tượng khai thác dữ liệu.   2. Kiểm định biến bị bỏ sót và dạng hàm số không đúng2.1 Kiểm tra phần dưhàm chi phí của doanh nghiệp: Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i (1) Yi = a1 + a2Xi + a3Xi2 + u2i (2) Yi = a1 + a2Xi + u3i (3)-400-2000200400Residuals0246810sanluong3212.2 Kiểm định Durbin-Watson dH0: mô hình không có tự tương quanH0:  = 0; H1:   0. Nếu d F tra bảng ở một mức ý nghĩa nào đó, ta chấp nhận có việc bỏ sót biến.Ví dụ:Kiểm định RESET của Ramsey: ví dụVí dụ:H0: mô hình không bỏ sót biếnGiá trị kiểm định F thu được trực tiếp từ phần mềm StataovtestRamsey RESET test using powers of the fitted values of chiphi Ho: model has no omitted variables F(3, 4) = 1.52 Prob > F = 0.33802.3 Kiểm định RESET của RamseyMột thuận lợi của phương pháp RESET là nó dễ áp dụng bởi vì nó không đòi hỏi chúng ta phải biết rõ các dạng mô hình liên quan. Tuy nhiên, đó cũng lại là bất lợi của phương pháp này bởi vì khi chúng ta biết mô hình có sai sót, chúng ta không có dạng mô hình tốt hơn để thay thế. 2.4 Kiểm định hệ số Lagrange (LM) đối với biến thêm vàoNếu chúng ta so sánh hàm chi phí tuyến tính với hàm chi phí bậc ba thì hàm tuyến tính chính là một phiên bản bị giới hạn của hàm bậc ba. H0: hệ số của biến sản lượng bình phương và lập phương đều bằng không. Các biến tiến hành:Kiểm định hệ số Lagrange Ước lượng “phiên bản bị giới hạn” bằng OLS và thu thập sai số, ei.Nếu “phiên bản không bị giới hạn” là đúng thì ei ở trên sẽ có tương quan với X2 và X3.Chạy hồi quy ei theo tất cả các biến: ei = 1 + 2Xi + 3Xi2 + 4X3 + vivi thỏa các giả định của mô hình CLRM.Khi cở mẫu lớn, Kiểm định hệ số Lagrange Nếu nR2 > 2 tra bảng, ta bác bỏ H0: các hệ số của X2 và X3 bằng không; tức là chúng khác 0, hay mô hình bỏ sót biến.Ví dụ: ta trở lại hàm chi phí tuyến tính:nR2 = 10.(0,9896)=9,896 > 2 tra bảng = 9,2. Kết quả này giống như kiểm định RESET.3. Sai số của phép đo lường dữ liệu có thể thiếu chính xác do một số lý do như: sai số khi cung cấp thông tin, sai số khi báo cáo hay sai số tính toán. gây ra những mô hình sai lệch.Chúng ta có thể xem xét hậu quả của việc này trong 2 trường hợp:3.1. Sai số trong biến phụ thuộc Y:3.1. Sai số trong biến phụ thuộc Y:Giả sử ta có mô hình: Yi* =  + Xi + ui (1)Yi*: tiêu dùng thường xuyên của hộ; Xi: thu nhập hiện hành và ui: sai số ngẫu nhiên.Do Yi* không thể đo lường trực tiếp được nên ta quan sát: Yi = Yi* + i (2)Ta viết lại (1): Yi = ( + Xi + ui) + i =  + Xi + (ui + i) =  + Xi + vi (3)Nếu ui và i thỏa mãn các giả định của CLRM thì các ước lượng OLS vẫn không chệch nhưng phương sai của ước lượng  sẽ thay đổi3.1. Sai số trong biến phụ thuộc Y:Ta thấy phương sai, và do đó sai số chuẩn sẽ tăng lên khi có sai số trong đo lường Yi.3.2 Sai số trong đo lường biến độc lập Xi:Giả sử ta có mô hình: Yi =  + Xi* + ui (4)Thay vì quan sát được Xi*, ta quan sát Xi: Xi = Xi* + wi (5)Do vậy, thay vì ước lượng (4), ta lại ước lượng: Yi =  + (Xi – wi) + ui =  + Xi + (ui - wi) =  + Xi + zi (6)Bây giờ, thậm chí wi có trung bình bằng 0, độc lập và không tương quan với ui, chúng ta cũng không thể có zi độc lập với Xi.3.2 Sai số trong đo lường biến độc lập Xi:Cov(zi, Xi) = E[zi – E(zi)][Xi – E(Xi – E(Xi)] = E(ui - wi)wi=E(-wi2)=-w2  0Do vậy, Xi và zi có tương quan và vi phạm các giả định của CLRM. Các ước lượng OLS chẳng những bị chệch mà còn không vững.Hậu quả của loại sai sót nghiêm trọng nhưng khó có thể khắc phục nó vì ta không biết Xi được như thế nào cho đúng.Ta có thể giả định w2 rất nhỏ nên xem như không có sai số này và dùng OLS bình thường.4. Xác định dạng của phần sai số không đúngDo chúng ta không thể quan sát trực tiếp phần sai số nên để định dạng cho nó không phải là việc dễ dàng. Chúng ta xem lại phần sai số sau: Yi = Xiui (*) và Yi = Xi + ui (**)Nếu (*) đúng nhưng lại ước lượng (**), thì ước lượng  sẽ chệch.Tiêu chuẩn lựa chọn mô hìnhR2, R2 điều chỉnh, Tiêu chuẩn thông tin Akaike (AIC), Tiêu chuẩn thông tin Schwarz (SIC), Tiêu chuẩn Cp của Mallows, và dự báo χ2. Martin Feldstein:“Nhà kinh tế lượng ứng dụng, giống như các nhà lý thuyết, nhanh chóng phát hiện ra rằng một mô hình hữu ích không phải là một mô hình “đúng” hay “thực tế” mà là một mô hình tiết kiệm, đáng tin cậy và cung cấp nhiều thông tin”. Tiêu chuẩn R2R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình.R2 càng gần 1, mô hình cành phù hợp.Lưu ý:Nó chỉ đo lường sự phù hợp “trong mẫu”Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau.R2 không giảm khi tăng thêm biến độc lập.Tiêu chuẩn R2 điều chỉnh (R2)Ta thấyR2  R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1.Do vậy,R2 là tiêu chuẩn tốt hơn R2.Lưu ý, các biến phụ thuộc cũng phải giống nhau. Tiêu chuẩn thông tin Akaike (AIC)Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cở mẫu.Ta thấy AIC phát hiện sai sót khắt khe hơn các tiêu chuẩn trên khi tăng thêm số biến.Mô hình nào AIC thấp hơn thì tốt hơnĐể tiện lợi cho việc tính toán, ta lấy log:Tiêu chuẩn thông tin Schwarz (SIC)SIC còn khắt khe hơn AIC.SIC càng nhỏ, mô hình càng tốt.hayTiêu chuẩn Cp của Mallows

Các file đính kèm theo tài liệu này:

  • pptchuong_6_thong_7871.ppt