Bài giảng Kinh tế lượng - Chương 2 Phân tích mô hình hồi qui đa biến

Khi thu nhập tăng thêm 1 đồng, chi tiêu đầu người tăng bình quân 0,082 đồng, trong điều kiện các yếu tố khác không đổi. Khi số nhân khẩu trong gia đình tăng thêm 1 người, chi tiêu đầu người giảm bình quân 376.000 đồng, trong điều kiện các yếu tố khác không đổi. Khi số trẻ em trong gia đình tăng thêm 1, chi tiêu đầu người giảm bình quân 146.000 đồng.

54 trang | Chia sẻ: truongthinh92 | Lượt xem: 1580 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Kinh tế lượng - Chương 2 Phân tích mô hình hồi qui đa biến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Chương 2: Phân tích mô hình hồi qui đa biếnKhái niệm về phân tích hồi quyMô hình hồi qui hai biếnPhương pháp bình phương nhỏ nhấtCác giả định của mô hình hồi qui đa biếnĐộ chính xác và sai số chuẩn của ước lượngKiểm định giả thuyết mô hìnhVí dụ mô hình hồi qui đa biến1Khái niệm về phân tích hồi quyPhân tích hồi quy đề cập đến việc nghiên cứu sự phụ thuộc của một biến số, biến phụ thuộc, vào một hay nhiều biến số khác, biến độc lập, với ý định ước lượng và/hoặc dự đoán giá trị trung bình (tổng thể) của biến phụ thuộc dựa trên những giá trị đã biết hay cố định của biến độc lập. 2Ví dụ 1Chúng ta quan tâm đến việc dự báo chiều cao trung bình của những người con khi biết chiều cao của người cha.Dùng biểu đồ phân tán để biểu diễn phân phối chiều cao của những người con trong một tổng thể tương ứng với chiều cao của những người cha được cho trước hay cố định 3Chiều cao của người con(tính bằng inch)Chiều cao của người cha(tính bằng inch)Hình 1.1 Phân phối giả thiết của chiều cao của những người con trai tương ứng với chiều cao của người cha được cho trướcGiá trị trung bình4Ví dụ khácMột nhà kinh tế có thể quan tâm đến việc nghiên cứu sự phụ thuộc của chi tiêu cá nhân vào thu nhập cá nhân sau thuế hay thu nhập khả dụng thực tế. Một nhà độc quyền, người có thể ấn định giá hay sản lượng (nhưng không cả hai) có thể muốn tìm ra phản ứng của cầu đối với sản phẩm khi giá thay đổi. Thực nghiệm này có thể cho phép sự ước lượng hệ số co giãn theo giá 5Mô hình hồi qui hai biếnHàm hồi qui tổng thể (population regression function – PRF) có dạng: E(Y/Xi) = f(Xi) Nếu PRF có 1 biến độc lập thì được gọi là hàm hồi qui đơn (hồi qui hai biến), nếu có từ 2 biến độc lập trở lên được gọi là hàm hồi qui bộiHàm hồi qui tổng thể cho biết giá trị trung bình của biến Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau.6Một ví dụ giả thiếtGiả sử có một tổng thể gồm 60 hộ gia đình, có thu nhập (X) và chi tiêu (Y) hàng tuần như sau7Một ví dụ giả thiết Mặc dù có sự biến động lớn của Y ứng với mỗi giá trị của X, nhưng, một cách tổng quát, X thì Y Giá trị kỳ vọng của Y ứng với một giá trị nào đó của X đgl Giá trị kỳ vọng có điều kiện, ký hiệu: E(Y|X)Ví dụ: E(Y|X=80) = 65; E(Y|X=260) = 173Giá trị kỳ vọng không có điều kiện: E(Y) = 7273/60 = 121,208Phân phối có điều kiện của chi tiêu ứng với các mức thu nhập khác nhau 9Hàm hồi quy tổng thểĐường nối các điểm tròn đen trong hình là đường hồi quy tổng thể, biểu diễn sự hồi quy của Y vào X.Về mặt hình học, một đường hồi quy tổng thể là quỹ tích các giá trị trung bình có điều kiện của biến phụ thuộc ứng với mỗi giá trị cố định của biến giải thích.Ứng với mỗi giá trị của X, có một tổng thể các giá trị của Y, dao động xung quanh giá trị kỳ vọng có điều kiện của Y.10Đường hồi quy tổng thể11Mô hình hồi quy tuyến tínhVậy kỳ vọng có điều kiện E(Y|Xi) là một hàm số của Xi: E(Y|Xi) = f(Xi)Dạng hàm f(Xi) phụ thuộc vào các mối quan hệ kinh tế (thường được xác định dựa vào các lý thuyết kinh tế).Ở đây, ta thường sử dụng hàm số tuyến tính:12Mô hình hồi qui hai biếnPRF tuyến tính: E(Y/Xi) = β1+ β2Xi trong đó β1, β2 là các tham số chưa biết nhưng cố định – các tham số hồi qui.β1 là hệ số tự do, cho biết giá trị trung bình của biến phụ thuộc Y sẽ thay đổi như thế nào khi biến X nhận giá trị 0.β2 là hệ số góc, cho biết giá trị trung bình của biến phụ thuộc Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi giá trị của biến độc lập X tăng 1 đơn vị với điều kiện các yếu tố khác không thay đổi.13Mô hình hồi qui hai biếnThuật ngữ “tuyến tính” ở đây được hiểu theo hai nghĩa: tuyến tính đối với tham số và tuyến tính đối với biến. - E(Y/Xi) = β1+ β2Xi2 là tuyến tính tham số - E(Y/Xi) = β1+ β22Xi là tuyến tính biến số.Hàm hồi qui tuyến tính luôn được hiểu là tuyến tính đối với tham số, nó có thể không tuyến tính đối với biến.14Các hàm số tuyến tính đối với tham số 15Mô hình hồi qui hai biếnỨng với mỗi giá trị của X, giá trị Y của một số quan sát có độ lệch so với giá trị kỳ vọng.Giá trị quan sát thứ i của biến phụ thuộc Y được ký hiệu là Yi. - Ký hiệu Ui là chênh lệch giữa Yi và E(Y/Xi) Ui = Yi - E(Y/Xi) hay Yi = E(Y/Xi) + Ui (dạng ngẫu nhiên PRF) Ui đgl đại lượng ngẫu nhiên hay sai số ngẫu nhiênLý do cho sự tồn tại của Ui Yếu tố đại diện cho các biến không đưa vào mô hình (biến không rõ, không có số liệu, ảnh hưởng quá nhỏ )16Mô hình hồi qui hai biếnTrong thực tế, ta thường phải ước lượng các hệ số hồi quy của tổng thể từ hệ số hồi quy của mẫu.Hàm hồi qui mẫu (sample regression function – SRF): sử dụng khi chúng ta không thể lấy tất cả thông tin từ tổng thể mà chỉ thu thập được từ các mẫu riêng lẻ từ tổng thể.Nếu hàm PRF có dạng tuyến tính (E(Y/Xi) = β1+ β2Xi), ta có SRF:trong đó là ước lượng điểm của E(Y/Xi) là ước lượng điểm của β1; là ước lượng điểm của β2;17Hàm hồi qui mẫuDạng ngẫu nhiên của SRF: ei là ước lượng điểm của Ui và gọi là phần dư hay sai số ngẫu nhiên18Hàm hồi qui mẫu SRF19Hàm hồi qui mẫuRõ ràng, các ước lượng từ hàm hồi quy mẫu có thể ước lượng cao hơn (overestimate) hay ước lượng thấp hơn (underestimate) giá trị thực của tổng thể.Vấn đề đặt ra là SRF được xây dựng như thế nào để càng gần i thực càng tốt, mặc dù ta không bao giờ biết i thực.20Phương pháp bình phương nhỏ nhất (OLS)Ta có hàm SRF:Ta muốn tìm và sao cho gần bằng với Y nhất, có nghĩa là ei nhỏ nhất. Tuy nhiên, ei thường rất nhỏ và thậm chí bằng 0 vì chúng triệt tiêu lẫn nhau.Để tránh tình trạng này, ta dùng phương pháp “Bình phương nhỏ nhất” 21Phương pháp OLS Bây giờ, ta muốn tìm và sao cho ei2 nhỏ nhất. Lưu ý rằng biểu thức trên có thể được xem như là một hàm số theo và và chúng ta cần tìm các  sao biểu thức đạt cực tiểu Vậy để tìm giá trị cực tiểu của biểu thức trên, ta cần tính đạo hàm của hàm số trên theo các  và cho các đạo hàm =0. 22Phương pháp OLSGiải hệ ta được:Ta được hệ phương trình chuẩn:23Phương pháp OLSvàđgl các ước lượng bình phương nhỏ nhất của 1 và 2Các thuộc tính củavàCác ước lượng OLS là các ước lượng điểm, có nghĩa là, với mẫu cho trước, mỗi ước lượng chỉ cho biết duy nhất một giá trị của tham số của tổng thể nghiên cứu.Một khi thu được các ước lượng từ mẫu, ta có thể vẽ được đường hồi quy mẫu và đường này có những đặc tính sau:24Đặc điểm của đường hồi quy mẫuNó đi qua giá trị trung bình mẫu của X và Y, do 25Đặc điểm của đường hồi quy mẫu2. Giá trị ước lượng trung bình của Y bằng với giá trị trung bình của Y quan sát.3. Giá trị trung bình của sai số ei bằng 0: ei = 0.4. Sai số ei không có tương quan với giá trị dự báo Yi.5. Sai số ei không có tương quan với Xi.26Giả định của mô hình hồi qui đa biếnGiả định 1: Tuyến tính các tham số hồi qui (linear in parameters).Giả định 2: Các giá trị mẫu của xj được ước lượng đúng, không có sai số (random sampling): Giá trị các biến giải thích là các số đã được xác định.Giả định 3: Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 (zero conditional mean). E(u/xi) = 027Giả định 3: E(ui/xi) = 028Giả định của mô hình hồi qui đa biếnGiả định 4: Các sai số u độc lập với biến giải thích. Cov(ui, Xi) = 0Giả định 5: Các sai số u có phương sai bằng nhau (homoscedasticity). Var(u/xi) = σ229Giả định 5: Var(u/xi) = σ2 30Phương sai sai số không đồng nhất: var(ui|Xi) = i231Giả định của mô hình hồi qui đa biếnGiả định 6: Các sai số u từng cặp độc lập với nhau. Cov(ui, ui’) = E(uiui’) = 0, nếu i  i’32Giả định của mô hình hồi qui đa biến(7) Giả định: Không có biến độc lập nào là hằng số, và không tồn tại các mối liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập (no perfect multicollinearity).(8) Số quan sát n phải lớn hơn số biến độc lập.(9) Mô hình hồi quy được xác định đúng đắn: không có sai lệch về dạng mô hình.33Sai lệch về dạng mô hình34Độ chính xác hay sai số chuẩn của các ước lượng OLSCác giá trị của ước lượng OLS phụ thuộc vào số liệu của mẫu. Số liệu giữa các mẫu khác nhau lại khác nhau => cần đo lường độ chính xác của các ước lượng.Ta đo lường độ chính xác bằng sai số chuẩn (standard error – se).35Sai số chuẩn của các ước lượng OLSTrong đó: var: phương sai; se: sai số chuẩn và 2: phương sai của sai số, có thể được ước lượng bằng công thức:: Tổng bình phương của các sai số (Residual sum of squares – RSS)36Sai số chuẩn của các ước lượng OLSSai số chuẩn của ước lượng hay còn gọi là sai số chuẩn của hồi quy (se): nó là độ lệch giữa giá trị Y so với đường hồi quy được ước lượng và được dùng để chỉ “Độ tin cậy của mô hình” (goodness of fit). 37Một số đặc điểm của phương sai hay se của các ước lượng OLSPhương sai của ước lượng 2 tỷ lệ với 2, nhưng nghịch biến với xi2. Do vậy, X biến động càng lớn, se càng nhỏ => ước lượng càng chính xác; n càng lớn, càng chính xác.Phương sai của ước lượng 1 tỷ lệ với 2 và Xi2, nhưng nghịch biến với xi2 và cở mẫu38Định lý Gauss-MarkovMột ước lượng được gọi là “ước lượng không chệch tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện:Nó là tuyến tính, có nghĩa là một hàm tuyến tính của một biến ngẫu nhiên,Nó không chệch,Nó có phương sai nhỏ nhất, hay còn gọi là ước lượng hiệu quả (efficient estimator).Định lý: Với những giả định của mô hình hồi quy cổ điển, các ước lượng bình phương bé nhất có phương sai nhỏ nhất, trong nhóm những ước lượng tuyến tính không chệch, tức là, chúng là BLUE.39Hệ số xác định R2: một thước đo Độ tin cậy của mô hìnhGọi TSS (Tổng bình phương sai số tổng cộng): TSS = (Yi -Y)2ESS: bình phương sai số được giải thích ESS = ( -Y)2RSS: tổng bình phương sai số: RSS = ei2Ta chứng minh được: TSS = ESS + RSS40Hệ số xác định R2R2 cho biết % sự biến động của Y được giải thích bởi các biến số X trong mô hình.0 1, R2 t/2, (n-k): ta bác bỏ giả thuyết H0 và chấp nhận H1: i  0 ở mức độ tin cậy , có nghĩa là Xi có ảnh hưởng đến Y.48Kiểm định giả thuyết mô hình2. Kiểm định ảnh hưởng tất cả các biến độc lập cùng lúcGiả thuyết của kiểm định này là: H0: 2 = 3 =... = k = 0 Bác bỏ giả thuyết H0 khi F > F(k-1, n-k),, nghĩa là có ít nhất một tham số khác 0 ; hoặc là có ít nhất một biến có ảnh hưởng đến Y. F F=0Residual2.77E+1059954619197R-squared=0.3584Adj R-squared=0.358Total4.32E+1059987195461Root MSE=2149.2pcexpCoef.Std. Err.tP>t[95% Conf.Interval]rincome0.0820.0051.900.0000.080.08hhsize-376.46820.22-18.620.000-416.11-336.83child-145.95127.57-5.290.000-199.99-91.91_cons4001.69175.1553.250.0003854.374149.0152Trình bày Kết quả se (75,148) (0,0015) (20,222) (27.567)t 53.25*** 51,90*** -18,62*** -5,29*** R2 = 35,8%, chứng tỏ, các biến độc lập trong mô hình giải thích được 35,8% sự biến động của chi tiêu bình quân đầu người trong hộ. Do giá trị t của các hệ số đều lớn hơn giá trị t5%, ta bác bỏ các giả thuyết H0, cho rằng các hệ số bằng 0. Hay ta có thể gọi các hệ số được ước lượng đều có ý nghĩa ở mức 5%.53Trình bày và giải thích Kết quả se (75,148) (0,0015) (20,222) (27.567)t 53.25*** 51,90*** -18,62*** -5,29*** Khi thu nhập tăng thêm 1 đồng, chi tiêu đầu người tăng bình quân 0,082 đồng, trong điều kiện các yếu tố khác không đổi. Khi số nhân khẩu trong gia đình tăng thêm 1 người, chi tiêu đầu người giảm bình quân 376.000 đồng, trong điều kiện các yếu tố khác không đổi. Khi số trẻ em trong gia đình tăng thêm 1, chi tiêu đầu người giảm bình quân 146.000 đồng.54

Các file đính kèm theo tài liệu này:

chuong_2_thong_6252.ppt