Bài giảng xác suất thống kê - Chương 2: Mô hình hồi quy hai biến

a) Nêu ý nghĩa kinh tế của các hệ số hồi quy b) Xét xem giá bán có ảnh hưởng ñến doanh số bán không (với mức ý nghĩa 5%)? c) Nếu giá bán là 8,5 ngàn ñồng /kg thì doanh số bán trung bình là bao nhiêu (ñộ tin cậy 95%)?

pdf9 trang | Chia sẻ: nguyenlam99 | Lượt xem: 939 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng xác suất thống kê - Chương 2: Mô hình hồi quy hai biến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
MÔ HÌNH HỒI QUY HAI BIẾN Chương 2 I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU 1. Hàm hồi quy tổng thể của hồi quy 2 biến Nếu chỉ nghiên cứu một biến phụ thuộc bị ảnh hưởng bởi một biến ñộc lập => Mô hình hồi quy hai biến Trong quan hệ hồi quy , một biến phụ thuộc có thể ñược giải thích bởi nhiều biến ñộc lập Nếu mối quan hệ giữa hai biến này là tuyến tính => Mô hình hồi quy tuyến tính hai biến Hàm hồi quy tổng thể (PRF) của mô hình hồi quy hai biến iii UXYPRF ++= 21: ββ Trong ñó Y : Biến phụ thuộc Yi : Giá trị cụ thể của biến phụ thuộc X : Biến ñộc lập Xi : Giá trị cụ thể của biến ñộc lập Ui : Sai số ngẫu nhiên ứng với quan sát thứ i I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU Trong ñó β1 : Là giá trị trung bình của biến phụ thuộc Y khi biến ñộc lập X nhận giá trị bằng 0 β2 : Là lượng thay ñổi trung bình của Y khi X thay ñổi 1 ñơn vị β1,β2 là các tham số của mô hình với ý nghĩa : I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU Hàm hồi quy tổng thể (PRF) của mô hình hồi quy hai biến iii UXYPRF ++= 21: ββ 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 T iê u dù n g Y (tr ie u ño n g/ th án g ) ðồ thị minh họa Thu nhập X (triệu ñồng/tháng) Yi PRF Ui ii XY 21ˆ ββ += I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU 2. Hàm hồi quy mẫu của hồi quy 2 biến Trong thực tế rất khó nghiên cứu trên tổng thể nên thông thường người ta nghiên cứu xây dựng hàm hồi quy trên một mẫu => Gọi là hàm hồi quy mẫu 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 T iê u dù n g Y (tr ie u ño n g/ th án g ) ei Yi 1 ˆβ 2 ˆβ ii XY 21 ˆˆˆ ββ += SRF ðồ thị minh họa Thu nhập X (triệu ñồng/tháng) I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU iii eXYSRF ++= 21 ˆˆ: ββ Trong ñó là ước lượng của β11ˆβ Là ước lượng của β22ˆβ Sai số ngẫu nhiên , là ước lượng của Uiie 2. Hàm hồi quy mẫu của hồi quy 2 biến I. HÀM HỒI QUY TỔNG THỂ VÀ HÀM HỒI QUY MẪU iii eXYSRF ++= 21 ˆˆ: ββ Nếu bỏ qua sai số ngẫu nhiên ei , thì giá trị thực tế Yi sẽ trở thành giá trị ước lượng ii XYSRF 21 ˆˆˆ: ββ += iYˆ 2. Hàm hồi quy mẫu của hồi quy 2 biến 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8T iê u dù n g Y (tr ie u ño n g/ th án g ) ei Thu nh?p X (tri?u ñ?ng /tháng) SRF ei ei ei ei ei ei II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 1. Ước lượng các tham số của mô hình iiiii XYYYe 21 ˆˆˆ ββ −−=−= iii eXY ++= 21 ˆˆ ββ ii XY 21 ˆˆˆ ββ += Giá trị thực tế Giá trị ước lượng Sai số ( ) minˆˆ 2 1 21 1 2 →−−=∑∑ == n i ii n i i XYe ββ Tìm 21 ˆ,ˆ ββ sao cho tổng bình phương sai số là nhỏ nhất Tức là Tại sao chúng ta không tìm Σei nhỏ nhất ? II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) Giải bài toán cực trị hàm hai biến , ta ñược XY XnX YXnXY n i i n i ii 21 1 22 1 2 ˆˆ ).( .. ˆ ββ β −= − − = ∑ ∑ = = Với n X X i∑= là giá trị trung bình của X và n Y Y i∑= là giá trị trung bình của Y và Ví dụ áp dụng Quan sát về thu nhập (X – triệu ñồng/năm) và chi tiêu (Y – triệu ñồng/năm) của 10 người, ta ñược các số liệu sau : 48423623412930384229Yi 50454035503945475031Xi ii XY 21 ˆˆˆ ββ +=Xây dựng hàm hồi quy mẫu TB TC 10 9 8 7 6 5 4 3 2 1 STT 35.843.2 1906615851358432 250024004850 202518904245 160014403640 12258052335 250020504150 152111312939 202513503045 220917863847 250021004250 9618992931 Xi2Xi*YiYiXi ∑ =⇒= 2,43432 XX i 8,35358 =⇒=∑ YYi ∑ =15851iiYX ∑ =190662iX 9549,0 )2,43(1019066 8,352,431015851 ).( .. ˆ 2 1 22 1 2 = ×− ××− = − − = ∑ ∑ = = n i i n i ii XnX YXnXY β 4517,52,439549,08,35ˆˆ 21 −=×−=−= XY ββ Kết quả ví dụ : ii XY 9549,04517,5ˆ +−= Hàm hồi quy mẫu Ý nghĩa : II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 2. Các giả thiết của mô hình Giả thiết 1 : Các giá trị Xi cho trước và không ngẫu nhiên Giả thiết 2 : Các sai số Ui là ñại lượng ngẫu nhiên có giá trị trung bình bằng 0 Giả thiết 3 : Các sai số Ui là ñại lượng ngẫu nhiên có phương sai không thay ñổi II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 2. Các giả thiết của mô hình Giả thiết 4 : Không có sự tương quan giữa các Ui Giả thiết 5 : Không có sự tương quan giữa Ui và Xi Khi các giả thiết này ñược ñảm bảo thì các ước lượng tính ñược bằng phương pháp OLS là các ước lượng tốt nhất và hiệu quả nhất của hàm hồi quy tổng thể Ta nói, ước lượng OLS là ước lượng BLUE (Best Linear Unbias Estimator) II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 3. Hệ số xác ñịnh của mô hình Tổng bình phương toàn phần TSS (Total Sum of Squares) ∑∑ −=−= 22 2 )()( YnYYYTSS ii Tổng bình phương hồi quy ESS (Explained Sum of Squares) )(ˆ)ˆ( 2222 2 ∑∑ −=−= XnXYYESS ii β Tổng bình phương phần dư RSS (Residual Sum of Squares) ∑∑ =−= 22)ˆ( iii eYYRSS II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 3. Hệ số xác ñịnh của mô hình O SRF)( YYi − )ˆ( YYi − )ˆ( YYi − iX iY iYˆ Y RSS TSS ESS II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT (OLS) 3. Hệ số xác ñịnh của mô hình Người ta chứng minh ñược RSSESSTSS += Hệ số xác ñịnh TSS ESSR =2 •0 ≤ R2 ≤ 1 •R2 = 1 : mô hình hoàn toàn phù hợp với mẫu nghiên cứu •R2 = 0 : mô hình không phù hợp với mẫu nghiên cứu Ví dụ áp dụng Từ số liệu ñã cho của ví dụ trước , yêu cầu tính hệ số xác ñịnh của mô hình 19066 2500 2025 1600 1225 2500 1521 2025 2209 2500 961 Xi2 TB TC 10 9 8 7 6 5 4 3 2 1 STT 35.843.2 1336415851358432 230424004850 176418904245 129614403640 5298052335 168120504150 84111312939 90013503045 144417863847 176421004250 8418992931 Yi2Xi*YiYiXi III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 1. Các ñại lượng ngẫu nhiên Giả sử Ui ~ N(0,σ2) Theo giả thiết của phương pháp OLS, Ui là ñại lượng ngẫu nhiên có giá trị trung bình bằng 0 và phương sai không thay ñổi Khi ñó σ2 ñược gọi là phương sai của tổng thể , rất khó tính ñược nên thường ñược ước lượng bằng phương sai mẫu 22 )ˆ( 2 ˆ 22 2 − = − − = − = ∑∑ n RSS n YY n e iiiσ a. ðại lượng ngẫu nhiên Ui Vì Ui ~ N(0,σ2) Nên Yi ~ N(β1+β2Xi,σ2) iii UXY ++= 21 ββTa có III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 1. Các ñại lượng ngẫu nhiên a. ðại lượng ngẫu nhiên Ui III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 1. Các ñại lượng ngẫu nhiên b. ðại lượng ngẫu nhiên 21 ˆ,ˆ ββ Vì sao là các ñại lượng ngẫu nhiên ?21 ˆ,ˆ ββ Giả sử : ),(~ˆ 2 ˆ11 1βσββ N ),(~ˆ 2 ˆ22 2βσββ N Trong ñó 2 ˆ 1βσ là phương sai của 1 ˆβ 2 ˆ 2βσ là phương sai của 2 ˆβ III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 1. Các ñại lượng ngẫu nhiên Với 2 22 2 2 ˆ ˆ)(1 σσ β ∑ ∑ − = XnXn X i i ∑ − = 22 2 2 ˆ ˆ 2 XnX i σ σ β 2 ˆ1 1 )ˆ( βσβ =se ñộ lệch chuẩn của 1ˆβ 2 ˆ2 2 )ˆ( βσβ =se ñộ lệch chuẩn của 2ˆβ III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 2. Các khoảng tin cậy a. Khoảng tin cậy của β2         ×+×− )ˆ(ˆ);ˆ(ˆ 2 2 22 2 2 ββββ αα setset Khoảng tin cậy của β2 với ñộ tin cậy 1-α là Với có ñược khi tra bảng t-Student với bậc tự do (n-2), mức ý nghĩa α/2 2 αt III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 2. Các khoảng tin cậy b. Khoảng tin cậy của β1         ×+×− )ˆ(ˆ);ˆ(ˆ 1 2 11 2 1 ββββ αα setset Khoảng tin cậy của β1 với ñộ tin cậy 1-α là Giải thích ý nghĩa của ñộ tin cậy (1- α), ví dụ (1- α) =95%? Ví dụ áp dụng Từ số liệu ñã cho của ví dụ trước , yêu cầu tính khoảng tin cậy của β1, β2 với ñộ tin cậy 95% Nhắc lại về giả thiết H0 Trong thống kê, giả thiết phát biểu cần ñược kiểm ñịnh ñược gọi là giả thiết không ( ký hiệu : H0). Giả thiết ñối ñược ký hiệu là giả thiết H1 III. KiỂM ðỊNH MÔ HÌNH HỒI QUY ðúngSai lầm loại IH0 ñúng Sai lầm loại IIðúng H0 sai Chấp nhận H0Báo bỏ H0 Người ta thường ñặt giả thiết H0 sao cho sai lầm loại I là nghiêm trọng ( nguy hiểm) hơn sai lầm loại II III. KiỂM ðỊNH MÔ HÌNH HỒI QUY ðặt α là khả năng mắc sai lầm loại I ⇒ α là mức ý nghĩa của kiểm ñịnh ⇒ 1- α là ñộ tin cậy của kiểm ñịnh Chú ý  Khi nói “chấp nhận giả thiết H0”, không có nghĩa H0 ñúng.  Lựa chọn mức ý nghĩa α : α có thể tùy chọn, thường người ta chọn mức 1%, 5%, hoặc 10%. III. KiỂM ðỊNH MÔ HÌNH HỒI QUY Các giả thiết cần kiểm ñịnh gồm  Các giả thiết về hệ số hồi quy  Kiểm ñịnh hệ số xác ñịnh của mô hình Các cách kiểm ñịnh cơ bản : o Phương pháp khoảng tin cậy o Phương pháp giá trị tới hạn o Phương pháp p-value ( dùng máy vi tính) III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 3. Kiểm ñịnh giả thiết về hệ số hồi quy a. Kiểm ñịnh giả thiết về β2 Giả thiết Ho:β2 = βo H1:β2 ≠ βo ñộ tin cậy là 1-α III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 3. Kiểm ñịnh giả thiết về hệ số hồi quy Phương pháp khoảng tin cậy Bước 1 : Lập khoảng tin cậy của β2 Bước 2 : Nếu β0 thuộc khoảng tin cậy thì chấp nhận H0. Nếu β0 không thuộc khoảng tin cậy thì bác bỏ H0 a. Kiểm ñịnh giả thiết về β2 III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 2. Kiểm ñịnh giả thiết về hệ số hồi quy a. Kiểm ñịnh giả thiết về β2 Phương pháp giá trị tới hạn (kiểm ñịnh t) Bước 1 : tính giá trị tới hạn Bước 2 : tra bảng t-Student với bậc tự do (n-2) tìm tα/2 Bước 3 : Nếu -tα/2 ≤ t ≤ tα/2 : chấp nhận giả thiết H0 Nếu t tα/2 : bác bỏ giả thiết H0 )ˆ( ˆ 2 02 β ββ se t − = III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 2. Kiểm ñịnh giả thiết về hệ số hồi quy a. Kiểm ñịnh giả thiết về β2 Phương pháp p-value Bước 1 : tính giá trị tới hạn Bước 2 : Tính p_value = P(|t| > |tα/2|) (tức là khả năng giả thiết H0 bị bác bỏ) Bước 3 : Nếu p_value ≥ α : chấp nhận giả thiết H0 Nếu p_value < α : bác bỏ giả thiết H0 )ˆ( ˆ 2 02 β ββ se t − = III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 2. Kiểm ñịnh giả thiết về hệ số hồi quy b. Kiểm ñịnh giả thiết về β1 Tương tự kiểm ñịnh giả thiết về β2 nhưng giá trị tới hạn lúc này là )ˆ( ˆ 1 01 β ββ se t − = Ho:β1 = βo H1:β1 ≠ βo Với ñộ tin cậy là 1-α Ví dụ áp dụng Từ số liệu ñã cho của ví dụ trước , yêu cầu kiểm ñịnh các giả thiết sau Ho:β2 = 0 H1:β2 ≠ 0 Với ñộ tin cậy là 95% Ho:β1 = 0 H1:β1 ≠ 0 Với ñộ tin cậy là 95% a) b) III. KiỂM ðỊNH MÔ HÌNH HỒI QUY 3. Kiểm ñịnh sự phù hợp của mô hình Ho:R2 = 0 H1:R2≠ 0 Với ñộ tin cậy là 1- α Kịểm ñịnh giả thiết Bước 2 : Tra bảng tìm F(1,n-2), mức ý nghĩa là α Bước 3 : Nếu F>F(1,n-2) , bác bỏ H0 Nếu F≤F(1,n-2) , chấp nhận H0 Bước 1 : tính ( )2 2 1 )2( R nRF − − = Phương pháp kiểm ñịnh F Ho:β2 = 0 H1:β2 ≠ 0 ñộ tin cậy là (1-α)Việc kiểm ñịnh giả thiết có ý nghĩa như thế nào? Câu hỏi Ho:R2 = 0 H1:R2 ≠ 0 ñộ tin cậy là (1-α)Việc kiểm ñịnh giả thiết có ý nghĩa như thế nào? Ho:β2 = 0 H1:β2 ≠ 0 ñộ tin cậy là (1-α)Việc kiểm ñịnh giả thiết có ý nghĩa như thế nào? Câu hỏi IV. SỬ DỤNG MÔ HÌNH HỒI QUY 1. Trình bày kết quả hồi quy Kết quả hồi quy ñược trình bày như sau : )ˆ()ˆ(_ )ˆ()ˆ( )ˆ()ˆ( ˆˆˆ 21 21 21 2 21 ββ ββ ββ ββ ppvaluep ttt dfsesese RXY ii += IV. SỬ DỤNG MÔ HÌNH HỒI QUY 1. Trình bày kết quả hồi quy Kết quả hồi quy trong ví dụ trước : valuep t se XY ii _ 672,09549,04517,5ˆ +−= IV. SỬ DỤNG MÔ HÌNH HỒI QUY 2. Vấn ñề dự báo ii XYSRF 21 ˆˆˆ: ββ +=Giả sử Khi X=X0 thì ước lượng trung bình của Y0 sẽ là 0210 ˆˆˆ XY ββ += là ñại lượng ngẫu nhiên có phân phối chuẩn 0ˆY ),(~ˆ 2 ˆ0210 0Y XNY σββ + Vì sao là ñại lượng nhẫu nhiên ?0ˆY IV. SỬ DỤNG MÔ HÌNH HỒI QUY 2. Vấn ñề dự báo Với         ×+×− )ˆ(ˆ);ˆ(ˆ 0 2 00 2 0 YsetYYsetY αα         − − += ∑ 22 2 022 ˆ )( )(1 0 XnX XX n i Y σσ 2 ˆ0 0 )ˆ( YYse σ= Khoảng tin cậy giá trị trung bình của Y0 với ñộ tin cậy (1-α) là Ví dụ áp dụng Từ số liệu ñã cho của ví dụ trước , yêu cầu dự báo khoảng giá trị của Y khi X0 = 60 (triệu ñồng/năm) với ñộ tin cậy 95% 2842,69837,11 61743,05729,1 8681,00958,18503,18ˆ − = −= t dfse XY i a) Nêu ý nghĩa kinh tế của các hệ số hồi quy b) Xét xem giá bán có ảnh hưởng ñến doanh số bán không (với mức ý nghĩa 5%)? c) Nếu giá bán là 8,5 ngàn ñồng /kg thì doanh số bán trung bình là bao nhiêu (ñộ tin cậy 95%)? Cho kết quả hồi quy giữa Y – doanh số bán (trñ/tấn) và X - giá bán ( ngàn ñồng/kg) như sau :

Các file đính kèm theo tài liệu này:

  • pdfchuong02_hoiquyhaibien_6slide_2742.pdf