Kinh tế lượng - Điều kiện vận dụng mô hình hồi qui tuyến tính bội

Giả thuyết H0:  Cácbiếncủatập conkhôngcảithiện một cáchcóýnghĩamôhìnhkhitấtcảcácbiến khácbaogồmtrongmôhình Giả thiết đối (H1):  Ít nhất có một biến có nghĩa Cần phải so sánh hai hàm hồi qui  Một hàm hồi qui bao gồm tất cả các biến.  Hàm còn lại bao gồm tất cả các biến trừ các phần được kiểm định

67 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 2145 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Kinh tế lượng - Điều kiện vận dụng mô hình hồi qui tuyến tính bội, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

1Điều kiện vận dụng mô hình hồi qui tuyến tính bội 2Các nội dung chính Kiểm tra các điều kiện áp dụng mô hình Số liệu quan sát sai lệch Các biến giả (dummy) Phương pháp từng bước Sự tương tác (Interaction) 3Các điều kiện vận dụng mô hình  Các điều kiện về dạng mô hình :  Tuyến tính của các biến độc lập so với biến phụ thuộc  Các điều kiện về sai số mô hình (error):  Các sai số mô hình là độc lập (không tự tương quan) và phân phối giống nhau theo phân phối chuẩn với trung bình bằng 0 và variance s2 (homoscedasticity)  Các điều kiện về các số dự đoán (prédicteurs):  Các biến độc lập không ngẫu nhiên  Các giá trị của các biến độc lập được đo lường không có sai số  Các số dự đoán (prédicteurs) là độc lập theo đường thẳng, (không có bội tương quan giữa các biến độc lập - multicollinearity)  Các điều kiện về quan sát:  Tất cả các quan sát có cùng một vai trò 4Mô hình với ảnh hưởng cố định ngược với mô hình với ảnh hưởng ngẫu nhiên  Về nguyên tắc, hồi qui được thực hiện đối với các mô hình có ảnh hưởng cố định  Các biến độc lập được kiểm soát  Mô hình cũng hoạt động đối với các biến có ảnh hưởng ngẫu nhiên  Các biến độc lập là ngẫu nhiên  Về nguyên tắc, các biến này phải tuân theo một phân phối chuẩn đa biến 5Tuyến tính  Vẽ biểu đồ từng phần (partial plots)  Để đánh giá đặc trưng tuyến tính của một biến Xj so với Y, chúng ta hồi qui Y về toàn bộ các biến độc lập trừ Xj, và chúng ta hồi qui Xj bằng các biến độc lập khác  Chúng ta vẽ biểu đồ các phần dư (residues) của hai hồi qui. Như vậy, chúng ta loại bỏ ảnh hưởng của các biến độc lập khác. 6Tuyến tính tiếp Partial Regression Plot Dependent Variable: prix surface 3000200010000-1000-2000 p ri x 200000 100000 0 -100000 -200000 7Tuyến tính tiếp Partial Regression Plot Dependent Variable: prix age 806040200-20 p ri x 200000 100000 0 -100000 -200000 8Scatterplot Dependent Variable: prix Regression Adjusted (Press) Predicted Value 4000003000002000001000000 R e g re s s io n S tu de nt iz e d R e si d u al 4 2 0 -2 -4 Biểu đồ phần dư (residues) 9Biểu đồ (histogram) phần dư (residues) Regression Standardized Residual 3,25 2,75 2,25 1,75 1,25 ,75 ,25 -,25 -,75 -1,25 -1,75 -2,25 -2,75 -3,25 -3,75 Histogram Dependent Variable: prix F re q u e n c y 60 50 40 30 20 10 0 Std. Dev = 1,00 Mean = 0,00 N = 319,00 10 Normal probability plot (Đồ thị theo hàm chuẩn) Normal P-P Plot of Regression Standardized Residual Dependent Variable: prix Observed Cum Prob 1,00,75,50,250,00 E xp e ct e d C u m P ro b 1,00 ,75 ,50 ,25 0,00 11 Hai kiểm định nhanh để kiểm tra phân phối chuẩn  Nhờ vào hệ số mất cấn đối (skewnRSS)  Trong đó, n là kích thước mẫu  Nhờ vào kurtose  Trong đó, n là kích thước mẫu  Nếu giá trị tuyệt đối của Z lớn hơn 1.96, phân phối là không chuẩn với sai số ở mức rủi ro 5% n 6 skewness Z n 24 kurtose Z 12 Phép biến đổi các biến  Các điều kiện vận dụng mô hình thường xuyên không đạt được:  Tuyến tính  Phương sai không đổi của các sai số (errors) của mô hình  Một mô hình là tuyến tính nếu các tham số hiện diện trong mô hình là tuyến tính, ngay cả khi các biến độc lập không tuyến tính 13 Phép biến đổi các biến  Các ví dụ của các mô hình tuyến tính:  Ví dụ mô hình không tuyến tính: tiếp This image cannot currently be displayed.   XY 21   2321 XXY   XY log21   XY 21    XeY 21 14 Các phép biến đổi để làm cho mô hình tuyến tính  Hàm  Phép biến đổi  Dạng tuyến tính   XY Xlog'X,Ylog'Y  'Xlog'Y  15 Các phép biến đổi để làm cho mô hình tuyến tính  Hàm  Phép biến đổi  Dạng tuyến tính X eY   Yln'Y  Xln'Y  tiếp 16 Các phép biến đổi để làm cho mô hình tuyến tính  Hàm  Phép biến đổi  Dạng tuyến tính XlogY  Xlog'X  'XY  tiếp 17 Các phép biến đổi để làm cho mô hình tuyến tính  Hàm  Phép biến đổi  Dạng tuyến tính   X X Y tiếp X 1 'X, Y 1 'Y  'X'Y  18 Các phép biến đổi để làm cho mô hình tuyến tính  Hàm  Phép biến đổi  Dạng tuyến tính X X e1 e Y     tiếp Y1 Y ln'Y   X'Y  19 Diễn giải các hệ số  Nếu biến phụ thuộc là một biến logarithm  Hệ số của biến độc lập Xk có thể được hiểu là : sự biến đổi một đơn vị của Xk dẫn đến 100(bk)% thay đổi của số trung bình (mean) của Y  Nếu biến độc lập là một số logarithm  Hệ số của biến độc lập Xk có thể được hiểu là: sự biến đổi 100% dẫn đến một sự thay đổi bk đơn vị của số trung bình của Y 20 Diễn giải các hệ số  Nếu biến phụ thuộc và biến độc lập là các số logarithms  Hệ số của biến độc lập Xk có thể được hiểu là : 1% biến đổi Xk dẫn đến một phần trăm biến đổi trung bình của Y của bk. bk là tính đàn hồi (elasticity) của Y so với Xk. tiếp 21 Những quan sát lệch lạc (outliers)  Ba dạng:  Các điểm bẫy (leverage values)  Được đánh dấu bằng các giá trị của ma trận mũ (hat values)  Những quan sát cho thấy ảnh hưởng (influential)  Sự hủy bỏ của các quan sát này nói chung làm thay đổi quan trọng ước lượng các tham số của mô hình  Được đánh dấu bằng các khoảng cách Cook  Những quan sát lệch lạc (outliers):  Những quan sát mà đối với nó, biến phụ thuộc có một giá trị “không bình thường” (anormal) so với các giá trị của các biến độc lập  Những quan sát có giá trị lớn hơn hai hoặc ba lần độ lệch chuẩn của đường trung tâm trong đồ thị phần dư (residues)  Được đánh dấu bằng các “studentized deleted residuals” 22 Các yếu tố của ma trận mũ “hat matrix” hi  Mỗi giá trị có thể được biểu thị theo các yi  hiji chỉ ra trong chừng mực nào Yi có thể ảnh hưởng đến  Nếu hij là lớn, quan sát thứ i ème có thể có một ảnh hưởng quan trọng đến giá trị được điều chỉnh thứ jème  Chúng ta có thể chứng tỏ rằng  hj=hjj tóm lược ảnh hưởng tiềm tàng của yi đến tất cả các giá trị được điều chỉnh nnjiij2j21j1j Yh...Yh...YhYhYˆ   j 2 ijii hh jYˆ jYˆ 23 Các yếu tố của ma trận mũ “hat matrix” hi  Các giá trị nằm giữa 0 và 1 và giá trị trung bình bằng (p+1)/n  Nếu p lớn hơn hoặc bằng 10 và n lớn hơn hoặc bằng 50, quan sát được xem là một điểm bẫy nếu nó lớn hơn 2(p+1)/n  Nếu không, quan sát được xem như là một điểm bẫy nếu nó lớn hơn 3(p+1)/n (với ví dụ: 9/319=0,028)  Một điểm bẫy là một giá trị sai lệch trong khoảng không (trên đồ thị) của các biến độc lập. tiếp 24 Studentized Deleted Residuals ti *   : Chênh lệch giữa Yi và dựa trên mô hình chứa đựng tất cả các quan sát , trừ i  : dạng lỗi đối với mô hình chứa đựng tất cả các quan sát, trừ i  Một quan sát được xem như lệch lạc nếu  là giá trị phê phán đối với kiểm định hai bên ở mức rủi ro 5% (gần bằng 2)     * 1 i i ii e t S h   ˆ iY  iS  ie 2 *  pni tt 2pnt  25 Distance de Cook Di   Với số dư chuẩn hoá  Đo lường chênh lệch giữa các hệ số đạt được từ tất cả các số liệu và các hệ số đạt được bằng việc rút ra quan sát thứ i  Nếu Di>4/(n-p-1), quan sát được xem như có ảnh hưởng (trong ví dụ, 4/316=0,013)   2 2 1 i i i i SR h D h   1 i i YX i e SR S h   26 Những quan sát sai lệch (outliers)  Phải làm gì với các giá trị sai lệch ?  Rút ra khỏi mẫu, với điều kiện có thể chứng minh được. tiếp 27 Những quan sát sai lệch (outliers) tiếp 28 Những quan sát sai lệch (outliers) tiếp Residuals Statisticsa $51,357.88 $342,617.34 $178,465.20 $54,633.110 319 -2,327 3,005 ,000 1,000 319 $1,823.688 $7,224.813 $2,970.231 $904.991 319 $50,831.93 $341,766.78 $178,444.29 $54,677.261 319 -$117,631.58 $112,486.70 $.00 $31,913.487 319 -3,674 3,514 ,000 ,997 319 -3,685 3,540 ,000 1,002 319 -$118,308.41 $114,174.00 $20.91 $32,252.760 319 -3,761 3,607 ,000 1,008 319 ,035 15,199 1,994 2,095 319 ,000 ,189 ,004 ,012 319 ,000 ,048 ,006 ,007 319 Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum Maximum Mean Std. Deviation N Dependent Variable: prixa. 29 Những quan sát sai lệch (outliers) tiếp 30 Casewise Diagnostics a 3,166 $195,250 $93,887.19 $101,362.81 2,095 $260,650 $193577.3 $67,072.66 -3,282 $170,200 $275273.7 -$105,073.66 3,514 $278,000 $165513.3 $112,486.70 2,935 $331,000 $237035.5 $93,964.50 -2,670 $58,500 $143966.3 -$85,466.34 -2,647 $90,250 $174996.4 -$84,746.37 -2,640 $70,600 $155110.4 -$84,510.41 -2,650 $65,950 $150802.3 -$84,852.29 -2,374 $102,150 $178147.7 -$75,997.67 -2,473 $96,400 $175556.2 -$79,156.23 -3,674 $106,250 $223881.6 -$117,631.58 -2,363 $126,100 $201761.0 -$75,660.96 -2,691 $130,100 $216263.4 -$86,163.36 -3,184 $123,900 $225828.6 -$101,928.61 Case Number 5 171 213 246 247 260 288 290 291 299 306 307 308 315 316 Std. Residual prix Predicted Value Residual Dependent Variable: prixa. Những quan sát sai lệch (outliers) tiếp Đánh giá kỹ hơn đưa ra những quan sát 3,5, 96, 171, 213, 215, 240, 243, 246, 247, 260, 277, 288, 290, 291, 296, 299, 301, 306, 307, 315, et 316 như là các sai lệch tiềm tằng. 5 $195,250 2112 78 96 $138,250 129 1 315 $130,100 3000 43 31 Biến giả (dummy)  Các ví dụ: nam-nữ, có mặt – vắng mặt do một điều kiện cụ thể  Được mã hóa 0 hoặc 1  Về mặt lý thuyết, các hằng số (hệ số chặn) phải khác nhau  Giả sử rằng, có cùng hệ số hồi qui với mỗi một loại  Số các biến giả cần thiết là số loại trừ (-) 1 Nói chung được sử dụng đế thiết lập một nhân tố kiểm soát 320 1 1 2 0 1 1 ˆ (0)i i iY b b X b b b X     0 1 1 2 0 2 1 1 ˆ (1) ( )i i iY b bX b b b bX      Biến giả (dummy) Y = tiền lương X1 = Số năm kinh nghiệm X2 = Giới tính = Nam (X2 = 1) Nữ (X2 = 0) 0 nữ 1 nam 0 1 1 2 2 ˆ i i iY b b X b X   Cùng hệ số hồi qui tiếp 33 Biến giả (dummy) tiếp X1 (giới tính) Y (tiền lương) b0 + b2 b0 Cùng hệ số gốc Hệ số chặn (hằng số) khác nhau 1b 34 Diễn giải hệ số của biến giả Ví dụ: Y: tiền lương năm tính bằng triệu đô la Trung bình, nam thu nhập năm trên 6000$, các điều kiện khác không đổi 1X : kinh nghiệm 2X 0 nữ 1 nam : 0 1 1 2 2 1 2 ˆ 20 5 6i i i i iY b b X b X X X      35 Ví dụ về hồi qui bội  1 Hàng xóm dể chịu  0 hàng xóm khó chịu Chúng ta đưa thêm vào một biến thứ ba trong mô hình trước: On introduit une troisième variable dans le modèle précédent : hàng xóm tiếp 36 Ví dụ về hồi qui bội tiếp Model 1 Model 2 Coefficientsa 70015,462 5900,669 11,866 ,000 72,500 2,880 ,716 25,172 ,000 ,995 1,005 -1657,031 108,867 -,433 -15,221 ,000 ,995 1,005 (Constant) surface age Model 1 B Std. Error Unstandardized Coeff icients Beta Standardized Coeff icients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: prixa. Coefficientsa 33506,107 6682,137 5,014 ,000 64,409 2,733 ,636 23,570 ,000 ,885 1,130 -1114,692 114,857 -,291 -9,705 ,000 ,716 1,397 50673,109 5682,565 ,282 8,917 ,000 ,646 1,548 (Constant) surface age voisinage Model 1 B Std. Error Unstandardized Coeff icients Beta Standardized Coeff icients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: prixa. 37 Ví dụ về hồi qui bội tiếp Model 1 Model 2 Model Summaryb ,863a ,746 ,744 $32,014.319 1,344 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), age, surfacea. Dependent Variable: prixb. Model Summaryb ,893a ,797 ,795 $28,651.959 1,438 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), voisinage, surface, agea. Dependent Variable: prixb. 38 Những tác dụng của mã hóa (Effects coding)  Sự mã hóa riêng biệt các biến giả cốt là thay thế các dòng lấy giá trị 0 đối với tất cả các biến giả liên quan đến một biến cụ thể bằng một giá trị -1.  Những hệ số của biến giả được hiểu là phần chênh lệch so với trung bình và không so với loại chênh lệch 39 Effects coding tiếp 40 Effects coding Model 2 Model Summaryb ,893a ,797 ,795 $28,651.959 1,438 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), voisinage, surface, agea. Dependent Variable: prixb. Model Summaryb ,893a ,797 ,795 $28,651.959 1,438 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), voisinage, surface, agea. Dependent Variable: prixb. Model 3 tiếp 41 Effects coding Coefficientsa 33506,107 6682,137 5,014 ,000 64,409 2,733 ,636 23,570 ,000 ,885 1,130 -1114,692 114,857 -,291 -9,705 ,000 ,716 1,397 50673,109 5682,565 ,282 8,917 ,000 ,646 1,548 (Constant) surface age voisinage Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: prixa. Coefficientsa 58842,661 5427,539 10,841 ,000 64,409 2,733 ,636 23,570 ,000 ,885 1,130 -1114,692 114,857 -,291 -9,705 ,000 ,716 1,397 25336,554 2841,282 ,282 8,917 ,000 ,646 1,548 (Constant) surface age voisinage Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: prixa. Model 2 Model 3 tiếp 42 Lựa chọn các biến trong việc xây dựng các mô hình  1. Qui tắc (nguyên tắc dè xẻn): sử dụng ít các biến độc lập khi có thể.  2. Hồi qui theo bước (từng bước)  lựa chọn các biến độc lập có liên quan chặt chẽ nhất với biến phụ thuộc. Thêm hoặc bỏ các biến tuỳ theo mức độ giải thích mà chúng đem lại. 43 Đóng góp của một biến độc lập  cho Xk là biến độc lập của mô hình mà ta muốn đo sự đóng góp của nó  RSS(Xk| X1 , …, Xk-1 , Xk+1 , …, Xp) = RSS(X1 , …, Xp)-RSS(X1 , …, Xk-1 , Xk+1 , …, Xp)  Đo sự đóng góp của Xk trong tổng biến đổi được giải thích của Y (TSS) kX 44 Sự đóng góp của một biến độc lập kX Đo được sự đóng góp của X1 trong việc giải thích TSS Từ l’ANOVA của hồi qui Từ l’ANOVA của hồi qui 0 1 1 2 2 3 3 ˆ i i i iY b b X b X b X    0 2 2 3 3 ˆ i i iY b b X b X   tiếp RSS(X1| X2 , X3)= RSS(X1, X2 , X3) RSS(X2 , X3)- 45 Hệ số xác định thành phần của   Đo lường phần của biến phụ thuộc (Y) được giải thích bởi Xk, khi các biến khác vẫn giữ nguyên không đổi (được kiểm soát) kX ),...,,,...,|(),...,( ),...,,,...,|( 1111 1112 ,...1,1,...,1. pkkkp pkkk pkkYk XXXXXESSXXESSTSS XXXXXESS r      46 Hệ số xác định thành phần của  Ví dụ cho một mô hình có hai biến độc lập kX )|(),( )|( 2121 212 2.1 XXESSXXESSTSS XXESS rY   tiếp 47 Đóng góp của một tập con các biến độc lập  Cho Xs là một tập con của các biến độc lập của mô hình trong đó ta muốn đo sự đóng góp của nó  RSS(Xs| tất cả các biến trừ Xs) =RSS(X1 , …, Xp)-RSS(tất cả các biến trừ Xs)  Đo sự đóng góp của tập con Xs trong tổng biến đổi được giải thích của Y (TSS) 48 Đóng góp của một tập con các biến độc lập giả sử rằng Xs gồm X1 và X3 Từ l’ANOVA của hồi qui Từ l’ANOVA của hồi qui 0 1 1 2 2 3 3 ˆ i i i iY b b X b X b X    0 2 2 ˆ i iY b b X  tiếp RSS(X1, X3| X2 )= RSS(X2)-RSS(X1, X2 , X3) 49 Kiểm định một phần của mô hình  Xem xét sự đóng góp của một tập con Xs các biến trong mối liên hệ của chúng với Y  Giả thuyết H0:  Các biến của tập con không cải thiện một cách có ý nghĩa mô hình khi tất cả các biến khác bao gồm trong mô hình  Giả thiết đối (H1):  Ít nhất có một biến có nghĩa  Cần phải so sánh hai hàm hồi qui  Một hàm hồi qui bao gồm tất cả các biến.  Hàm còn lại bao gồm tất cả các biến trừ các phần được kiểm định 50 Kiểm định thành phần F đối với sự đóng góp của một tập con các biến  Thống kê kiểm định:  bậc tự do = m và (n-p-1)  m = số các biến trong tập con Xs )bien cac catat ( /)bien tru cac catat |( MSS mXRSS F s s X  51 Kiểm định thành phần F đối với sự đóng góp của một biến  Các giả thuyết:  H0 : biến Xj không cải thiện một cách có ý nghĩa mô hình khi tất cả các biến khác bao gồm trong mô hình  H1 : biến Xj cải thiện một cách có ý nghĩa mô hình khi các biến khác bao gồm trong mô hình  Thống kê kiểm định :   bậc tự do = 1 và (n-p-1)  m = 1 jX )bien cac catat ( /)bien tru cac catat |( MSS mXRSS F s j X  52 Phương pháp từng bước  Bước 1 Ta thử tất cả các mô hình hồi qui đơn. Ta giữ lại biến mà tương quan là lớn nhất.  Bước 2  Tiếp theo, ta tìm biến tốt nhất trong số tất cả các biến còn lại. Đưa biến có liên quan từng phần lớn nhất với biến phụ thuộc vào mô hình, có chú ý đến các biến đã được đưa vào mô hình trước đó.  Kiểm tra xem các biến đã được đưa vào mô hình vẫn còn có ý nghĩa hay không. Nếu đúng ta chuyển sang bước 3, nếu không, phải rút các biến không còn ý nghĩa nữa ra khỏi mô hình.  Bước 3 Nếu còn các biến có liên quan thành phần một cách có ý nghĩa, ta quay lại bước 2, nếu không ta dừng thuật toán này lại. 53 Phương pháp từng bước  ví dụ của một doanh nghiệp  Các biến độc lập:  X1 : tốc độ giao hàng– thời gian để giao một sản phẩm khi đơn đặt hàng đã được khẳng định.  X2 : mức giá– sự cảm nhận về mức giá của khách hàng  X3 : tính linh hoạt của giá–sự cảm nhận về thiện chí mà các nhân viên giao dịch của HATCO chấp nhận đàm phán giá.  X4 : hình ảnh – hình ảnh của HATCO trong mắt các khách hàng dưới góc độ là nhà cung cấp  X5 : dịch vụ -chất lượng chung của dịch vụ  X6 : năng lực bán hàng-cảm nhận về năng lực bán hàng của HATCO  X7 : chất lượng sản phẩm  Đại lượng phụ thuộc :  X9 : tỉ trọng của nhà cung cấp –phần trăm các sản phẩm cung cấp bởi HATCO so với các nhà cung cấp khác. tiếp 54 Phương pháp từng bước  Mô hình đầy đủ tiếp Model Summaryb ,880a ,775 ,758 4,4237 1,897 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), qualite du produit, service, force de vente, flexibilite du prix, niveau de prix, image, vitesse de livraison a. Dependent Variable: importanceb. Coefficie ntsa -10,187 4,977 -2,047 ,044 -,058 2,013 -,008 -,029 ,977 ,028 35,747 -,697 2,090 -,093 -,333 ,740 ,032 31,597 3,368 ,411 ,520 8,191 ,000 ,608 1,645 -,042 ,667 -,005 -,063 ,950 ,347 2,879 8,369 3,918 ,699 2,136 ,035 ,023 43,834 1,281 ,947 ,110 1,352 ,180 ,371 2,697 ,567 ,355 ,100 1,595 ,114 ,623 1,606 (Constant) vitesse de livraison niveau de prix f lexibilite du prix image service force de vente qualite du produit Model 1 B Std. Error Unstandardized Coef f icients Beta Standardized Coef f icients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: importancea. 55 Phương pháp từng bước tiếp 56 Phương pháp từng bước  Phương pháp từng bước tiếp Model Summary d ,701a ,491 ,486 6,4458 ,869b ,755 ,750 4,4980 ,877c ,768 ,761 4,3938 1,910 Model 1 2 3 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), dịch vụa. Predictors: (Constant) dịch vụ, linh hoạt của giáb. Predictors: (Constant), service, f lexibilite du prix, force de ventec. Dependent Variable: importanced. Coefficientsa 21,653 2,596 8,341 ,000 8,384 ,862 ,701 9,722 ,000 1,000 1,000 -3,489 3,057 -1,141 ,257 7,974 ,603 ,666 13,221 ,000 ,996 1,004 3,336 ,327 ,515 10,210 ,000 ,996 1,004 -6,520 3,247 -2,008 ,047 7,621 ,607 ,637 12,547 ,000 ,936 1,068 3,376 ,320 ,521 10,562 ,000 ,993 1,007 1,406 ,591 ,121 2,378 ,019 ,939 1,064 (Constant) dịch v ụ (Constant) dịch v ụ Linh hoạt của giá (Constant) dịch v ụ Linh hoạt của giá Lực lượng bán hàng Model 1 2 3 B Std. Error Unstandardized Coef f icients Beta Standardized Coef f icients t Sig. Tolerance VIF Collinearity Stat istics Dependent Variable: importancea. 57 Phương pháp từng bước tiếp Excluded Variablesd ,396a 4,812 ,000 ,439 ,626 1,599 ,626 -,377a -5,007 ,000 -,453 ,737 1,357 ,737 ,515a 10,210 ,000 ,720 ,996 1,004 ,996 ,016a ,216 ,830 ,022 ,911 1,098 ,911 ,093a 1,252 ,214 ,126 ,942 1,062 ,942 -,154a -2,178 ,032 -,216 ,997 1,003 ,997 ,016b ,205 ,838 ,021 ,405 2,469 ,405 -,020b -,267 ,790 -,027 ,464 2,156 ,464 ,095b 1,808 ,074 ,181 ,892 1,121 ,892 ,121b 2,378 ,019 ,236 ,939 1,064 ,936 ,094b 1,683 ,096 ,169 ,799 1,252 ,797 ,030c ,389 ,698 ,040 ,403 2,483 ,403 -,029c -,405 ,687 -,041 ,462 2,163 ,462 -,002c -,021 ,983 -,002 ,357 2,805 ,357 ,071c 1,273 ,206 ,130 ,768 1,301 ,768 vitesse de l ivraison niveau de prix flexibi lite du prix image force de vente qualite du produit vitesse de l ivraison niveau de prix image force de vente qualite du produit vitesse de l ivraison niveau de prix image qualite du produit Model 1 2 3 Beta In t Sig. Partial Correlation Tolerance VIF Minimum Tolerance Coll inearity Statistics Predictors in the Model: (Constant), servicea. Predictors in the Model: (Constant), service, flexibi lite du prixb. Predictors in the Model: (Constant), service, flexibi lite du prix, force de ventec. Dependent Variable: importanced. 58 Mô hình hồi qui với sự tương tác (interaction)  Cho phép kiểm định sự tương tác giữa các cặp biến độc lập  Câu trả lời cho một biến độc lập tùy theo các mức chênh lệch của một biến độc lập khác 0 1 1 2 2 3 1 2i i i i i iY X X X X         59 ảnh hưởng của sự tương tác  Chúng ta xem mô hình:   Không có yếu tố tương tác, ảnh hưởng của biến X1 đối với biến Y được đo lường bởi 1  Khi có một yếu tố tương tác, ảnh hưởng của biến X1 đối với biến Y được đo lường bởi 1 + 3 X2  ảnh hưởng thay đổi khi X2 tăng lên 0 1 1 2 2 3 1 2i i i i i iY X X X X         60 Y = 1 + 2X1 + 3(1) + 4X1(1) = 4 + 6X1 Y = 1 + 2X1 + 3(0) + 4X1(0) = 1 + 2X1 Ví dụ về sự tương tác ảnh hưởng (độ dốc) của X1 đối với Y phụ thuộc vào giá trị của X2 X1 4 8 12 0 0 10.5 1.5 Y Y = 1 + 2X1 + 3X2 + 4X1X2 61 Ví dụ về sự tương tác tiếp Trở lại ví dụ trước Chúng ta muốn kiểm định một sự tương tác có thể xãy ra giữa diện tích và tuổi của ngôi nhà Chúng ta tạo ra một biến bằng tích giữa hai biến này 62 Ví dụ về sự tương tác tiếp Model Summaryb ,899a ,808 ,807 $27,820.472 1,506 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Durbin-W atson Predictors: (Constant), voisinage, SUR_AGE, surfacea. Dependent Variable: prixb. Coefficientsa 15385,686 5653,136 2,722 ,007 70,910 2,779 ,700 25,520 ,000 ,807 1,239 -,618 ,057 -,299 -10,909 ,000 ,812 1,232 57677,118 5103,801 ,321 11,301 ,000 ,755 1,325 (Constant) surface SUR_AGE voisinage Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Tolerance VIF Collinearity Statistics Dependent Variable: prixa. 63 Sự cộng tuyến giữa các biến độc lập (multicolinearity)  Có sự tương quan lớn giữa các biến độc lập  Các hệ số đo lường ảnh hưởng phối hợp  Dẫn đến các hệ số không ổn định khi chúng ta thêm các biến vào mô hình hồi qui. Dấu của các hệ số có thể đảo ngược.  Luôn tồn tại, nhưng ở các mức độ ít nhiều quan trọng  Qui tắc kinh nghiệm:  Tính tất cả các sự tương quan giữa các biến độc lập  Nếu không có sự tương quan nào giữa các biến độc lập vượt quá 0.8 và tương quan giữa biến phụ thuộc và các biến độc lập lớn hơn tương quan giữa các biến độc lập, coi như không có đa cộng tuyến 64 Kiểm tra đa cộng tuyến (Tolerance)  Đối với biến Xj , dung sai bằng 1-Rj2 với Rj là hệ số xác định của biến Xj được hồi qui bởi tất cả các biến độc lập khác  Các giá trị nhỏ của dung sai chỉ ra có hiện tượng đa cộng tuyến. Một giá trị dung sai bằng 0.10 tương ứng với một sự tương quan bội 0.95. Đó là giá trị giới hạn mà chúng ta giữ lại mô hình  Để xác định các biến có liên quan, cần phải giữ lại các biến này của mô hình để chú ý đến việc thực hiện các phép biến đổi các biến 65 Coefficientsa 70015,462 5900,669 11,866 ,000 72,500 2,880 ,716 25,172 ,000 ,995 1,005 -1657,031 108,867 -,433 -15,221 ,000 ,995 1,005 (Constant) surface age Model 1 B Std. Error Unstandardized Coefficients Beta Standardi zed Coefficien ts t Sig. Tolerance VIF Collinearity Statis tics Dependent Variable: prixa. Kiểm tra đa cộng tuyến (Tolerance) tiếp 66 Phép biến đổi để làm ổn định phương sai  Nói chung, sự ổn định của phương sai làm chuẩn hóa sự phân phối của biến  Khi phương sai của các phần dư (residues) của mô hình tăng lên với giá trị của một biến độc lập, một phép biến đổi có thể là chia tất cả mô hình ban đầu cho X:  Điều này là tương đương với việc áp dụng phương pháp bình phương bé nhất (WLS) XX X X Y Y    ',',', 1 ',' 0110 67 Phép biến đổi để làm ổn định phương sai  Khi biến phụ thuộc có một độ lệch chuẩn so với trung bình của nó là lớn (hệ số biến thiên, tình trạng hiện hành đối với các biến kinh tế), một phép biến đổi logarithmic nói chung cho phép:  Giảm đi sự không đồng nhất phương sai của các sai số của mô hình  Chuẩn hóa biến tiếp

Các file đính kèm theo tài liệu này:

chuong_7_dieu_kien_van_dung_mo_hinh_0532.pdf