Thống kê ứng dụng - Chương 10: Kiểm định phi tham số

Quan điểm 2 (khuyên dùng) ● B6: Tính chỉ tiêu KĐ, ● Nếu n’ ≤ 20, chỉ tiêu KĐ là W = ΣR+. ● Nếu n’ > 20, chỉ tiêu KĐ là z. ● B7: Bác bỏ H 0 ● Nếu n’ ≤ 20, tra bảng tìm WL (cận dưới) và WU (cận trên) ● Nếu KĐ 2 bên: Bác bỏ H 0 nếu W < WL hoặc W > WU ● Nếu KĐ bên trái: Bác bỏ H 0 nếu W < WL ● Nếu KĐ bên phải: Bác bỏ H0 nếu W > WU

pdf17 trang | Chia sẻ: nhung.12 | Lượt xem: 1108 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Thống kê ứng dụng - Chương 10: Kiểm định phi tham số, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 10 KIỂM ĐỊNH PHI THAM SỐ Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn CÁC NỘI DUNG CHÍNH 10.1 KĐ dấu và hạng Wilcoxon về trung vị của một tổng thể 10.2 KĐ dấu và hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu cặp 10.3 KĐ tổng hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu độc lập 10.4 KĐ Kruskal - Wallis 10.5 KĐ Chi bình phương về mối liên hệ giữa hai biến định tính 10.6 KĐ Chi bình phương trên một mẫu © Nguyễn Tiến Dũng 2Thống kê ứng dụng 10.1 KĐ dấu và hạng Wilcoxon về trung vị của tổng thể Gọi trung vị tổng thể là M, giá trị cần so sánh là M0. ● B1: Lập giả thuyết ● B2: Lựa chọn mức ý nghĩa α ● B3: Tính các chênh lệch di: 𝑑𝑖 = 𝑥𝑖 −𝑀0 ● B4: Loại bỏ các di = 0, tính giá trị tuyệt đối của các chênh lệch |di| và xếp hạng các |di| ● |di| nhỏ nhất có hạng là 1. ● Nếu có hạng ngang nhau thì tính hạng TB. ● Cỡ mẫu rút gọn n’ = n – số trường hợp có di bằng 0 ● B5: Tách các hạng vừa xếp thành 2 cột. ● Nếu di > 0 thì đặt vào cột R+. ● Nếu di < 0 thì đặt vào cột R- © Nguyễn Tiến Dũng 3 0 0 1 0 : : H M M H M M    Thống kê ứng dụng Quan điểm 1: SGK ●B6: Tính chỉ tiêu KĐ ● Nếu n’ ≤ 20, chỉ tiêu KĐ là W ● KĐ 2 bên: W = min(ΣR+; ΣR-) ● KĐ bên phải: W = ΣR+ ● KĐ bên trái: W =ΣR- ● Nếu n’ > 20, chỉ tiêu KĐ là z ●B7: Bác bỏ H0 ● Nếu n’ ≤ 20: W < WL ● Nếu n’ > 20: ● KĐ 1 bên: z < -zα ● KĐ 2 bên: z < -zα/2 © Nguyễn Tiến Dũng 4 2 ' .( ' 1) 4 '.( ' 1).(2 ' 1) 24 W W W W W z n n n n n            Thống kê ứng dụng Quan điểm 2 (khuyên dùng) ● B6: Tính chỉ tiêu KĐ, ● Nếu n’ ≤ 20, chỉ tiêu KĐ là W = ΣR+. ● Nếu n’ > 20, chỉ tiêu KĐ là z. ● B7: Bác bỏ H0 ● Nếu n’ ≤ 20, tra bảng tìm WL (cận dưới) và WU (cận trên) ● Nếu KĐ 2 bên: Bác bỏ H0 nếu W WU ● Nếu KĐ bên trái: Bác bỏ H0 nếu W < WL ● Nếu KĐ bên phải: Bác bỏ H0 nếu W > WU ● Nếu n’ > 20, bác bỏ H0 ● KĐ bên trái: z < -zα ● KĐ bên phải: z > zα ● KĐ 2 bên: z zα/2 © Nguyễn Tiến Dũng 5 2 ' .( ' 1) 4 '.( ' 1).(2 ' 1) 24 W W W W W z n n n n n            Thống kê ứng dụng Wilcoxon Signed-Rank Test Table © Nguyễn Tiến Dũng 6Thống kê ứng dụng 10.2 KĐ tổng hạng Wilcoxon về TB của 2 mẫu độc lập ● B1: Chọn mẫu làm Mẫu 1 (n1 <n2) và lập cặp giả thuyết TK. Nếu 2 mẫu có cỡ mẫu bằng nhau, thì coi mẫu nào là Mẫu 1 cũng được. Gọi M1, M2 là trung vị của tổng thể thứ nhất và thứ hai © Nguyễn Tiến Dũng 7 0 1 2 1 1 2 : : H M M H M M    0 1 2 1 1 2 : : H M M H M M    0 1 2 1 1 2 : : H M M H M M    ● B2: Gộp chung 2 mẫu thành 1 danh sách chung và sắp xếp từ nhỏ tới lớn. Xác định hạng của các quan sát theo nguyên tắc là QS có giá trị nhỏ nhất sẽ có hạng là 1, giá trị càng lớn thì hạng càng lớn. Nếu có 2 quan sát có giá trị bằng nhau, thì lấy hạng TB. Thống kê ứng dụng ● B3: Xác định chỉ tiêu KĐ ● Nếu cỡ mẫu nhỏ (n1 ≤ 10 và n2 ≤ 10) thì chỉ tiêu KĐ là T1. ● T1 là tổng hạng của Mẫu 1. ● n = n1+ n2. ● Nếu cỡ mẫu lớn (n1 > 10 hoặc n2 > 10) thì chỉ tiêu KĐ là z ● B4: Bác bỏ H0 ● Nếu cỡ mẫu nhỏ: ● KĐ 2 bên: T1 > WU hoặc T1 < WL ● KĐ bên trái: T1 < WL ● KĐ bên phải: T1 > WU ● Nếu cỡ mẫu lớn: KĐ bên trái: z < -zα; KĐ bên phải: z > zα; KĐ hai bên: z zα/2 © Nguyễn Tiến Dũng 8 1 1 1 1 1 2 1 1 ( 1) 2 ( 1) 12 T T T T n n n n n T z           Thống kê ứng dụng 10.3 KĐ dấu và hạng Wilcoxon với 2 mẫu cặp ●B1: Xác định các chênh lệch di = x1i – x2i và lập cặp giả thuyết KĐ © Nguyễn Tiến Dũng 9 0 1 2 1 1 2 : : H M M H M M    0 1 2 1 1 2 : : H M M H M M    0 1 2 1 1 2 : : H M M H M M    0 1 : 0 : 0 D D H M H M    0 1 : 0 : 0 D D H M H M    0 1 : 0 : 0 D D H M H M    Thống kê ứng dụng ● B2: Xác định các giá trị tuyệt đối |di| ● B3: Loại bỏ các |di| bằng 0, sắp hạng các |di| từ nhỏ tới lớn. Giá trị |di| nhỏ nhất có hạng là 1. Nếu có nhiều |di| bằng nhau, thì tính hạng trung bình. ● n’ = n – số trường hợp có di = 0 ● B4: Tách riêng các hạng của |di| thành 2 loại, hạng R+ và hạng R- theo dấu của di gốc. Nếu di> 0, xếp vào cột R+. Nếu di < 0, xếp vào cột R-. ● B5: Tính giá trị KĐ W = Ri+ ● B6: Áp dụng quy tắc bác bỏ H0 ● Nếu n’ ≤ 20 ● KĐ bên trái: W < WL ● KĐ hai bên: W ≤ WL hoặc W ≥ WU ● KĐ bên phải: W ≥ WU © Nguyễn Tiến Dũng 10Thống kê ứng dụng ● Nếu n’ > 20 thì W xấp xỉ PP bình thường. Khi đó sẽ biến đổi chuẩn hoá W và kiểm định theo chỉ tiêu z. ● Quy tắc bác bỏ H0 tương tự như bài toán KĐ TB của một tổng thể, trường hợp biết  © Nguyễn Tiến Dũng 11 '( ' 1) 4 '( ' 1)(2 ' 1) 24 W W W W n n n n n W z            Thống kê ứng dụng 10.4 KĐ Kruskal – Wallis trên nhiều mẫu độc lập ●Mục đích: so sánh TB của k mẫu độc lập (k >2) ●Gọi n = n1 + n2 + + nk ●H0: M1 = M2 = = Mk ●Chỉ tiêu KĐ W ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng 12 2 1 2 1; 12 3( 1) ( 1) 0 W Baùc boû H neáu W> k i i i k R n n n n         Thống kê ứng dụng 10.5 KĐ Chi bình phương về mối liên hệ giữa 2 biến định tính ●Biến 1: Biến hàng ●Biến 2: Biến cột ●Lập bảng tần số kết hợp 2 biến ●Tại ô mà có hàng i cột j -> tính tần số thực Oij ●Tính các tổng theo hàng Ri và tổng theo cột Cj ●Tính ra các tần số kỳ vọng Eij = Ri x Cj / n ●Tính (Oij – Eij) 2/Eij -> tổng lại là Chi-square ●Bác bỏ H0 theo chỉ tiêu đánh giá Chi-square © Nguyễn Tiến Dũng 13Thống kê ứng dụng Ngắn TB Dài Tổng hàng H.phúc O11=38 E11 = 45 O12 = 58 E12 = 60 O13 = 54 E13 = 45 R1 = 150 Không HP O21 = 12 E21 = 9 O22 = 14 E22 = 12 O23 = 4 E23 = 9 R2 = 30 Ly dị / Ly thân O31 = 10 E31 = 6 O32 = 8 E32 = 8 O33 = 2 E33 = 6 R3 = 20 C1 = 60 C2 = 80 C3 = 60 n = 200 © Nguyễn Tiến Dũng 14 i j ij R C E n   2 2 1 1 2 2 ; ( ) ( 1).( 1) 0 Baùc boû H neáu r c ij ij i j ij df O E E df r c              Thống kê ứng dụng ij Oij Eij Oij-Eij (Oij-Eij) 2 (Oij-Eij) 2/Ei 11 38 45 -7 49 1,0889 12 58 60 -2 4 0,0667 13 54 45 9 81 1,8000 21 12 9 3 9 1,0000 22 14 12 2 4 0,3333 23 4 9 -5 25 2,7778 31 10 6 -4 16 2,6667 32 8 8 0 0 - 33 2 6 -4 16 2,6667 Tổng 200 12,4000 © Nguyễn Tiến Dũng 15 Chi-square tính = 12,4 Chi-square tra bảng (df = 2 x 2 = 4; alpha = 0,05) = 9,4877 Bác bỏ Ho Thống kê ứng dụng 10.6 KĐ Chi bình phương về sự phù hợp ●Goodness-of-fit Test ●Mục đích: Kiểm tra sự phân phối tần số có phù hợp với một tần số lý thuyết hay không ●Chỉ tiêu KĐ ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng 16 2 2 1 2 2 ; ( ) 1 k i i Stat i i Stat df O E E df k            0 Baùc boû H neáu Thống kê ứng dụng i Thứ Oi Ei Oi-Ei (Oi-Ei) 2 (Oi-Ei) 2/Ei 1 Hai 7 5,333 1,667 2,7889 0,5211 2 Ba 3 5,333 -2,333 5,4289 1,0206 3 Tư 3 5,333 -2,333 5,4289 1,0206 4 Năm 2 5,333 -3,333 11,0889 2,0830 5 Sáu 5 5,333 -0,333 0,1089 0,0208 6 Bảy 12 5,333 6,667 44,4889 8,3347 Tổng 32 13,0008 © Nguyễn Tiến Dũng 17Thống kê ứng dụng

Các file đính kèm theo tài liệu này:

  • pdftkud2015_ch10_1808.pdf