Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Hứa Thanh Xuân

Bài toán tổng quát: • Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng tiếp liên gồm r hàng (row) và c cột (column). • Gọi Oij là số quan sát ứng với hàng thứ i và cột thứ j . • Ri là tổng số quan sát ở hàng thứ i . • Cj là tổng số quan sát ở cột thứ j .

pdf6 trang | Chia sẻ: HoaNT3298 | Lượt xem: 981 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Hứa Thanh Xuân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1NGUYÊN LÝ THỐNG KÊ KINH TẾ ThS. Hứa Thanh Xuân Phần dành cho đơn vị 98 CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ • Điều kiện áp dụng: - Không đòi hỏi phân phối tổng thể là chuẩn. - Dữ liệu ở dạng tần số hoặc số đếm. • Các dạng kiểm định phi tham số: – Kiểm định Wilcoxon (Kiểm định T). – Kiểm định Mann-Whitney. – Kiểm định Kruskal – Wallis. – Kiểm định sự phù hợp. – Kiểm định sự độc lập. 99 KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) • Trường hợp mẫu nhỏ: n  20 Bước 1: Đặt giả thuyết: Bước 2: Tính giá trị kiểm định: - Tính sự chênh lệch giữa các cặp: di = xi – yi - Xếp hạng các dI trong giá trị tuyệt đối di - Tìm tổng hạng của di mang dấu dương  + và tổng hạng của di mang dấu âm  -. - Giá trị kiểm định (T): T = min ( + ; -). Bước 3: Điều kiện bác bỏ H0: T < Tn;      0: 0: 21 2 1 10 H H 2100 KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) Ví dụ 8.1: Trong tháng trước và sau Noel, số lượng người mua sắm quần áo tại 11 cửa hàng trong thành phố như sau: 971455570891057558309550Sau Noel 9715060728911585463010556Trước Noel 1110987654321 Cửa hàng Với mức ý nghĩa 5%, hãy kiểm định xem số lượt người mua sằm quần áo trước và sau Noel có thực sự khác nhau không? 101 • Trường hợp mẫu lớn: n > 20 Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc 2 đuôi. Bước 2: Giá trị kiểm định: Bước 3: Bác bỏ H0 khi: - Kiểm định dạng “1 đuôi”: Z < - Z - Kiểm định dạng “2 đuôi”: Z < - Z/2. KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp) T TTZ   4 1)n(n T  24 1212 )n)(n(n T  Với 102 KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 1. Trường hợp mẫu nhỏ: n1, n2  10; n1 < n2 Bước 1: Đặt giả thuyết: như các trường hợp trên Bước 2: Tính giá trị kiểm định: - Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận giá trị trung bình - Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký hiệu là R1. - Giá trị kiểm định: Bước 3: Tra bảng phân phối để tìm F (U) = Fn1,n2 (U) Bước 4: Giả thuyết H0 bị bác bỏ khi:  > p = 2 F(U). Lưu ý: 2 )1n(n R  1 11 21 2 1 R )n(n nnU  3103 Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin học được trả bởi các công ty như sau: (100.000đ) Có thể kết luận tiền lương khởi điểm của 2 nhóm là khác nhau không? 22251814302812242217Kinh tế 2430271815Điện tử tin học KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 104 2. Trường hợp mẫu lớn: n1, n2 > 10      211 210 :H :H      211 210 :H :H      211 210 :H :H U UUZ   2 21nn U  12 121212 )nn(nn U  ; Bác bỏ H0 GTKĐ Đặt giả thuyết 2 đuôi1 đuôi trái1 đuôi phải Với KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) | Z |> Z | Z |> Z/2 105 Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm của hai ngành kinh tế và điện tử tin học. Mỗi ngành chọn ngẫu nhiên 80 sinh viên và sau đó tiền lương được xếp hạng từ nhỏ đến lớn, và tổng cộng hạng được xếp cho tiền lương của ngành kinh tế bằng 7.287. KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập) 4106 KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhiều tổng thể) Bước 1: Đặt giả thuyết H0: Trung bình của k tổng thể thì giống nhau. H1: Trung bình của k tổng thể thì khác nhau. Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận giá trị trung bình. Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu lại, ký hiệu là R1, R2, , Rk (Lưu ý: ∑R = [n*(n+1)] / 2). Bước 4: Giá trị kiểm định: Bước 5: Bác bỏ H0 nếu    k 1i i 2 i )1n(3 n R )1n(*n 12 W 2 ;1kW  107 Ví dụ 8.4: Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau (với điều kiện nội dung quảng cáo là như nhau), người ta lấy mẫu trên các tờ báo và thu được các kết quả sau (đơn vị: ngàn đồng) Báo A: 57 65 50 45 70 62 68. Báo B: 72 81 64 55 75. Báo C: 35 42 58 46 59 60 61 38. Báo D: 73 92 68 85 82 94 62. Yêu cầu: hãy kiểm định có sự khác biệt về chi phí quảng cáo giữa các tờ báo nói trên hay không ở mức ý nghĩa 5%. KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhiều tổng thể) 108 KIỂM ĐỊNH SỰ PHÙ HỢP • Bài toán tổng quát: Giả sử có mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi quan sát phải và chỉ thuộc về một nhóm thứ i nào đó ( i = 1,2, , k). Gọi Oi là số lượng quan sát ở nhóm thứ i. Kiểm định giả thuyết H0 về phân phối của tổng thể (hay giả thuyết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i. 5109 Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp giả thuyết H0 đúng, nghĩa là tính các giá trị mong muốn Ei- theo công thức: Ei = npi (Ei  5). n 1 n Oi pi Ei = npi O2 p2 E2 = np2 O1 p1 E1 = np1 Giá trị thực tế (Oi) XS theo giả thuyết H0 ( pi) Giá trị mong muốn (Ei) k21Nhóm KIỂM ĐỊNH SỰ PHÙ HỢP Bước 2: Tính giá trị kiểm định:    k i i ii E )EO( 1 2 2 Bước 3: Bác bỏ giả thuyết H0 khi: 2 1 2  ,k 110 KIỂM ĐỊNH SỰ PHÙ HỢP • Ví dụ 8.5 (bài tổng hợp 6): 18031296654Số lượng khách chọn (người) TổngLgSony Ericsson SamsungNokiaNhãn hiệu Với mức ý nghĩa 5%, có thể kết luận sở thích của người tiêu dùng đối với 4 nhãn hiệu điện thoại di động trên là khác nhau hay không? 111 KIỂM ĐỊNH SỰ ĐỘC LẬP Bài toán tổng quát: • Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng tiếp liên gồm r hàng (row) và c cột (column). • Gọi Oij là số quan sát ứng với hàng thứ i và cột thứ j . • Ri là tổng số quan sát ở hàng thứ i . • Cj là tổng số quan sát ở cột thứ j . nCcC2C1 RrOrcOr2Or1r R2O2cO22O212 R1O1cO12O111 c21 Phân nhóm theo tiêu thức thứ 1Phân nhóm theo tiêu thức thứ 2 6112 KIỂM ĐỊNH SỰ ĐỘC LẬP - Bước 1: Đặt giả thuyết H0 : Không có mối liên hệ giữa 2 tiêu thức. H1 : Tồn tại mối liên hệ giữa 2 tiêu thức. - Bước 2: Tính số lượng quan sát theo giả thuyết H0 - Bước 3: Tính GTKĐ: - Bước 4: Bác bỏ H0 nếu : Với có phân phối 2 với (r-1) (c-1) bậc tự do. n CR n R CE jjjjij        r 1i c 1j ij 2 ijij2 E )EO( 2 11 2  ),c)(r( 113 KIỂM ĐỊNH SỰ ĐỘC LẬP 32066131123 170318455Nữ 150354768Nam 7 UpPepsiCoca - Cola Nhãn hiệu ưa thích Giới tính Ví dụ 8.6: Với α = 5%, có thể kết luận có mối liên hệ giữa nhãn hiệu ưa thích và giới tính hay không?

Các file đính kèm theo tài liệu này:

  • pdfnguyen_li_thong_ke_chuong8_1935_2037129.pdf
Tài liệu liên quan