Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Hứa Thanh Xuân
Bài toán tổng quát:
• Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân
nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng
tiếp liên gồm r hàng (row) và c cột (column).
• Gọi Oij là số quan sát ứng với hàng thứ i và cột thứ j .
• Ri là tổng số quan sát ở hàng thứ i .
• Cj là tổng số quan sát ở cột thứ j .
6 trang |
Chia sẻ: HoaNT3298 | Lượt xem: 981 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nguyên lý thống kê - Chương 8: Kiểm định phi tham số - Hứa Thanh Xuân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1NGUYÊN LÝ THỐNG KÊ KINH TẾ
ThS. Hứa Thanh Xuân
Phần dành cho đơn vị
98
CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ
• Điều kiện áp dụng:
- Không đòi hỏi phân phối tổng thể là chuẩn.
- Dữ liệu ở dạng tần số hoặc số đếm.
• Các dạng kiểm định phi tham số:
– Kiểm định Wilcoxon (Kiểm định T).
– Kiểm định Mann-Whitney.
– Kiểm định Kruskal – Wallis.
– Kiểm định sự phù hợp.
– Kiểm định sự độc lập.
99
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
• Trường hợp mẫu nhỏ: n 20
Bước 1: Đặt giả thuyết:
Bước 2: Tính giá trị kiểm định:
- Tính sự chênh lệch giữa các cặp: di = xi – yi
- Xếp hạng các dI trong giá trị tuyệt đối di
- Tìm tổng hạng của di mang dấu dương + và
tổng hạng của di mang dấu âm -.
- Giá trị kiểm định (T): T = min ( + ; -).
Bước 3: Điều kiện bác bỏ H0: T < Tn;
0:
0:
21
2
1
10
H
H
2100
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
Ví dụ 8.1: Trong tháng trước và sau Noel, số
lượng người mua sắm quần áo tại 11 cửa hàng
trong thành phố như sau:
971455570891057558309550Sau Noel
9715060728911585463010556Trước Noel
1110987654321
Cửa hàng
Với mức ý nghĩa 5%, hãy kiểm định xem số lượt
người mua sằm quần áo trước và sau Noel có thực
sự khác nhau không?
101
• Trường hợp mẫu lớn: n > 20
Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc
2 đuôi.
Bước 2: Giá trị kiểm định:
Bước 3: Bác bỏ H0 khi:
- Kiểm định dạng “1 đuôi”: Z < - Z
- Kiểm định dạng “2 đuôi”: Z < - Z/2.
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)
T
TTZ
4
1)n(n
T
24
1212 )n)(n(n
T
Với
102
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
1. Trường hợp mẫu nhỏ: n1, n2 10; n1 < n2
Bước 1: Đặt giả thuyết: như các trường hợp trên
Bước 2: Tính giá trị kiểm định:
- Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần.
Những giá trị bằng nhau sẽ nhận giá trị trung bình
- Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký
hiệu là R1.
- Giá trị kiểm định:
Bước 3: Tra bảng phân phối để tìm F (U) = Fn1,n2 (U)
Bước 4: Giả thuyết H0 bị bác bỏ khi: > p = 2 F(U).
Lưu ý:
2
)1n(n
R
1
11
21 2
1
R
)n(n
nnU
3103
Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm
của sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin
học được trả bởi các công ty như sau: (100.000đ)
Có thể kết luận tiền lương khởi điểm của 2 nhóm là
khác nhau không?
22251814302812242217Kinh tế
2430271815Điện tử tin học
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
104
2. Trường hợp mẫu lớn: n1, n2 > 10
211
210
:H
:H
211
210
:H
:H
211
210
:H
:H
U
UUZ
2
21nn
U 12
121212 )nn(nn
U
;
Bác bỏ H0
GTKĐ
Đặt giả thuyết
2 đuôi1 đuôi trái1 đuôi phải
Với
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
| Z |> Z | Z |> Z/2
105
Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm
của hai ngành kinh tế và điện tử tin học. Mỗi
ngành chọn ngẫu nhiên 80 sinh viên và sau đó
tiền lương được xếp hạng từ nhỏ đến lớn, và
tổng cộng hạng được xếp cho tiền lương của
ngành kinh tế bằng 7.287.
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)
(So sánh TB 2 tổng thể-Phương pháp độc lập)
4106
KIỂM ĐỊNH KRUSKAL WALLIS
(So sánh TB nhiều tổng thể)
Bước 1: Đặt giả thuyết
H0: Trung bình của k tổng thể thì giống nhau.
H1: Trung bình của k tổng thể thì khác nhau.
Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu
theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận
giá trị trung bình.
Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu
lại, ký hiệu là R1, R2, , Rk (Lưu ý: ∑R = [n*(n+1)] / 2).
Bước 4: Giá trị kiểm định:
Bước 5: Bác bỏ H0 nếu
k
1i i
2
i )1n(3
n
R
)1n(*n
12
W
2
;1kW
107
Ví dụ 8.4:
Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau
(với điều kiện nội dung quảng cáo là như nhau), người
ta lấy mẫu trên các tờ báo và thu được các kết quả
sau (đơn vị: ngàn đồng)
Báo A: 57 65 50 45 70 62 68.
Báo B: 72 81 64 55 75.
Báo C: 35 42 58 46 59 60 61 38.
Báo D: 73 92 68 85 82 94 62.
Yêu cầu: hãy kiểm định có sự khác biệt về chi phí
quảng cáo giữa các tờ báo nói trên hay không ở mức ý
nghĩa 5%.
KIỂM ĐỊNH KRUSKAL WALLIS
(So sánh TB nhiều tổng thể)
108
KIỂM ĐỊNH SỰ PHÙ HỢP
• Bài toán tổng quát:
Giả sử có mẫu ngẫu nhiên n quan sát, được
chia thành k nhóm khác nhau: mỗi quan sát
phải và chỉ thuộc về một nhóm thứ i nào đó ( i
= 1,2, , k).
Gọi Oi là số lượng quan sát ở nhóm thứ i.
Kiểm định giả thuyết H0 về phân phối của tổng
thể (hay giả thuyết H0 thể hiện các xác suất pi
để một quan sát nào đó thuộc về nhóm thứ i.
5109
Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp
giả thuyết H0 đúng, nghĩa là tính các giá trị mong muốn Ei- theo công
thức: Ei = npi (Ei 5).
n
1
n
Oi
pi
Ei = npi
O2
p2
E2 = np2
O1
p1
E1 = np1
Giá trị thực tế (Oi)
XS theo giả thuyết H0
( pi)
Giá trị mong muốn
(Ei)
k21Nhóm
KIỂM ĐỊNH SỰ PHÙ HỢP
Bước 2: Tính giá trị kiểm định:
k
i i
ii
E
)EO(
1
2
2
Bước 3: Bác bỏ giả thuyết H0 khi:
2
1
2
,k
110
KIỂM ĐỊNH SỰ PHÙ HỢP
• Ví dụ 8.5 (bài tổng hợp 6):
18031296654Số lượng khách
chọn (người)
TổngLgSony
Ericsson
SamsungNokiaNhãn hiệu
Với mức ý nghĩa 5%, có thể kết luận sở thích của người
tiêu dùng đối với 4 nhãn hiệu điện thoại di động trên là
khác nhau hay không?
111
KIỂM ĐỊNH SỰ ĐỘC LẬP
Bài toán tổng quát:
• Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân
nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng
tiếp liên gồm r hàng (row) và c cột (column).
• Gọi Oij là số quan sát ứng với hàng thứ i và cột thứ j .
• Ri là tổng số quan sát ở hàng thứ i .
• Cj là tổng số quan sát ở cột thứ j .
nCcC2C1
RrOrcOr2Or1r
R2O2cO22O212
R1O1cO12O111
c21
Phân nhóm theo tiêu thức thứ 1Phân nhóm theo
tiêu thức thứ 2
6112
KIỂM ĐỊNH SỰ ĐỘC LẬP
- Bước 1: Đặt giả thuyết
H0 : Không có mối liên hệ giữa 2 tiêu thức.
H1 : Tồn tại mối liên hệ giữa 2 tiêu thức.
- Bước 2: Tính số lượng quan sát theo giả thuyết H0
- Bước 3: Tính GTKĐ:
- Bước 4: Bác bỏ H0 nếu :
Với có phân phối 2 với (r-1) (c-1) bậc tự do.
n
CR
n
R
CE jjjjij
r
1i
c
1j ij
2
ijij2
E
)EO(
2
11
2
),c)(r(
113
KIỂM ĐỊNH SỰ ĐỘC LẬP
32066131123
170318455Nữ
150354768Nam
7 UpPepsiCoca - Cola
Nhãn hiệu ưa thích
Giới tính
Ví dụ 8.6:
Với α = 5%, có thể kết luận có mối liên hệ giữa nhãn
hiệu ưa thích và giới tính hay không?
Các file đính kèm theo tài liệu này:
- nguyen_li_thong_ke_chuong8_1935_2037129.pdf