Thống kê ứng dụng - Chương 8: Kiểm định giả thuyết về tham số của tổng thể

Khi giảm α, khoảng ước lượng rộng ra  khả năng bác bỏ H0 giảm ● Xác suất tới hạn p-value = giá trị nhỏ nhất của α mà tại đó không thể bác bỏ H0 được nữa ● TD: n=100; s=10 ● α 1 = 0,1 (90%)  z α1/2= 1,645 ● α 2 = 0,05 (95%)  z α2/2= 1,96 © Nguyễn Tiến Dũng Thống kê ứng dụng 9 0 1 : 368 : 368 366,3

pdf34 trang | Chia sẻ: nhung.12 | Lượt xem: 1548 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Thống kê ứng dụng - Chương 8: Kiểm định giả thuyết về tham số của tổng thể, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 8 KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ CỦA TỔNG THỂ Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG ●Sau khi học xong chương này, người học sẽ ● Hiểu được kiểm định là gì và biết cách lập cặp giả thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên trái và bên phải ● Nắm được quy trình KĐGT tổng quát ● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT trên một tổng thể (trung bình, tỷ lệ, phương sai) ● Biết cách xác định xác suất tới hạn để bác bỏ H0 p-value ● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương sai) © Nguyễn Tiến Dũng Thống kê ứng dụng 2 CÁC NỘI DUNG CHÍNH 8.1 Các vấn đề chung về kiểm định 8.2 KĐ giả thuyết trên một tổng thể 8.3 KĐ giả thuyết trên hai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 3 8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH ●8.1.1 Đặt giả thuyết về tham số tổng thể ● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả thuyết đối) ● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ giữa thời gian tự học và KQ học tập (GPA) ● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học và GPA có mối liên hệ ● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ ● H1: Giữa thời gian tự học và GPA có mối liên hệ ● Để chứng minh nghi vấn của người NC là đúng, thì người NC sẽ phải: thu thập DL  bác bỏ H0. © Nguyễn Tiến Dũng Thống kê ứng dụng 4 ●8.1.2 Một số nguyên tắc liên quan đến việc đặt giả thuyết ● H0: ● trạng thái bình thường; trạng thái gốc, không có dữ liệu chứng minh ● phải có dấu bằng, không có liên hệ; ● H1: ● trạng thái ngược lại H0, không có dấu bằng, có liên hệ, thể hiện nghi vấn của người nghiên cứu ● đòi hỏi dữ liệu, bằng chứng để chứng minh ● Bác bỏ H0 tức chấp nhận H1 là đúng ● TD: Khối lượng gói ngũ cốc µ = 368g © Nguyễn Tiến Dũng Thống kê ứng dụng 5 8.1.3 Logic của bài toán kiểm định ● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng trực giác có thể bác bỏ H0 mà không cần KĐ ● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy tắc nhất quán để bác bỏ H0. © Nguyễn Tiến Dũng Thống kê ứng dụng 6 8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II ●Sai lầm Kiểu I ● Sai lầm alpha ● Alpha = P(Bác bỏ H0/H0 đúng) ● ● Giảm alpha  Giảm Sai lầm Kiểu I  Tăng nguy cơ mắc Sai lầm Kiểu II ● Bác bỏ được H0, chỉ mắc Sai lầm Kiểu I ●Sai lầm Kiểu II ● Sai lầm beta ● Beta = P(Chấp nhận H0/H0 sai) ● ● Hiệu lực của KĐ ● Chấp nhận H0 -> nguy mắc sai lầm kiểu II © Nguyễn Tiến Dũng Thống kê ứng dụng 7 8.1.5 Mức ý nghĩa của KĐ ●8.1.5 Mức ý nghĩa của KĐ (Significance level) ● Alpha: sai lầm phạm phải khi bác bỏ H0 ● CL = (1 – α).100% là độ tin cậy của KĐ ● Giá trị thường dùng: CL = 95% hay α = 0,05 © Nguyễn Tiến Dũng Thống kê ứng dụng 8 8.1.6 Xác suất tới hạn (p-value) ●Khi giảm α, khoảng ước lượng rộng ra  khả năng bác bỏ H0 giảm ●Xác suất tới hạn p-value = giá trị nhỏ nhất của α mà tại đó không thể bác bỏ H0 được nữa ●TD: n=100; s=10 ●α1 = 0,1 (90%)  z α1/2= 1,645 ●α2 = 0,05 (95%)  z α2/2= 1,96 © Nguyễn Tiến Dũng Thống kê ứng dụng 9 0 1 : 368 : 368 366,3 H H x       8.1.7 KĐ một bên và KĐ hai bên © Nguyễn Tiến Dũng Thống kê ứng dụng 10 0 0 1 0 : : H H        0 0 1 0 : : H H        0 0 1 0 : : H H        Kiểm định bên trái Kiểm định hai bên Kiểm định bên phải 8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ ●8.2.1 KĐGT về TB tổng thể ●8.2.2 KĐGT về tỷ lệ tổng thể ●8.2.3 KĐGT về phương sai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 11 8.2.1 KĐGT về TB tổng thể ● Quy trình KĐ 1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ là hai bên, bên trái hay bên phải 2. Chọn mức ý nghĩa a 3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat, tStat (SGK: ztt, ttt ) 4. Có 2 cách tiếp cận: ● Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu KĐ: za, za/2, ta, ta/2 ... ● Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ tính -> tính ra p-value. 5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác bỏ hay chấp chận H0 ● Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ ● Cách 2: So sánh p-value và a 6. Kết luận © Nguyễn Tiến Dũng Thống kê ứng dụng 12 8.2.1.1 Trường hợp biết phương sai tổng thể ● Chỉ tiêu KĐ zStat ● Quy tắc bác bỏ H0 (theo giá trị tới hạn) © Nguyễn Tiến Dũng Thống kê ứng dụng 13 0 0 1 0 : : Stat H H z za          0 0 1 0 /2 /2 : : Stat Stat H H z z z z a a            0 0 1 0 : : Stat H H z za         0 / Stat x z n     8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ mẫu lớn (n≥30) ● Chỉ tiêu KĐ chính xác cần là tStat ● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn giản -> cChỉ tiêu KĐ zStat ● Thay PS tổng thể bằng PS mẫu ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 14 0 0 1 0 : : Stat H H z za          0 Baùc boû H neáu 0 0 1 0 /2 /2 : : Stat Stat H H z z z z a a            0 Baùc boû H neáu 0 0 1 0 : : Stat H H z za         0 Baùc boû H neáu 0 s/ Stat x z n   8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ mẫu nhỏ (n< 30) ● Chỉ tiêu KĐ tStat ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 15 0 0 1 0 1; : : n H H t t a           0 0 1 0 1; /2 1; /2 : : n n H H t t t t a a              0 0 1 0 1; : : n H H t t a          0 s/ Stat x t n   8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0 ●Tính chỉ tiêu KĐ zStat hoặc tStat (tính) ●Tìm xác suất P tương ứng với bài toán KĐ (hai bên, bên trái, bên phải). Đó chính là p- value ● KĐ hai bên: p-value = 2.P(z ≥ |zStat|) ● KĐ bên trái: p-value = P(z ≤ zStat) ● KĐ bên phải: p-value = P(z ≥ zStat) ●So sánh giá trị p-value với α ● Nếu p-value < α thì bác bỏ H0 ● Nếu p-value ≥ α thì chấp nhận H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 16 8.2.2 KĐGT về tỷ lệ tổng thể ● Điều kiện cỡ mẫu đủ lớn: ● np ≥ 5 ● n(1-p) ≥ 5 ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 17 0 0 0 (1 ) / Stat p p z p p n    0 0 1 0 ˆ: ˆ: Stat H p p H p p z za      0 0 1 0 /2 /2 ˆ: ˆ: Stat Stat H p p H p p z z z z a a        0 0 1 0 ˆ: ˆ: Stat H p p H p p z za     8.2.3 KĐGT về phương sai tổng thể ●Chỉ tiêu KĐ ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 18 2 2 2 0 ( 1) Stat n s     2 2 0 2 2 0 2 2 1; /2 2 2 1;1 /2 Stat n Stat n a a                    2 2 0 2 2 0 2 2 1;1Stat n a              2 2 0 2 2 0 2 2 1;Stat n a             KĐ bên trái KĐ hai bên KĐ bên phải Phân phối Chi bình phương © Nguyễn Tiến Dũng Thống kê ứng dụng 19 KĐ Chi bình phương © Nguyễn Tiến Dũng Thống kê ứng dụng 20 KĐ bên trái KĐ hai bên KĐ bên phải © Nguyễn Tiến Dũng Thống kê ứng dụng 21 8.3 KĐGT TRÊN HAI TỔNG THỂ ●8.3.1 KĐGT về chênh lệch của 2 TB tổng thể ●8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể ●8.3.3 KĐGT về tính bằng nhau của 2 phương sai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 22 8.3.1 KĐGT về chênh lệch của hai TB tổng thể ●8.3.1.1 Trường hợp 2 mẫu độc lập, biết PS ●Giả thuyết KĐ ●Chỉ tiêu KĐ ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 23 0 1 2 0 1 1 2 0 : : H d H d z za            0 1 2 0 1 1 2 0 /2 /2 : : H d H d z z z z a a              1 2 0 2 2 1 2 1 2 ( )x x d z n n       0 1 2 0 1 1 2 0 : : H d H d z za           8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ mẫu lớn ●Thay PS tổng thể bằng PS mẫu © Nguyễn Tiến Dũng Thống kê ứng dụng 24 1 2 0 2 2 1 2 1 2 ( )x x d z s s n n     0 1 2 0 1 1 2 0 : : H d H d z za            0 1 2 0 1 1 2 0 /2 /2 : : H d H d z z z z a a              0 1 2 0 1 1 2 0 : : H d H d z za           8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương sai, cỡ mẫu nhỏ ●Giả định 2 tổng thể có phân phối normal ●Trường hợp A: PS 2 tổng thể bằng nhau  thay 2 PS mẫu bằng 1 PS chung © Nguyễn Tiến Dũng Thống kê ứng dụng 25 2 2 2 1 1 2 2 1 2 ( 1) ( 1) 2 p n s n s s n n       1 2 0 1 2 ( ) 1 1 Stat p x x d t s n n     ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 26 1 2 0 1 2 0 1 1 2 0 2; : : n n H d H d t t a              1 2 1 2 0 1 2 0 1 1 2 0 2; /2 2; /2 : : n n n n H d H d t t t t a a                  1 2 0 1 2 0 1 1 2 0 2; : : n n H d H d t t a             8.3.1.3 Trường hợp 2 mẫu độc lập, không biết PS tổng thể, cỡ mẫu nhỏ (tiếp) ●Trường hợp B: 2 PS tổng thể khác nhau ● Chỉ tiêu KĐ t ● Số bậc tự do df © Nguyễn Tiến Dũng Thống kê ứng dụng 27 1 2 0 2 2 1 2 1 2 ( )x x d t s s n n       1 2 1 2 2 2 2 1 2 2 2 2 1 2 2 2 4 4 2 2 1 2 1 21 2 1 2 1 1 1 1 x x x x s s s sn n df s ss s n nn n n n                        ●Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 28 0 1 2 0 1 1 2 0 ; : : df H d H d t t a            0 1 2 0 1 1 2 0 ; /2 ; /2 : : df df H d H d t t t t a a              0 1 2 0 1 1 2 0 ; : : df H d H d t t a           8.1.3.4 Trường hợp 2 mẫu cặp ● Tổng thể 1: x1 ● Tổng thể 2: x2 ● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i ● Trở về trường hợp KĐGT trên 1 tổng thể d ● Nếu n ≥ 30 thì chỉ tiêu KĐ là z ● Nếu n < 30 thì chỉ tiêu KĐ là t ● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm © Nguyễn Tiến Dũng Thống kê ứng dụng 29 0 / d d d t s n  0 d / d d z s n   hoặc 1 1 n i i d d n    2 2 1 1 ( ) 1 n d i i s d d n      ● Quy tắc bác bỏ H0 (n <30) © Nguyễn Tiến Dũng Thống kê ứng dụng 30 0 1 2 0 1 1 2 0 : : H d H d          0 1 2 0 1 1 2 0 : : H d H d          0 1 2 0 1 1 2 0 : : H d H d          0 0 1 0 1; : : D D n H d H d t t a         0 0 1 0 1; : : D D n H d H d t t a        0 0 1 0 1; /2 1; /2 : : D D n n H d H d t t t t a a            8.3.1.5 Ứng dụng Excel ●Data Analysis ●MegaStat © Nguyễn Tiến Dũng Thống kê ứng dụng 31 8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể ●8.3.2.1 Phương pháp dùng phân phối Z ● Kiểm tra GT cỡ mẫu đủ lớn ● n1p1 ≥ 5; n1.(1-p1) ≥ 5 ● n2p2 ≥ 5; n2.(1-p2) ≥ 5 ● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 32 © Nguyễn Tiến Dũng Thống kê ứng dụng 33 0 1 2 1 1 2 ˆ ˆ: 0 ˆ ˆ: 0 H p p H p p z za        0 1 2 1 1 2 /2 /2 ˆ ˆ: 0 ˆ ˆ: 0 H p p H p p z z z z a a          0 1 2 1 1 2 ˆ ˆ: 0 ˆ ˆ: 0 H p p H p p z za       1 2 p p z s   2 1 2 1 1 (1 )( )s p p n n    1 1 2 2 1 2 n p n p p n n    8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể ●Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải © Nguyễn Tiến Dũng Thống kê ứng dụng 34 1 2 1 2 1 2 2 2 0 2 2 1 , ,1 : : df df H H F F a           1 2 1 2 1 2 1 2 2 2 0 2 2 1 , ,1 /2 , , /2 : : df df df df H H F F F F a a             1 2 1 2 1 2 2 2 0 2 2 1 , , : : df df H H F F a          2 1 2 2 s F s  1 2 2 1 , ,1 , , 1 df df df df F F a a  

Các file đính kèm theo tài liệu này:

  • pdftkud2015_ch08_072.pdf