Thống kê ứng dụng - Chương 8: Kiểm định giả thuyết về tham số của tổng thể
Khi giảm α, khoảng ước lượng rộng ra khả
năng bác bỏ H0 giảm
● Xác suất tới hạn p-value = giá trị nhỏ nhất của
α mà tại đó không thể bác bỏ H0 được nữa
● TD: n=100; s=10
● α
1 = 0,1 (90%) z α1/2= 1,645
● α
2 = 0,05 (95%) z α2/2= 1,96
© Nguyễn Tiến Dũng Thống kê ứng dụng 9
0 1
: 368
: 368
366,3
34 trang |
Chia sẻ: nhung.12 | Lượt xem: 1691 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Thống kê ứng dụng - Chương 8: Kiểm định giả thuyết về tham số của tổng thể, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 8
KIỂM ĐỊNH GIẢ THUYẾT
VỀ THAM SỐ CỦA TỔNG THỂ
Ths. Nguyễn Tiến Dũng
Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG
●Sau khi học xong chương này, người học sẽ
● Hiểu được kiểm định là gì và biết cách lập cặp giả
thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên
trái và bên phải
● Nắm được quy trình KĐGT tổng quát
● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT
trên một tổng thể (trung bình, tỷ lệ, phương sai)
● Biết cách xác định xác suất tới hạn để bác bỏ H0
p-value
● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán
KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương
sai)
© Nguyễn Tiến Dũng Thống kê ứng dụng 2
CÁC NỘI DUNG CHÍNH
8.1 Các vấn đề chung về kiểm định
8.2 KĐ giả thuyết trên một tổng thể
8.3 KĐ giả thuyết trên hai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng 3
8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH
●8.1.1 Đặt giả thuyết về tham số tổng thể
● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả
thuyết đối)
● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ
giữa thời gian tự học và KQ học tập (GPA)
● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học
và GPA có mối liên hệ
● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ
● H1: Giữa thời gian tự học và GPA có mối liên hệ
● Để chứng minh nghi vấn của người NC là đúng, thì
người NC sẽ phải: thu thập DL bác bỏ H0.
© Nguyễn Tiến Dũng Thống kê ứng dụng 4
●8.1.2 Một số nguyên tắc liên quan đến việc
đặt giả thuyết
● H0:
● trạng thái bình thường; trạng thái gốc, không có dữ liệu
chứng minh
● phải có dấu bằng, không có liên hệ;
● H1:
● trạng thái ngược lại H0, không có dấu bằng, có liên hệ,
thể hiện nghi vấn của người nghiên cứu
● đòi hỏi dữ liệu, bằng chứng để chứng minh
● Bác bỏ H0 tức chấp nhận H1 là đúng
● TD: Khối lượng gói ngũ cốc µ = 368g
© Nguyễn Tiến Dũng Thống kê ứng dụng 5
8.1.3 Logic của bài toán kiểm định
● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng
trực giác có thể bác bỏ H0 mà không cần KĐ
● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy
tắc nhất quán để bác bỏ H0.
© Nguyễn Tiến Dũng Thống kê ứng dụng 6
8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II
●Sai lầm Kiểu I
● Sai lầm alpha
● Alpha = P(Bác bỏ
H0/H0 đúng)
●
● Giảm alpha Giảm
Sai lầm Kiểu I
Tăng nguy cơ mắc
Sai lầm Kiểu II
● Bác bỏ được H0, chỉ
mắc Sai lầm Kiểu I
●Sai lầm Kiểu II
● Sai lầm beta
● Beta = P(Chấp nhận
H0/H0 sai)
●
● Hiệu lực của KĐ
● Chấp nhận H0 ->
nguy mắc sai lầm
kiểu II
© Nguyễn Tiến Dũng Thống kê ứng dụng 7
8.1.5 Mức ý nghĩa của KĐ
●8.1.5 Mức ý nghĩa của KĐ (Significance level)
● Alpha: sai lầm phạm phải khi bác bỏ H0
● CL = (1 – α).100% là độ tin cậy của KĐ
● Giá trị thường dùng: CL = 95% hay α = 0,05
© Nguyễn Tiến Dũng Thống kê ứng dụng 8
8.1.6 Xác suất tới hạn (p-value)
●Khi giảm α, khoảng ước lượng rộng ra khả
năng bác bỏ H0 giảm
●Xác suất tới hạn p-value = giá trị nhỏ nhất của
α mà tại đó không thể bác bỏ H0 được nữa
●TD: n=100; s=10
●α1 = 0,1 (90%) z α1/2= 1,645
●α2 = 0,05 (95%) z α2/2= 1,96
© Nguyễn Tiến Dũng Thống kê ứng dụng 9
0
1
: 368
: 368
366,3
H
H
x
8.1.7 KĐ một bên và KĐ hai bên
© Nguyễn Tiến Dũng Thống kê ứng dụng 10
0 0
1 0
:
:
H
H
0 0
1 0
:
:
H
H
0 0
1 0
:
:
H
H
Kiểm định bên trái Kiểm định hai bên Kiểm định bên phải
8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ
●8.2.1 KĐGT về TB tổng thể
●8.2.2 KĐGT về tỷ lệ tổng thể
●8.2.3 KĐGT về phương sai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng 11
8.2.1 KĐGT về TB tổng thể
● Quy trình KĐ
1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ
là hai bên, bên trái hay bên phải
2. Chọn mức ý nghĩa a
3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat,
tStat (SGK: ztt, ttt )
4. Có 2 cách tiếp cận:
● Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu
KĐ: za, za/2, ta, ta/2 ...
● Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ
tính -> tính ra p-value.
5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác
bỏ hay chấp chận H0
● Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ
● Cách 2: So sánh p-value và a
6. Kết luận
© Nguyễn Tiến Dũng Thống kê ứng dụng 12
8.2.1.1 Trường hợp biết phương sai tổng thể
● Chỉ tiêu KĐ zStat
● Quy tắc bác bỏ H0 (theo giá trị tới
hạn)
© Nguyễn Tiến Dũng Thống kê ứng dụng 13
0 0
1 0
:
:
Stat
H
H
z za
0 0
1 0
/2
/2
:
:
Stat
Stat
H
H
z z
z z
a
a
0 0
1 0
:
:
Stat
H
H
z za
0
/
Stat
x
z
n
8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ
mẫu lớn (n≥30)
● Chỉ tiêu KĐ chính xác cần là tStat
● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn
giản -> cChỉ tiêu KĐ zStat
● Thay PS tổng thể bằng PS mẫu
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 14
0 0
1 0
:
:
Stat
H
H
z za
0
Baùc boû H neáu
0 0
1 0
/2
/2
:
:
Stat
Stat
H
H
z z
z z
a
a
0
Baùc boû H neáu
0 0
1 0
:
:
Stat
H
H
z za
0
Baùc boû H neáu
0
s/
Stat
x
z
n
8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ
mẫu nhỏ (n< 30)
● Chỉ tiêu KĐ tStat
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 15
0 0
1 0
1;
:
:
n
H
H
t t a
0 0
1 0
1; /2
1; /2
:
:
n
n
H
H
t t
t t
a
a
0 0
1 0
1;
:
:
n
H
H
t t a
0
s/
Stat
x
t
n
8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0
●Tính chỉ tiêu KĐ zStat hoặc tStat (tính)
●Tìm xác suất P tương ứng với bài toán KĐ
(hai bên, bên trái, bên phải). Đó chính là p-
value
● KĐ hai bên: p-value = 2.P(z ≥ |zStat|)
● KĐ bên trái: p-value = P(z ≤ zStat)
● KĐ bên phải: p-value = P(z ≥ zStat)
●So sánh giá trị p-value với α
● Nếu p-value < α thì bác bỏ H0
● Nếu p-value ≥ α thì chấp nhận H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 16
8.2.2 KĐGT về tỷ lệ tổng thể
● Điều kiện cỡ mẫu đủ lớn:
● np ≥ 5
● n(1-p) ≥ 5
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 17
0
0 0
(1 ) /
Stat
p p
z
p p n
0 0
1 0
ˆ:
ˆ:
Stat
H p p
H p p
z za
0 0
1 0
/2
/2
ˆ:
ˆ:
Stat
Stat
H p p
H p p
z z
z z
a
a
0 0
1 0
ˆ:
ˆ:
Stat
H p p
H p p
z za
8.2.3 KĐGT về phương sai tổng thể
●Chỉ tiêu KĐ
●Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 18
2
2
2
0
( 1)
Stat
n s
2 2
0
2 2
0
2 2
1; /2
2 2
1;1 /2
Stat n
Stat n
a
a
2 2
0
2 2
0
2 2
1;1Stat n a
2 2
0
2 2
0
2 2
1;Stat n a
KĐ bên trái KĐ hai bên KĐ bên phải
Phân phối Chi bình phương
© Nguyễn Tiến Dũng Thống kê ứng dụng 19
KĐ Chi bình phương
© Nguyễn Tiến Dũng Thống kê ứng dụng 20
KĐ bên trái KĐ hai bên KĐ bên phải
© Nguyễn Tiến Dũng Thống kê ứng dụng 21
8.3 KĐGT TRÊN HAI TỔNG THỂ
●8.3.1 KĐGT về chênh lệch của 2 TB tổng thể
●8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể
●8.3.3 KĐGT về tính bằng nhau của 2 phương
sai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng 22
8.3.1 KĐGT về chênh lệch của hai TB tổng thể
●8.3.1.1 Trường hợp 2
mẫu độc lập, biết PS
●Giả thuyết KĐ
●Chỉ tiêu KĐ
●Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 23
0 1 2 0
1 1 2 0
:
:
H d
H d
z za
0 1 2 0
1 1 2 0
/2
/2
:
:
H d
H d
z z
z z
a
a
1 2 0
2 2
1 2
1 2
( )x x d
z
n n
0 1 2 0
1 1 2 0
:
:
H d
H d
z za
8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ
mẫu lớn
●Thay PS tổng thể bằng PS mẫu
© Nguyễn Tiến Dũng Thống kê ứng dụng 24
1 2 0
2 2
1 2
1 2
( )x x d
z
s s
n n
0 1 2 0
1 1 2 0
:
:
H d
H d
z za
0 1 2 0
1 1 2 0
/2
/2
:
:
H d
H d
z z
z z
a
a
0 1 2 0
1 1 2 0
:
:
H d
H d
z za
8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương
sai, cỡ mẫu nhỏ
●Giả định 2 tổng thể có phân phối normal
●Trường hợp A: PS 2 tổng thể bằng nhau
thay 2 PS mẫu bằng 1 PS chung
© Nguyễn Tiến Dũng Thống kê ứng dụng 25
2 2
2 1 1 2 2
1 2
( 1) ( 1)
2
p
n s n s
s
n n
1 2 0
1 2
( )
1 1
Stat
p
x x d
t
s
n n
●Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 26
1 2
0 1 2 0
1 1 2 0
2;
:
:
n n
H d
H d
t t a
1 2
1 2
0 1 2 0
1 1 2 0
2; /2
2; /2
:
:
n n
n n
H d
H d
t t
t t
a
a
1 2
0 1 2 0
1 1 2 0
2;
:
:
n n
H d
H d
t t a
8.3.1.3 Trường hợp 2 mẫu độc lập, không biết PS tổng
thể, cỡ mẫu nhỏ (tiếp)
●Trường hợp B: 2 PS tổng thể khác nhau
● Chỉ tiêu KĐ t
● Số bậc tự do df
© Nguyễn Tiến Dũng Thống kê ứng dụng 27
1 2 0
2 2
1 2
1 2
( )x x d
t
s s
n n
1 2
1 2
2
2 2
1 2 2
2 2
1 2
2 2 4 4
2 2
1 2
1 21 2
1 2
1 1
1 1
x x
x x
s s
s sn n
df
s ss s
n nn n
n n
●Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 28
0 1 2 0
1 1 2 0
;
:
:
df
H d
H d
t t a
0 1 2 0
1 1 2 0
; /2
; /2
:
:
df
df
H d
H d
t t
t t
a
a
0 1 2 0
1 1 2 0
;
:
:
df
H d
H d
t t a
8.1.3.4 Trường hợp 2 mẫu cặp
● Tổng thể 1: x1
● Tổng thể 2: x2
● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i
● Trở về trường hợp KĐGT trên 1 tổng thể d
● Nếu n ≥ 30 thì chỉ tiêu KĐ là z
● Nếu n < 30 thì chỉ tiêu KĐ là t
● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm
© Nguyễn Tiến Dũng Thống kê ứng dụng 29
0
/
d
d d
t
s n
0
d
/
d d
z
s n
hoặc
1
1 n
i
i
d d
n
2 2
1
1
( )
1
n
d i
i
s d d
n
● Quy tắc bác bỏ H0 (n <30)
© Nguyễn Tiến Dũng Thống kê ứng dụng 30
0 1 2 0
1 1 2 0
:
:
H d
H d
0 1 2 0
1 1 2 0
:
:
H d
H d
0 1 2 0
1 1 2 0
:
:
H d
H d
0 0
1 0
1;
:
:
D
D
n
H d
H d
t t a
0 0
1 0
1;
:
:
D
D
n
H d
H d
t t a
0 0
1 0
1; /2
1; /2
:
:
D
D
n
n
H d
H d
t t
t t
a
a
8.3.1.5 Ứng dụng Excel
●Data Analysis
●MegaStat
© Nguyễn Tiến Dũng Thống kê ứng dụng 31
8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể
●8.3.2.1 Phương pháp dùng phân phối Z
● Kiểm tra GT cỡ mẫu đủ lớn
● n1p1 ≥ 5; n1.(1-p1) ≥ 5
● n2p2 ≥ 5; n2.(1-p2) ≥ 5
● Giả thuyết KĐ
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 32
© Nguyễn Tiến Dũng Thống kê ứng dụng 33
0 1 2
1 1 2
ˆ ˆ: 0
ˆ ˆ: 0
H p p
H p p
z za
0 1 2
1 1 2
/2
/2
ˆ ˆ: 0
ˆ ˆ: 0
H p p
H p p
z z
z z
a
a
0 1 2
1 1 2
ˆ ˆ: 0
ˆ ˆ: 0
H p p
H p p
z za
1 2
p p
z
s
2
1 2
1 1
(1 )( )s p p
n n
1 1 2 2
1 2
n p n p
p
n n
8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể
●Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải
© Nguyễn Tiến Dũng Thống kê ứng dụng 34
1 2
1 2
1 2
2 2
0
2 2
1
, ,1
:
:
df df
H
H
F F a
1 2
1 2
1 2
1 2
2 2
0
2 2
1
, ,1 /2
, , /2
:
:
df df
df df
H
H
F F
F F
a
a
1 2
1 2
1 2
2 2
0
2 2
1
, ,
:
:
df df
H
H
F F a
2
1
2
2
s
F
s
1 2
2 1
, ,1
, ,
1
df df
df df
F
F
a
a
Các file đính kèm theo tài liệu này:
- tkud2015_ch08_072.pdf