- Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - ? thoả mãn độ tin cậy thống kê
cho tr-ớc. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả nghiên cứu thoả mãn độ
tin cậy thống kê cho tr-ớc. Trong tr-ờng hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn
hơn mắc sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X khác ? hơn là kết luận
X giống ? để chọn quyết định cho phù hợp.
Do t
bảng phụ thuộc độ tin cậy thống kê ( P ) cho tr-ớc, nên một kết luận thống kê rút ra
đ-ợc chỉ ứng với một độ tin cậy thống kê cho tr-ớc mà thôi. Khi độ tin cậy thống kê thay đổi
thì kết luận thống kê cũng có thể thay đổi theo.
Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các
chuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết
luận thống kê cho đúng - gọi là kiểm định thống kê.
10 trang |
Chia sẻ: nguyenlam99 | Lượt xem: 851 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Toán học - Chương 3: So sánh cặp tham số đặc trưng của hai tập số liệu kết quả nghiên cứu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
27
Ch-ơng 3
so sánh cặp tham số đặc tr-ng
của hai tập số liệu kết quả nghiên cứu
3.1. Giả thiết thống kê và kết luận thống kê:
3.1.1.Giả thiết thống kê:
Giả sử ta có Xi và Xk là 2 tham số đặc tr-ng của 2 tập số liệu kết quả nghiên cứu. Xuất
hiện 2 giả thiết thống kê, trình bầy ở bảng sau:
Giả thiết thống kê Ký hiệu ý nghĩa Biểu diễn
Giả thiết không
(giả thiết không liên quan) H0 XiXk Xi - Xk0
Giả thiết khác không
(giả thiết liên quan)
Ha
(H1)
Xi Xk
Xi>Xk;
Xi<Xk
Xi - Xk0
Trong đó : Xi và Xk có thể là hai sự kiện, hai biến cố, hoặc hai đại l-ợng ngẫu nhiên có
cùng thứ nguyên.
3.1.2. Kết luận thống kê:
Có hai loại kết luận thống kê :
Bảng phân loại các kết luận thống kê:
Thật Giả
Kết luận thống kê
loại 1:
Bác bỏ H0;
Chấp nhận Ha
Kết luận thống kê
loại 2:
Chấp nhận H0;
Bác bỏ Ha
H0
(XiXk)
Ha
(XiXk)
Sai
(Sai lầm loại 1)
Đúng
Ha
(XiXk)
H0
(XiXk)
Đúng Sai
( Sai lầm loại 2)
+ Kết luận thống kê loại 1: Phủ định H0 (bác bỏ H0) và Khẳng định Ha (chấp nhận Ha).
Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là “ Đúng là H0 ( xixk ) lại kết
luận là Ha (xixk). Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác
nhau.”
+ Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha).Khẳng định H0 (chấp nhận H0).
Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là “ Đúng là Ha (Xi Xk) lại kết
luận là H0 (XiXk). Nói một cách khác : đúng là chúng khác nhau lại kết luận chúng
giống nhau .
Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thống
kê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giả
thiết thống kê này đúng còn giả thiết thống kê kia sai.
Trong tr-ờng hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai lầm
loại 1 còn hơn mắc sai lầm loại 2. Nói cách khác: nếu không đủ bằng chứng để khẳng định giả
thiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0.
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
28
3.2. Quan hệ giữa chuẩn phân phối và kết luận thống kê.
Các chuẩn phân phối có thể tính đ-ợc từ các số liệu của tập số liệu kết quả nghiên cứu:
Xu
f
i
)f,P( S
XX
t
hoặc
xS
X
2
2
2
1
)f,f,P(
S
S
F
21
2
f
i
N
1i
)f,P(2 )
S
XX
(
Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:
- Nếu ttính < tbảng nghĩa là độ tin cậy thống kê của t tính nhỏ hơn độ tin cậy thống kê
của tbảng vậy thì ttính không đáng tin cậy bằng tbảng.
Do ttính không đáng tin cậy bằng tbảng nên hiệu số X - không đáng tin cậy, điều đó
có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy . Vì chúng
khác nhau không đáng tin cậy cho nên có thể coi nh- chúng giống nhau (chấp nhận H0, phủ
nhận Ha).
- Nếu ttính > tbảng , thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng.
Vì vậy ttính đáng tin cậy và do đó hiệu số X - chỉ sự sai khác giữa X vàlà đáng tin cậy
(phủ nhận H0, chấp nhận Ha).
Ptt > P tb
PttPtb
P tt > P tb
f(x)
tt < tb
f(x)
tt = tb
f(x)
tb < tt
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
29
- Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - thoả mãn độ tin cậy thống kê
cho tr-ớc. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả nghiên cứu thoả mãn độ
tin cậy thống kê cho tr-ớc. Trong tr-ờng hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn
hơn mắc sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X kháchơn là kết luận
X giống để chọn quyết định cho phù hợp.
Do tbảng phụ thuộc độ tin cậy thống kê ( P ) cho tr-ớc, nên một kết luận thống kê rút ra
đ-ợc chỉ ứng với một độ tin cậy thống kê cho tr-ớc mà thôi. Khi độ tin cậy thống kê thay đổi
thì kết luận thống kê cũng có thể thay đổi theo.
Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các
chuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết
luận thống kê cho đúng - gọi là kiểm định thống kê.
3.3. So sánh cặp tham số đặc trựng của hai tập số liệu kết quả nghiên cứu:
Có hai cặp tham số đặc tr-ng quan trọng nhất th-ờng phân tích so sánh đó là:
* So sánh độ chính xác: Đặc tr-ng bởi X , khi đó có hai tr-ờng hợp chính:
1. So sánh X với
2. So sánh X A và X B
* So sánh độ sai biệt: đặc tr-ng bởi S2.
Tuỳ theo NA và NB nhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theo
cách khác nhau.
3.3.1. So sánh độ chính xác:
Nguyên tắc so sánh là dùng chuẩn u hoặc chuẩn t để so sánh, vì:
Xu
f
i
S
XX
t
hoặc
x
BA
S
XX
t
Với N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t.
Cánh tính toán chuẩn u hoặc t và so sánh với các giá trị tra bảng đ-ợc phân thành các
tr-ờng hợp sau:
3..3.1.1. Nếu NA và NB > 30. Dùng chuẩn u để so sánh.
utính = N.
d
N
dd
ffx
3.1
Trong đó: BA XXd 3.2
S
B
B
A
A
df NN
22 3.3
BA
BA
N.N
NN
N
3.4
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
30
3..3.1.2. Nếu NA và NB < 30, dùng chuẩn t để so sánh chia làm hai tr-ờng hợp chính:
1/. Nếu NANB <30. (giống tr-ờng hợp 3.1.1)
N.
Sf
d
Sx
d)f,p(t 3.5
Trong đó: BA XXd 3.6
)1N()1N(
)1N(S)1N(S
Sd
BA
B
2
BA
2
A
3.7
BA
BA
N.N
NN
N
3.8
f = (NA - 1) + (NB - 1) = NA+ NB - 2 3.9
2./ Nếu NA = NB = N'<30.
Chia làm 2 tr-ờng hợp.
a. Không liên quan với nhau từng đôi một:
N.
S
d
S
d
)f,p(t
fx
3.10
Trong đó: BA XXd 3.11
2
SS
Sd
2
B
2
A 3.12
'N
2
N
2
N
2
N
BA
3.13
f = NA + NB - 2 3.14
b. Có liên quan từng đôi một:
'N
S
'N
du
S
d)f,p(t
fx
3.15
Trong đó: BuAu XXd 3.16
'N
du
d
N
1u
3.17
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
31
1'N
)dd(
Sd
N
1u
2
i
3.18
'N
2
N
2
N
2N
BA
3.19
f = NA - 1 = NB - 1 = N'- 1 3.20
Ví dụ 3.1 :
Sử dụng 4 nghiên cứu A,B,C và D. Kết quả làm lặp lại theo mỗi nghiên cứu 6 lần thu
đ-ợc trình bày trong bảng sau :
N ph2A ph2B ph3C ph2D
1 18,00 18,55 17,65 19,10
2 18,05 17,60 17,70 18,40
3 17,95 18,00 17,90 18,10
4 18,15 18,30 17,65 18,70
5 17,95 18,25 17,85 18,80
6 18,20 17,90 17,75 18,50
a/ Tính giá trị Trung bình và Ph-ơng sai của mỗi nghiên cứu và nhận xét.
b/ Biết giá trị thật là 18,1. Phân tích đánh giá sai số của mỗi nghiên cứu.
Giải :
ph2A ph2B ph3C ph2D
X = 18,050 18,100 17,750 18,600
S2 = 0,012 0,112 0,018 0,120
ph2A
ph2B
ph2C
ph2D
17,000 18,000 19,000
6
012,0
1,1805,18
t A
= 0,354 tB ( 95,5 ) = 2,57
Kết luận : H0 : x sai số ngẫu nhiên
ph2C :
6
018,0
1,1875,17
tC
= 6,48 tB ( 95,5 ) = 2,57
Kết luận : Ha : x sai số hệ thống.
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
32
Ví dụ 3.2 :
Cho kết quả nghiên cứu của A và B :
1 2 3 4 5 6 7
A 33,5 33,9 33,5 34,9 34,1 33,2 33,2
B 31,1 32,9 32,8 31,9 33,0 31,6 32,1
8 9 10
A 31,1 31,1 31,7
B 31,5 31,0 31,0
Phân tích đánh giá và phân tích so sánh 2 kết quả nghiên cứu trên
Giải:
Ax = 32,72 Bx = 31,89
S2B = 1,327 S
2
B = 0,619
* Không liên quan từng đôi một: H0 = 2 kết quả nghiên cứu không khác nhau.
Ha = 2 kết quả khác nhau.
d = 32,72 - 31,89 = 0,83
2
SS
Sd
2
B
2
A
9,1
1010
1010
973,0
83,0
n.n
nn
S
d
t
21
21
d
t
tb ( 0,95 ; 18 ) = 2,101 Kết luận t ttb chấp nhận H0
* Liên quan từng đôi một : H0 = 2 kết quả nghiên cứu không khác nhau.
Ha = 2 kết quả khác nhau.
83,0
10
3,8
n
d
d
667,0
110
10
3,8
89,12
1n
n
)d(
d
S
22
2
2
d
2,3
10
667.0
83,0
N
S
d
t
d
t
tb ( 0,95 ; 9 ) = 2,26 t tính tb chấp nhận Ha
tb ( 0,99 ; 9 ) = 3,25 ttính tb bác bỏ Ha
Nhân xét : - Khảo sát liên quan từng đôi một cho thấy có sự sai khác, trong khi khảo sát
không liên quan từng đôi một thì không thấy sự khác nhau.
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
33
- Khi thay đổi độ tin cậy thông kê thì có thể dẫn đến thay đổi kết luận thống kê.
Ví dụ 3.3:
Để xác định l-ợng urê trong máu ng-ời, ta xây dựng một ph-ơng pháp mới. Ta muốn
kiểm tra xem ph-ơng pháp mới này có gì khác đáng kể so với ph-ơng pháp đã đ-ợc chấp nhận
trong phòng thí nghiệm. Ta thực hiện hai ph-ơng pháp trên 6 mẫu khác nhau và thu đ-ợc kết
quả ghi trong bảng sau:
Mẫu Ph-ơng pháp
mới
Ph-ơng pháp
so sánh
di di-dtb (di-dtb)
2
A
B
C
D
E
F
10,2 mg/dl
12,7
8,6
17,5
11,2
11,5
10,5
11,9
8,7
16,9
10,9
11,1
-0,3
0,8
-0,1
0,6
0,3
0,4
dtb=0,28
-0,6
0,5
-0,4
0,3
0,0
0,1
0,36
0,25
0,16
0,09
0,00
0,01
Tổng 0,87
Khi đó, ta có sd =
5
87,0 = 0,42 t = 6
42,0
28,0 = 1,63
Giá trị t t-ơng ứng trong bảng ứng với độ tin cậy 95% là 2,571, lớn hơn giá trị t tính
đ-ợc. Do đó, hai ph-ơng pháp không khác nhau đáng kể.
Ví dụ 3.4:
Một ph-ơng pháp mới đ-ợc xây dựng để xác định hàm l-ợng sắt trong chất kết tinh với
cơ bo. Độ chính xác của ph-ơng pháp đ-ợc phân tích bằng cách so sánh kết quả thu đ-ợc với
kết quả thu đ-ợc khi dùng ph-ơng pháp amoniac. Ta có bảng sau:
Ph-ơng pháp mới Ph-ơng pháp so sánh
20,01% 18,89%
20,05 19,20
18,65 19,00
19,25 19,70
19,40 19,40
19,99
19,65% 19,24%
Hỏi có sự khác nhau nào đáng kể giữa hai ph-ơng pháp trên không?
Ta có bảng sau (tr-ớc hết dùng chuẩn F để xem có thể so sánh hai ph-ơng pháp này với nhau
không)
x i1 xi1-xtb1 (xi1-xtb1)2 xi2 xi2-xtb2 (xi2-xtb2)2
20,01
20,05
18,65
19,25
19,40
19,99
19,65
0,45
0,85
1,00
0,40
0,25
0,24
0,202
0,722
1,000
0,160
0,062
0,116
2,262
18,89
19,20
19,00
19,70
19,40
19,24
0,35
0,04
0,24
0,46
0,16
0,122
0,002
0,058
0,212
0,026
0,420
Do đó, ta có F =
4/420,0
5/262,2
= 4,31
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
34
Xem trong bảng, giá trị F t-ơng ứng lớn hơn. Do đó, có thể so sánh hai ph-ơng pháp
này với nhau. Lúc này, ta tính sp
Sp =
211
420,0262,2
= 0,546
Do đó, ta tính đ-ợc t là:
t =
56
56
546,0
24,1965,19
= 1,23
Giá trị này nhỏ hơn giá trị trong bảng ứng với độ tin cậy 95%, do đó không có sự khác nhau
đáng kể nào giữa hai ph-ơng pháp.
3.3.2. So sánh độ sai biệt:
Vì Ph-ơng sai đặc tr-ng cho độ sai biệt, nên so sánh độ sai biệt , chính là so sánh
ph-ơng sai. Ng-ời ta sử dụng chuẩn Fisher để so sánh:
Chuẩn Fisher:
2
2
2
1
21
S
S
)f,f,p(F )SS( 22
2
1 3.21
Khi đó:
Giả thiết H0: S12 = S22 đ-ợc chấp nhận khi và chỉ khi F không đáng tin cậy.
( Ftính < Fbảng ( p,f1,f2 ) ).
Giả thiết Ha: S1
2S22 đ-ợc chấp nhận khi và chỉ khi F đáng tin cậy .
( Ftính > Fbảng ( p,f1,f2 ) ).
Vì :
S
S
1
2
2
2 > 1 nên : S1
2 > S2
2
Việc so sánh Ftính và Fbảng luôn phụ thuộc vào độ tin cậy thống kê cho tr-ớc.
Ví dụ 3.5 :
Hai nghiên cứu A và B thu đ-ợc kết quả nh- sau :
1 2 3 4 5 6 7 8
A 4,40 4,56 4,42 4,59 4,55 4,45 4,55 4,39
B 4,42 4,47 4,70 4,72 4,53 4,55 4,60 4,64
9 10 11 12 13 14 15 16
A 4,75 4,72 4,53 4,66 4,90 4,50 4,45 4,66
B 4,29 4,52 4,57 4,56 4,66 - - -
17 18 19 20
A 4,80 4,36 4,75 4,22
B - - - -
a/ Tính các đại l-ợng đặc tr-ng của tập hai kết quả nghiên cứu trên.
b/ So sánh giá trị trung bình và giá trị ph-ơng sai của 2 nghiên cứu A và B.
Giải :
75,4x20
1
x inA và 0295,0S
2
A H0
2
B
2
A SS
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
35
56,4x13
1
x jinB và 0139,0S
2
B Ha
2
B
2
A SS
54,2F12,2
0139,0
0259,0
S
S
F )12,19,95(b2
B
2
A
Kết luận : chấp nhận H0, bác bỏ Ha
Ví dụ 3.6:
Ta xây dựng một ph-ơng pháp sắc ký xác định l-ợng đ-ờng trong huyết thanh. Sử
dụng chuẩn F để so sánh kết quả. Cho biết có sự khác nhau đáng kể nào giữa hai ph-ơng pháp
không?
Ph-ơng pháp của ta Ph-ơng pháp Folin-Wu
mg/ml mg/ml
127 130
125 128
123 131
130 129
131 127
126 125
129
Trung bình 127 Trung bình 128
S2 8,3 S2 4,8
Do đó , F = 1,73. Từ bảng ta có Fb = 4,95. Từ đó suy ra không có sự khác biệt đáng kể
nào giữa hai ph-ơng pháp.
3..3.3.Bài toán so sánh 2 tỷ số :
- Để so sánh 2 tỷ số :
A
A
A N
Xp và
B
B
B N
X
p , ta dùng chuẩn t :
ttính =
BA
BA
N
pq
N
pq
pp
Trong đó :
BA
BA
NN
XX
p
và p1q 3.22
- Có hai điều kiện để áp dụng công thức trên :
1/ Mẫu phải đủ lớn, ít nhất phải có :
NA p , NB p 5 và NA q , NB q 5
2/ p và q phải gần 0,5 , nghĩa là xa 1 và 0 , cụ thể ta phải có :
p > 0,1 và q 0,1
- Bài toán khi đó với giả thiết thống kê và kết luận thông kê nh- sau:
* Giả thiết thống kê : H0 pA pB ; Ha pA pB
Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
36
* Kết luận thống kê :
t< 1,96 : chấp nhận H0, bác bỏ Ha (= 0,05 )
t> 1,96 : chấp nhận Ha, bác bỏ H0 (= 0,05 )
Ví dụ 3.7:
Tiến hành hai lô nghiên cứu, Lô 1 có 300 X1 trong đó có 250 Y1, lô 2 có 400 X2 trong
đó có 240 Y2.
Với = 0,05 hãy đánh giá xem tỷ lệ của hai lô có giống nhau hay khác nhau?
Giải:
-Tính tỷ lệ :
833,0
300
250p1 và 6,0400
240p 2
-áp dung công thức
7,0
400300
240250p
và q =1-0,7=0,3
- tính ttinh :
t tính= 96,1)6982700f;95,0(t65,6
400
3,07,0
300
3,07,0
6,0833,0
Kết luận : Tỷ lệ của hai lô là khác nhau đáng tin cậy ở ng-ỡng 95%.
Các file đính kèm theo tài liệu này:
- c3_5418.pdf