Toán học - Chương 3: So sánh cặp tham số đặc trưng của hai tập số liệu kết quả nghiên cứu

- Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - ? thoả mãn độ tin cậy thống kê cho tr-ớc. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả nghiên cứu thoả mãn độ tin cậy thống kê cho tr-ớc. Trong tr-ờng hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mắc sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X khác ? hơn là kết luận X giống ? để chọn quyết định cho phù hợp. Do t bảng phụ thuộc độ tin cậy thống kê ( P ) cho tr-ớc, nên một kết luận thống kê rút ra đ-ợc chỉ ứng với một độ tin cậy thống kê cho tr-ớc mà thôi. Khi độ tin cậy thống kê thay đổi thì kết luận thống kê cũng có thể thay đổi theo. Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các chuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết luận thống kê cho đúng - gọi là kiểm định thống kê.

10 trang | Chia sẻ: nguyenlam99 | Lượt xem: 745 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Toán học - Chương 3: So sánh cặp tham số đặc trưng của hai tập số liệu kết quả nghiên cứu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 27 Ch-ơng 3 so sánh cặp tham số đặc tr-ng của hai tập số liệu kết quả nghiên cứu 3.1. Giả thiết thống kê và kết luận thống kê: 3.1.1.Giả thiết thống kê: Giả sử ta có Xi và Xk là 2 tham số đặc tr-ng của 2 tập số liệu kết quả nghiên cứu. Xuất hiện 2 giả thiết thống kê, trình bầy ở bảng sau: Giả thiết thống kê Ký hiệu ý nghĩa Biểu diễn Giả thiết không (giả thiết không liên quan) H0 XiXk Xi - Xk0 Giả thiết khác không (giả thiết liên quan) Ha (H1) Xi Xk Xi>Xk; Xi<Xk Xi - Xk0 Trong đó : Xi và Xk có thể là hai sự kiện, hai biến cố, hoặc hai đại l-ợng ngẫu nhiên có cùng thứ nguyên. 3.1.2. Kết luận thống kê: Có hai loại kết luận thống kê : Bảng phân loại các kết luận thống kê: Thật Giả Kết luận thống kê loại 1: Bác bỏ H0; Chấp nhận Ha Kết luận thống kê loại 2: Chấp nhận H0; Bác bỏ Ha H0 (XiXk) Ha (XiXk) Sai (Sai lầm loại 1) Đúng Ha (XiXk) H0 (XiXk) Đúng Sai ( Sai lầm loại 2) + Kết luận thống kê loại 1: Phủ định H0 (bác bỏ H0) và Khẳng định Ha (chấp nhận Ha). Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là “ Đúng là H0 ( xixk ) lại kết luận là Ha (xixk). Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác nhau.” + Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha).Khẳng định H0 (chấp nhận H0). Kết luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là “ Đúng là Ha (Xi Xk) lại kết luận là H0 (XiXk). Nói một cách khác : đúng là chúng khác nhau lại kết luận chúng giống nhau . Cần nhớ rằng : Kết luận thống kê là khẳng định ( hay chấp nhận ) một giả thiết thống kê này và phủ nhận ( hay bác bỏ ) giả thiết thống kê kia, chứ không có nghĩa là cho rằng giả thiết thống kê này đúng còn giả thiết thống kê kia sai. Trong tr-ờng hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai lầm loại 1 còn hơn mắc sai lầm loại 2. Nói cách khác: nếu không đủ bằng chứng để khẳng định giả thiết H0, thì thà phủ nhận giả thiết H0, còn hơn khẳng định giả thiết H0. Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 28 3.2. Quan hệ giữa chuẩn phân phối và kết luận thống kê. Các chuẩn phân phối có thể tính đ-ợc từ các số liệu của tập số liệu kết quả nghiên cứu:  Xu f i )f,P( S XX t  hoặc xS X  2 2 2 1 )f,f,P( S S F 21  2 f i N 1i )f,P(2 ) S XX (    Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê: - Nếu ttính < tbảng nghĩa là độ tin cậy thống kê của t tính nhỏ hơn độ tin cậy thống kê của tbảng vậy thì ttính không đáng tin cậy bằng tbảng. Do ttính không đáng tin cậy bằng tbảng nên hiệu số X - không đáng tin cậy, điều đó có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy . Vì chúng khác nhau không đáng tin cậy cho nên có thể coi nh- chúng giống nhau (chấp nhận H0, phủ nhận Ha). - Nếu ttính > tbảng , thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbảng. Vì vậy ttính đáng tin cậy và do đó hiệu số X - chỉ sự sai khác giữa X vàlà đáng tin cậy (phủ nhận H0, chấp nhận Ha). Ptt > P tb PttPtb P tt > P tb f(x) tt < tb f(x) tt = tb f(x) tb < tt Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 29 - Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - thoả mãn độ tin cậy thống kê cho tr-ớc. Nói cách khác độ chính xác tin cậy của tập số liệu kết quả nghiên cứu thoả mãn độ tin cậy thống kê cho tr-ớc. Trong tr-ờng hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mắc sai lầm loại 2 để kết luận thống kê. Nghĩa là thà kết luận X kháchơn là kết luận X giống để chọn quyết định cho phù hợp. Do tbảng phụ thuộc độ tin cậy thống kê ( P ) cho tr-ớc, nên một kết luận thống kê rút ra đ-ợc chỉ ứng với một độ tin cậy thống kê cho tr-ớc mà thôi. Khi độ tin cậy thống kê thay đổi thì kết luận thống kê cũng có thể thay đổi theo. Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các chuẩn phân phối khác. Và việc sử dụng các chuẩn phân phối của các hàm phân phối để kết luận thống kê cho đúng - gọi là kiểm định thống kê. 3.3. So sánh cặp tham số đặc trựng của hai tập số liệu kết quả nghiên cứu: Có hai cặp tham số đặc tr-ng quan trọng nhất th-ờng phân tích so sánh đó là: * So sánh độ chính xác: Đặc tr-ng bởi X , khi đó có hai tr-ờng hợp chính: 1. So sánh X với 2. So sánh X A và X B * So sánh độ sai biệt: đặc tr-ng bởi S2. Tuỳ theo NA và NB nhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theo cách khác nhau. 3.3.1. So sánh độ chính xác: Nguyên tắc so sánh là dùng chuẩn u hoặc chuẩn t để so sánh, vì:  Xu f i S XX t  hoặc x BA S XX t  Với N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t. Cánh tính toán chuẩn u hoặc t và so sánh với các giá trị tra bảng đ-ợc phân thành các tr-ờng hợp sau: 3..3.1.1. Nếu NA và NB > 30. Dùng chuẩn u để so sánh. utính = N. d N dd ffx   3.1 Trong đó: BA XXd  3.2 S B B A A df NN 22   3.3 BA BA N.N NN N  3.4 Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 30 3..3.1.2. Nếu NA và NB < 30, dùng chuẩn t để so sánh chia làm hai tr-ờng hợp chính: 1/. Nếu NANB <30. (giống tr-ờng hợp 3.1.1) N. Sf d Sx d)f,p(t  3.5 Trong đó: BA XXd  3.6 )1N()1N( )1N(S)1N(S Sd BA B 2 BA 2 A    3.7 BA BA N.N NN N  3.8 f = (NA - 1) + (NB - 1) = NA+ NB - 2 3.9 2./ Nếu NA = NB = N'<30. Chia làm 2 tr-ờng hợp. a. Không liên quan với nhau từng đôi một: N. S d S d )f,p(t fx  3.10 Trong đó: BA XXd  3.11 2 SS Sd 2 B 2 A  3.12 'N 2 N 2 N 2 N BA  3.13 f = NA + NB - 2 3.14 b. Có liên quan từng đôi một: 'N S 'N du S d)f,p(t fx   3.15 Trong đó: BuAu XXd  3.16 'N du d N 1u   3.17 Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 31 1'N )dd( Sd N 1u 2 i      3.18 'N 2 N 2 N 2N BA  3.19 f = NA - 1 = NB - 1 = N'- 1 3.20 Ví dụ 3.1 : Sử dụng 4 nghiên cứu A,B,C và D. Kết quả làm lặp lại theo mỗi nghiên cứu 6 lần thu đ-ợc trình bày trong bảng sau : N ph2A ph2B ph3C ph2D 1 18,00 18,55 17,65 19,10 2 18,05 17,60 17,70 18,40 3 17,95 18,00 17,90 18,10 4 18,15 18,30 17,65 18,70 5 17,95 18,25 17,85 18,80 6 18,20 17,90 17,75 18,50 a/ Tính giá trị Trung bình và Ph-ơng sai của mỗi nghiên cứu và nhận xét. b/ Biết giá trị thật là 18,1. Phân tích đánh giá sai số của mỗi nghiên cứu. Giải : ph2A ph2B ph3C ph2D X = 18,050 18,100 17,750 18,600 S2 = 0,012 0,112 0,018 0,120 ph2A ph2B ph2C ph2D 17,000 18,000 19,000 6 012,0 1,1805,18 t A   = 0,354  tB ( 95,5 ) = 2,57 Kết luận : H0 : x sai số ngẫu nhiên ph2C : 6 018,0 1,1875,17 tC   = 6,48 tB ( 95,5 ) = 2,57 Kết luận : Ha : x  sai số hệ thống. Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 32 Ví dụ 3.2 : Cho kết quả nghiên cứu của A và B : 1 2 3 4 5 6 7 A 33,5 33,9 33,5 34,9 34,1 33,2 33,2 B 31,1 32,9 32,8 31,9 33,0 31,6 32,1 8 9 10 A 31,1 31,1 31,7 B 31,5 31,0 31,0 Phân tích đánh giá và phân tích so sánh 2 kết quả nghiên cứu trên Giải: Ax = 32,72 Bx = 31,89 S2B = 1,327 S 2 B = 0,619 * Không liên quan từng đôi một: H0 = 2 kết quả nghiên cứu không khác nhau. Ha = 2 kết quả khác nhau. d = 32,72 - 31,89 = 0,83 2 SS Sd 2 B 2 A  9,1 1010 1010 973,0 83,0 n.n nn S d t 21 21 d t   tb ( 0,95 ; 18 ) = 2,101 Kết luận t ttb chấp nhận H0 * Liên quan từng đôi một : H0 = 2 kết quả nghiên cứu không khác nhau. Ha = 2 kết quả khác nhau. 83,0 10 3,8 n d d  667,0 110 10 3,8 89,12 1n n )d( d S 22 2 2 d       2,3 10 667.0 83,0 N S d t d t  tb ( 0,95 ; 9 ) = 2,26  t tính tb  chấp nhận Ha tb ( 0,99 ; 9 ) = 3,25  ttính tb  bác bỏ Ha Nhân xét : - Khảo sát liên quan từng đôi một cho thấy có sự sai khác, trong khi khảo sát không liên quan từng đôi một thì không thấy sự khác nhau. Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 33 - Khi thay đổi độ tin cậy thông kê thì có thể dẫn đến thay đổi kết luận thống kê. Ví dụ 3.3: Để xác định l-ợng urê trong máu ng-ời, ta xây dựng một ph-ơng pháp mới. Ta muốn kiểm tra xem ph-ơng pháp mới này có gì khác đáng kể so với ph-ơng pháp đã đ-ợc chấp nhận trong phòng thí nghiệm. Ta thực hiện hai ph-ơng pháp trên 6 mẫu khác nhau và thu đ-ợc kết quả ghi trong bảng sau: Mẫu Ph-ơng pháp mới Ph-ơng pháp so sánh di di-dtb (di-dtb) 2 A B C D E F 10,2 mg/dl 12,7 8,6 17,5 11,2 11,5 10,5 11,9 8,7 16,9 10,9 11,1 -0,3 0,8 -0,1 0,6 0,3 0,4 dtb=0,28 -0,6 0,5 -0,4 0,3 0,0 0,1 0,36 0,25 0,16 0,09 0,00 0,01 Tổng 0,87 Khi đó, ta có sd = 5 87,0 = 0,42 t = 6 42,0 28,0  = 1,63 Giá trị t t-ơng ứng trong bảng ứng với độ tin cậy 95% là 2,571, lớn hơn giá trị t tính đ-ợc. Do đó, hai ph-ơng pháp không khác nhau đáng kể. Ví dụ 3.4: Một ph-ơng pháp mới đ-ợc xây dựng để xác định hàm l-ợng sắt trong chất kết tinh với cơ bo. Độ chính xác của ph-ơng pháp đ-ợc phân tích bằng cách so sánh kết quả thu đ-ợc với kết quả thu đ-ợc khi dùng ph-ơng pháp amoniac. Ta có bảng sau: Ph-ơng pháp mới Ph-ơng pháp so sánh 20,01% 18,89% 20,05 19,20 18,65 19,00 19,25 19,70 19,40 19,40 19,99 19,65% 19,24% Hỏi có sự khác nhau nào đáng kể giữa hai ph-ơng pháp trên không? Ta có bảng sau (tr-ớc hết dùng chuẩn F để xem có thể so sánh hai ph-ơng pháp này với nhau không) x i1 xi1-xtb1 (xi1-xtb1)2 xi2 xi2-xtb2 (xi2-xtb2)2 20,01 20,05 18,65 19,25 19,40 19,99 19,65 0,45 0,85 1,00 0,40 0,25 0,24 0,202 0,722 1,000 0,160 0,062 0,116 2,262 18,89 19,20 19,00 19,70 19,40 19,24 0,35 0,04 0,24 0,46 0,16 0,122 0,002 0,058 0,212 0,026 0,420 Do đó, ta có F = 4/420,0 5/262,2 = 4,31 Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 34 Xem trong bảng, giá trị F t-ơng ứng lớn hơn. Do đó, có thể so sánh hai ph-ơng pháp này với nhau. Lúc này, ta tính sp Sp = 211 420,0262,2   = 0,546 Do đó, ta tính đ-ợc t là: t = 56 56 546,0 24,1965,19   = 1,23 Giá trị này nhỏ hơn giá trị trong bảng ứng với độ tin cậy 95%, do đó không có sự khác nhau đáng kể nào giữa hai ph-ơng pháp. 3.3.2. So sánh độ sai biệt: Vì Ph-ơng sai đặc tr-ng cho độ sai biệt, nên so sánh độ sai biệt , chính là so sánh ph-ơng sai. Ng-ời ta sử dụng chuẩn Fisher để so sánh: Chuẩn Fisher: 2 2 2 1 21 S S )f,f,p(F  )SS( 22 2 1  3.21 Khi đó: Giả thiết H0: S12 = S22 đ-ợc chấp nhận khi và chỉ khi F không đáng tin cậy. ( Ftính < Fbảng ( p,f1,f2 ) ). Giả thiết Ha: S1 2S22 đ-ợc chấp nhận khi và chỉ khi F đáng tin cậy . ( Ftính > Fbảng ( p,f1,f2 ) ). Vì : S S 1 2 2 2 > 1 nên : S1 2 > S2 2 Việc so sánh Ftính và Fbảng luôn phụ thuộc vào độ tin cậy thống kê cho tr-ớc. Ví dụ 3.5 : Hai nghiên cứu A và B thu đ-ợc kết quả nh- sau : 1 2 3 4 5 6 7 8 A 4,40 4,56 4,42 4,59 4,55 4,45 4,55 4,39 B 4,42 4,47 4,70 4,72 4,53 4,55 4,60 4,64 9 10 11 12 13 14 15 16 A 4,75 4,72 4,53 4,66 4,90 4,50 4,45 4,66 B 4,29 4,52 4,57 4,56 4,66 - - - 17 18 19 20 A 4,80 4,36 4,75 4,22 B - - - - a/ Tính các đại l-ợng đặc tr-ng của tập hai kết quả nghiên cứu trên. b/ So sánh giá trị trung bình và giá trị ph-ơng sai của 2 nghiên cứu A và B. Giải :   75,4x20 1 x inA và 0295,0S 2 A  H0 2 B 2 A SS  Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 35   56,4x13 1 x jinB và 0139,0S 2 B  Ha 2 B 2 A SS  54,2F12,2 0139,0 0259,0 S S F )12,19,95(b2 B 2 A  Kết luận : chấp nhận H0, bác bỏ Ha Ví dụ 3.6: Ta xây dựng một ph-ơng pháp sắc ký xác định l-ợng đ-ờng trong huyết thanh. Sử dụng chuẩn F để so sánh kết quả. Cho biết có sự khác nhau đáng kể nào giữa hai ph-ơng pháp không? Ph-ơng pháp của ta Ph-ơng pháp Folin-Wu mg/ml mg/ml 127 130 125 128 123 131 130 129 131 127 126 125 129 Trung bình 127 Trung bình 128 S2 8,3 S2 4,8 Do đó , F = 1,73. Từ bảng ta có Fb = 4,95. Từ đó suy ra không có sự khác biệt đáng kể nào giữa hai ph-ơng pháp. 3..3.3.Bài toán so sánh 2 tỷ số : - Để so sánh 2 tỷ số : A A A N Xp  và B B B N X p  , ta dùng chuẩn t : ttính = BA BA N pq N pq pp   Trong đó : BA BA NN XX p   và p1q  3.22 - Có hai điều kiện để áp dụng công thức trên : 1/ Mẫu phải đủ lớn, ít nhất phải có : NA p , NB p  5 và NA q , NB q  5 2/ p và q phải gần 0,5 , nghĩa là xa 1 và 0 , cụ thể ta phải có : p > 0,1 và q 0,1 - Bài toán khi đó với giả thiết thống kê và kết luận thông kê nh- sau: * Giả thiết thống kê : H0 pA pB ; Ha pA  pB Lê Đức Ngọc – Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001 36 * Kết luận thống kê : t< 1,96 : chấp nhận H0, bác bỏ Ha (= 0,05 ) t> 1,96 : chấp nhận Ha, bác bỏ H0 (= 0,05 ) Ví dụ 3.7: Tiến hành hai lô nghiên cứu, Lô 1 có 300 X1 trong đó có 250 Y1, lô 2 có 400 X2 trong đó có 240 Y2. Với = 0,05 hãy đánh giá xem tỷ lệ của hai lô có giống nhau hay khác nhau? Giải: -Tính tỷ lệ : 833,0 300 250p1  và 6,0400 240p 2  -áp dung công thức 7,0 400300 240250p    và q =1-0,7=0,3 - tính ttinh : t tính= 96,1)6982700f;95,0(t65,6 400 3,07,0 300 3,07,0 6,0833,0    Kết luận : Tỷ lệ của hai lô là khác nhau đáng tin cậy ở ng-ỡng 95%.

Các file đính kèm theo tài liệu này:

c3_5418.pdf