Bài giảng Nhập môn lý thuyết xác xuất và thống kê toán - Võ Tuấn Thanh

13. Đợt kiểm tra sức khỏe của trẻ em ở các nhà trẻ, người ta khám ngẫu nhiên 100 cháu thấy có 20 cháu có triệu chứng còi xương do suy dinh dưỡng. Gọi p là xác suất để một trẻ em là còi xương do thiếu dinh dưỡng ở vùng đang khảo sát. Hãy kiểm định giả thiết H0: p = 0,15 với K : p ≠ 0,15 ở mức α = 5%. 14. Tỷ lệ phế phẩm trong một lô sản phẩm là 0,02. Người ta kiểm tra ngẫu nhiên 480 sản phẩm từ một lô hàng thấy có 12 phế phẩm. Hỏi tỉ lệ phế phẩm công bố trên có đúng không ? Cho mức kiểm định α = 0,05. 15. Điều trị bệnh nhân bằng loại thuốc A tỷ lệ khỏi bệnh là 0,8. Áp dụng phương pháp điều trị mới bằng cách dùng thuốc B trên 800 bệnh nhân thấy có 660 người khỏi bệnh. Hỏi hiệu quả tác dụng của thuốc B có giống thuốc A không ? Cho mức kiểm định α = 5%. 16. Áp dụng hai phương pháp gieo hạt. Theo phương pháp A gieo 180 hạt có 150 hạt nảy mầm. Theo phương pháp B gieo 256 hạt có 160 hạt nảy mầm. Hãy so sánh hiệu quả của hai phương pháp ở mức α = 0,05.

pdf57 trang | Chia sẻ: HoaNT3298 | Lượt xem: 1921 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Nhập môn lý thuyết xác xuất và thống kê toán - Võ Tuấn Thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
< b}) = F(b) - F(a) . 25 2.4. Biến ngẫu nhiên nhị thức Định nghĩa: Xét dãy n phép tử Bernoulle với xác suất thành công của biến cố A là P(A) = p. Gọi X là số lần xuất hiện biến cố A trong n phép thử trên, phân phối của X được gọi phân phối nhị thức và ký hiệu X  B(n,p), ta có : P{(X = m)} = m nc p m(1 - p)n-m , (m = 0, 1, 2, ..., n) Hàm phân phối của X là : F(X) = k m k x C   pk(1 - p)n-k , x  R . Ví dụ: Một xạ thủ bắn 3 viên đạn độc lập vào một mục tiêu trong cùng một điều kiện xác định. Xác suất để mỗi viên đạn trúng mục tiêu là 0,4. Gọi X là số viên đạn trúng mục tiêu. Lập bảng phân phối của đại lượng ngẫu nhiên X. Giải. Đại lượng ngẫu nhiên X có thể nhận một và chỉ một trong các giá trị 0, 1, 2, 3 với xác suất P{(X = k)} = 3 kc (0,4)k(1 - 0,4)3-k , k = 0, 1 , 2 , 3. Cụ thể là : P({X=0}) = 0,216 ; P({X=1}) = 0,432 ; P({X=2}) = 0,288 ; P({X=3}) = 0,064 . Do đó bảng phân phối của X là : X 0 1 2 3 P 0.216 0,432 0,288 0,064 2.5.Biến ngẫu nhiên liên tục Nếu tập các giá trị mà biến ngẫu nhiên nhận lấp đầy một khoảng nào đó, các biến ngẫu nhiên này gọi là biến ngẫu nhiên liên tục. Để mô tả (hoặc xác định) biến ngẫu nhiên liên tục ta dùng khái niệm hàm mật độ. Hàm p(x) được gọi là hàm mật độ của biến ngẫu nhiên nào đó nếu nó thoả mãn hai kiện kiện sau : 1. p(x)  0 , x  (- , +) 2. ( )p x dx    = 1 Trong trường hợp này, xác suất để X (x0 , x1) được tính như sau : P(x0 < X < x1) = 1 0 ( ) x x p x dx . Hàm phân phối của biến ngẫu nhiên X là F(x) = P(X < x) = 1 ( ) x p x dx   Như vậy F’(x) = p(x). 26 Chú ý: Tích phân với các cận -, + được xác định như sau : ( )p x dx    = ( ) a p x dx   + ( ) a p x dx   , aR ( ) a p x dx   = ( )lim a b b p x dx   , ( ) a p x dx   = ( )lim b b a p x dx   . Ví dụ 1: p(x) = 0 , , 1 , x a x b a x b b a        p(x) là hàm mật độ của biến ngẫu nhiên nhận mọi giá trị trên [a, b] với khả năng đều như nhau, gọi tắt là mật độ đều trên [a, b]. Ví dụ 2: p(x) = 2 2 1 ( ) 2 1 2 x e       p(x) là hàm mật độ của biến ngẫu nhiên nhận giá trị trên toàn trục số. Hàm mật độ này gọi là hàm mật độ của biến ngẫu nhiên có phân phối chuẩn dạng N(,2). Ví dụ 3: Cho hàm p(x) = a sin2x . Xác định hằng số a để p(x) trở thành hàm mật độ của biến ngẫu nhiên nhận giá trị tập trung trong đoạn [0, 2  ] . Ta có p(x) = 0 , 0 2 2 , 0 2 x x asin x x            Trong [0, 2  ] thì sin2x  0 nên a  0 Ta có : 0 02 2 0 0 2 2 ( ) ( ) ( ) ( ) 0 sin(2 ) 0p x dx p x dx p x dx p x dx dx a x dx dx                       = a 2 0 sin(2 )x dx   = - 2 0 cos 2 2 a x  2 a   (-2) = a = 1 . Vậy a = 1 và p(x) = sin(2x) là hàm mật độ của biến ngẫu nhiên nhận giá trị tập trung trong [0, 2  ]. * Tính chất của biến ngẫu nhiên liên tục: Ngoài những tính chất đã được nêu ở mục 2.3.2, biến ngẫu nhiên liên tục còn có những tính chất sau - Nếu hàm mật độ liên tục tại x thì tại đó ta có F'(x) = p(x). - Nếu hàm phân phối của biến ngẫu nhiên  liên tục tại x0 thì P({= x0}) = 0. 27 2.6. Phân phối tiệm cận chuẩn Trong ví dụ 2 của mục 2.5 ta đã biết biến ngẫu nhiên X có phân phối chuẩn dạng N(,2) thì hàm mật độ có dạng p(x) = 2 2 1 ( ) 2 1 2 x e       . Khi  = 0,  = 1 phân phối của X có dạng N(0; 1) với hàm mật độ kí hiệu là (x), xác định như sau: (x) = 21 2 1 2 x e   Trong trường hợp này ta nói X có phân phối tiệm cận chuẩn hay phân phối dạng chuẩn tắc, hàm phân phối của X kí hiệu là (x), được các định như sau: (x) = 21 2 1 2 x t e dt     . Khi đó P(X < x) = (x) = 21 2 1 2 x t e dt     . Giá trị của hàm (x) được tra trong bảng phục lục của các giáo trình xác suất thống kê. 2.7. Kì vọng và phương sai 2.7.1. Kỳ vọng (giá trị trung bình) 2.7.1.1.Định nghĩa: Kỳ vọng của biến ngẫu nhiên  là một con số được ký hiệu là E và được xác định như sau: - Nếu  là biến ngẫu nhiên rời rạc, có phân phối  x1 x2 x3 . . . xn . . . pi p1 p2 p3 . . . pn . . . thì E = i i i x p . - Nếu  là biến ngẫu nhiên liên tục có hàm mật độ p(x) thì E = ( )xp x dx    Ví dụ : 1. Với bảng phân bố Khi đó EX = (-1).1/4 + 1.3/4 = 1/2 2. Biến ngẫu nhiên X có phân phối chuẩn dạng N(,2) kì vọng được xác định như sau: EX = 2 2 1 ( ) 2 1 2 x x e dx         = . X -1 1 P ¼ ¾ 28 Ý nghĩa: Kỳ vọng của biến ngẫu nhiên là giá trị trung bình mà biến ngẫu nhiên nhận, hoặc kỳ vọng của biến ngẫu nhiên là trọng tâm của phân phối xác suất với khối lượng 1. Chính vì vậy mà người ta luôn dùng kỳ vọng để xác định vị trí của phân bố. 2.7.1.2.Tính chất: a. EC = C ( C là hằng số) b. ECX = CEX c. E(X  Y) = EX  EY d. Nếu X, Y độc lập E(XY) = EX.EY e. Ef(X) = ( )i i i f x p , nếu P(X = xi) = pi Ef(X) = ( ) ( )f x p x dx    , nếu X có mật độ p(x) 2.7.2. Phương sai 2.7.2.1.Định nghĩa 1: Ta gọi E(X - EX)2 là phương sai của biến ngẫu nhiên X, kí hiệu là DX và được xác định DX = E(X - EX)2 Từ định nghĩa ta thấy: - Nếu X là biến ngẫu nhiên rời rạc thì: DX = 2( EX)i i i x p . - Nếu X là biến ngẫu nhiên liên tục có hàm mật độ p(x) thì : DX = 2(x ) ( )EX p x dx    . - Phương sai DX có thể xác định theo công thức khác như sau DX = EX2 – (EX)2 Ví dụ: 1. Với bảng phân phối xác suất ở ví dụ 1 của mục 2.6.1, phương sai của biến ngẫu nhiên X được xác định như sau : EX2 = 1.(1/4) + 1.(3/4) = 1 DX = EX2 – (EX)2 = 1 – 2 1 2       = 3 4 2. Biến ngẫu nhiên X có phân phối chuẩn dạng N(,2) phương sai là DX = 2 2 1 ( ) 2 2 1 ( ) 2 x x e dx          =  2 2.7.2.2.Định nghĩa 2: Độ lệch chuẩn của biến ngẫu nhiên X (độ lệch bình phương trung bình) kí hiệu X là căn bậc hai số học của phương sai X -1 1 X2 1 1 P ¼ ¾ 29 X = DX . Ý nghĩa của phương sai: Phương sai của biến ngẫu nhiên là một số không âm dùng để đo mức độ phân tán (mức độ tản mát) của các giá trị của biến ngẫu nhiên X xung quanh tâm (kỳ vọng) EX của nó. DX nhỏ thì mức độ phân tán nhỏ, độ tập trung lớn. DX càng lớn thì độ phân tán càng cao. EX : Tâm của phân phối X - EX : Khoảng cách từ giá trị của biến ngẫu nhiên X đến tâm (X - EX)2 : Bình phương khoảng cách trên E(X - EX)2 : Trung bình của bình phương khoảng cách trên. 2.7.2.3.Tính chất của phương sai: a. Dc = 0 , ( c = const ) b. DcX = c2DX c. Nếu X và Y là hai biến ngẫu nhiên độc lập thì D(X  Y) = DX  DY. BÀI TẬP CHƯƠNG 2 1. Gọi X là số chấm xuất hiện ở mặt trên của con xúc xắc khi gieo 1 lần con xúc xắc cân đối và đồng chất. a. Tìm phân phối xác suất của X. Viết hàm phân phối F(x); b. Tính kì vọng EX và phương sai DX; c. Tính xác suất P[1 ≤ X < 3]. 2. Kí hiệu X là biến ngẫu nhiên chỉ số học sinh thuộc bài khi kiểm tra hai em học sinh. Biết rằng xác suất để mỗi học sinh thuộc bài là p = 1 2 a. Tìm phân phối xác suất của X, hàm phân phối của X; b. Tính kì vọng EX và phương sai DX; c. Tính xác suất P[0 ≤ X < 1]. 3. Một đợt xổ số phát hành 10.000 vé, trong đó có 100 vé trúng thưởng. Một người mua ngẫu nhiên 3 vé. Gọi X la biến ngẫu nhiên chỉ số vé trúng thưởng trong 3 vé. Tìm phân xác suất của X. Tính kì vọng của X. 30 4. Cho phân phối xác suất của biến ngẫu nhiên X là: X -2 0 2 P 1 4 1 2 1 4 a. Tìm hàm phân phối F(x) ; Tính xác suất P[-1 ≤ X < 1]; b. Tính E(X), E(X3), DX. 5. Bắn không hạn chế vào một mục tiêu cho tới khi nào trúng đích thì dừng lại. Gọi X là số viên đạn đã bắn. a. Tìm phân phối xác suất của X. Viết hàm phân phối; b. Tính kì vọng và phương sai của X. Biết rằng xác suất bắn trúng đích của mỗi viên đạn là p = 0,4. 6. Gieo hai con xúc xắc: Một con màu xanh, một con màu đỏ. Gọi X là số chấm xuất hiện ở mặt trên con xúc xắc màu xanh, Y là số chấm xuất hiện ở mặt trên con xúc xắc màu đỏ a. Tìm phân phối xác suất của X, của Y; b. Tính xác suất P[X + Y = 3]. Tính kí vọng E(X+Y). 7. Giáo viên của một trường tiểu học có 15% nam. Gặp ngẫu nhiên 6 giáo viên của trường. Gọi X là số giáo viên nam giới trong 6 giáo viên trên. a. Tính xác suất để trong 6 giáo viên được gặp có đúng 2 giáo viên nam. b. Tính kì vọng và phương sai của X. 8. Gieo liên tiếp 10 lần độc lập một con xúc xắc cân đối và đồng chất. Gọi X là số lần xuất hiện mặt trên có 3 chấm. Lập phân phối xác suất của X. Tính kì vọng của X. 9. Gieo 100 hạt đậu tương. Xác suất nảy mầm của mỗi hạt là 0,9. Gọi X là số hạt nảy mầm trong 100 hạt. Tìm phân phối xác suất của X; Tính kì vọng và phương sai của X. 10. Một đấu thủ tham gia trò chơi theo qui tắc: “Muốn được tham gia trò chơi phải nộp x đồng. Khi chơi, gieo 3 con xúc xắc, nếu cả ba mặt trên đều có 6 chấm thì thu vê 3.600.000 đồng, nếu có 2 con xúc xắc có 6 chấm thì thu về 280.000 đồng, nếu chỉ có một con xúc xắc ở mặt trên 6 chấm thì thu về 40.000 đồng, nếu không có mặt nào 6 chấm thì mất x đồng đã nộp”. Tìm x sao cho trò chơi vô thưởng vô phạt, tức là trung bình tiền thu được bằng không. 11. Gọi X là biến ngẫu nhiên chỉ số kiểu gen aa thấy được trong 40 cá thể sinh ra từ giao 2 dị hợp tử Aa (ta nhắc lại rằng trong sự giao đó, xác suất để được một cá thể có kiểu gen aa bằng 1 4 ). Tìm phân phối xác suất của X và tính xác suất P[X ≤ 6]. 12. Cho hàm phân phối của biến ngẫu nhiên X là: 31 F(x) = 0 , 0 1 , 0 4 4 1 , 4 x x x        a. Tìm hàm mật độ của biến X; b. Tính kì vọng và phương sai của X; c. Tính xác suất P[-1 ≤ X < 2]. 13. Cho hàm phân phối của biến ngẫu nhiên X là: F(x) = 1 , 0, 0 1 , 0 xe x x        a. Tìm hàm mật độ của X; b. Tính kì vọng và phương sai của X. 14. Giả sử hàm mật độ của biến ngẫu nhiên X là: f(x) = 0 , (0 , ) sin , (0 , ) x A x x      a. Tìm A; b. Tìm hàm phân phối F(x); c. Tính kì vọng và phương sai của X. 32 Chương 3. THỐNG KÊ TOÁN HỌC A. MỤC TIÊU KIẾN THÚC: Người học sau khi học xong chủ đề này sẽ nắm được những kiến thức về: - Các khái niệm cơ bản của thống kê toán. - Các giá trị đặc trưng của mẫu quan sát: phương sai, độ lệch chuẩn, trung vị. - Ước lượng điểm và ước lượng khoảng. - Kiểm định giả thiết thống kê. - Nội dung dạy các yếu tố thống kê trong môn toán ở trường tiểu học. KĨ NĂNG: Người học từng bước hình thành và rèn luyện các kĩ năng về: - Lập biểu đồ tần suất. - Tính các đặc trưng mẫu. - Ước lượng tham số. - Kiểm định giả thiết thống kê. - Giải toán thống kê ở tiểu học. THÁI ĐỘ: - Chủ động tìm tòi ứng dụng của thống kê để xử lí các bài toán thống kê thường gặp trong thực tế và trong nghiên cứu khoa học giáo dục. - Phát hiện cơ sở toán học của mạch yếu tố thống kê trong môn Toán ở Tiểu học. B. NỘI DUNG 3.1.Mẫu quan sát (mẫu ngẫu nhiên) Giả sử ta cần nghiên cứu một đặc tính nào đó ở các phần tử của một tập hợp các đối tượng cùng loại. Trên thực tế tập hợp này có số lượng rất lớn (người ta thường gọi là tập tổng quát hay đám đông) hoặc vì một khó khăn nào đó ta không thể nghiên cứu tất cả các phần tử của tập hợp đó, nhưng lại muốn có một kết luận chung về đặc tính phải nghiên cứu đối với tập hợp này. Để giải quyết bài toán nảy phải chọn ra một bộ phận gồm các phần tử đại diện của tập hợp đó và gọi là tập mẫu. Định nghĩa: Tập mẫu, hay gọi tắt là mẫu, là tập những đối tượng được chọn theo một phân phối xác suất nào đó. Nếu tập mẫu gồm n phần từ thì n gọi là kích thước của mẫu. Người ta thường kí hiệu mẫu ngẫu nhiên dưới dạng (X1, X2, , Xn). Các Xi là những phần tử của mẫu, đôi khi còn gọi là các quan sát. Ví dụ: 1) Phòng GD-ĐT về thanh tra đột xuất về chất lượng dạy và học ở một trường Tiểu học nào đó, vì điều kiện thời gian không cho phép đoàn thanh tra thực hiện kiểm tra, đánh giá trên tất cả các học sinh, nên chỉ chọn ngẫu nhiên mỗi 33 khối lớp 10 học sinh để kiểm tra và đánh giá chất lượng dạy và học. Mỗi tập 10 học sinh đã chọn ở từng khối lớp là các mẫu ngẫu nhiên. 2) Để đánh giá tuổi thọ của một loại bóng đèn điện, người ta không thể “quan sát” mọi bóng đèn loại đó vì số lượng quá nhiều. Vì vậy người ta đã chọn ra một số bóng đèn một cách ngẫu nhiên và cho chiếu sáng rồi quan sát ta thu được dãy số liệu (X1, X2, , Xn) tương ứng với dãy tuổi thọ của các bóng đèn được lấy ra. 3.2.Các đặc trưng mẫu 3.2.1.Trung bình mẫu Cho mẫu quan sát (X1, X2, , Xn). Trung bình mẫu này là một số, kí hiệu X , được xác định như sau : 1 2 ... nX X XX n     Nếu mẫu quan sát được thu gọn dưới dạng : X x1 x2 ... xn Tần số ni n1 n2 ... ni Thì trung bình mẫu được tính như sau : 1 1 2 2 1 1 2 ... ... k i i k k i k n x n x n x n x X n n n n         3.2.2. Trung vị Định nghĩa : Trung vị mẫu (X1, X2, , Xn) kí hiệu m hoặc Xme, là một số mà các giá trị của mẫu ≥ m bằng số các giá trị của mẫu ≤ m. Nghĩa là m thỏa mãn Card{k ≤ n/Xk ≤ m} = Card{ k ≤ n/Xk ≥ m} Theo định nghĩa trên, để tính trung vị của mẫu, ta sắp xếp lại mẫu theo thứ tự tăng dần * * * 1 2 ... nX X X   thì m = * 1 2 nX  nếu n lẻ và m= * * 1 2 2 2 n nX X   nếu n chẳn . 3.2.3. Mode Định nghĩa : Mode là một giá trị của mẫu có tần số lớn nhất 3.2.4. Phương sai mẫu - Phương sai của mẫu (X1, X2, , Xn) là một số được kí hiệu là S2(X) hay 2 ( )nS X và xác định như sau : 34 2 12 2 2 2 2 1 1 1 1 1 1 ( ) ( ) ( ) n in n n i n i i i i i i X S X X X X X X n n n n                              - Một phương sai khác kí hiệu là *2( )nS X hay *2( )S X hay '2 ( )S X gọi là phương sai điều chỉnh (hay phương sai có điều chỉnh) được xác định như sau : *2 2 1 1 ( ) ( ) 1 n n i i S X X X n      Ta thấy *2 2( ) ( ) 1 n n n S X S X n   Giá trị s = *2ns gọi là độ lệch chuẩn của mẫu Nếu mẫu quan sát cho dưới dạng : X x1 x2 ... xk Tần số ni n1 n2 ... nk Thì phương sai mẫu có thể được tính theo công thức : 2 2 1 1 ( ) ( ) k i i i n k i i n x X S X n       hoặc 2 2 2 1 1 1 ( ) ( ) k n i ik i i i S X n x X n      Ví dụ: Khi lấy ngẫu nhiên 20 học sinh của một trường tiểu học, cho kiểm tra môn Toán điểm của các học sinh lần lượt như sau : 5 6 7 5 8 9 7 6 4 4 5 4 6 6 7 5 9 8 6 9 Ta sắp xếp số liệu của mẫu theo các giá trị khác nhau như sau: Trung bình mẫu: 3.4 4.5 5.6 3.7 2.8 3.9 126 6,3 20 20 X         Trung vị mẫu là: m = 6. Mode của mẫu là: mode = 6 Các giá trị khác nhau của X 4 5 6 7 8 9 Tần số (số em đạt được): ni 3 4 5 3 2 3 35 Phương sai: 2 2 2 2 2 2 21( ) 3(4 6,3) 4(5 6,3) 5(6 6,3) 3(7 6,3) 2(8 6,3) 3(9 6,3) 20 nS X               = 2,62 Chú ý: Ta có thể thu gọn số liệu để giảm bớt sự tính toán với những con số quá lớn như sau: Tính ui = 0i x x h  , i = 1, 2, ... , Chọn x0 là giá trị xi ở quảng giữa của dãy số liệu, h là độ dài khoảng cách đều giữa các xi 1 2 ... ku u uu n     ; 2 2 2 1 1 (u) ( ) k n i i i S n u u n    Trở lại số liệu ban đầu ta có : 2 2 20 . ; S ( ) . ( )n nX x h u X h S u   3.2.5. Hệ số tương quan mẫu Cho mẫu quan sát (X1,Y1) ; (X2,Y2) ; ... ; (Xn,Yn). Số r được xác định như sau : 1 1 ( )( ) = ( ). ( ) n i i i n n X X Y Y n r S X S Y    Gọi là hệ số tương quan mẫu. Khai triển cụ thể ta có 1 1 2 2 2 2 1 1 1 1 ( )( ) r = ( ) ( ) n n n i i i i i i i i n n n n i i i i i i i i n X Y X Y n X X n Y Y                             Ví dụ: Cho mẫu quan sát của cặp biến ngẫu nhiên (X, Y) như sau : X 0 1 1 3 3 4 Y 3 3 4 4 5 5 Tính 2 2 , , ( ) , ( ) , n nX Y S X S Y r Ta lập bảng sau: Xi Yi Xi.Yi 2 iX 2 iY 0 1 1 3 3 4 3 3 4 4 5 5 0 3 4 12 15 20 0 1 1 9 9 16 9 9 16 16 25 25 12iX  24iY  54i iX Y  2 36iX  2 100iY  36 12 24 2 ; Y 4. 6 6 X     2 6 2 12 2 6 1 ) 1 1 12 ( ) 36 2 6 6 6 6 in i i i X S X X                               2 2 6 1 24 2 ( ) 100 6 6 3 S Y            1 1 2 2 2 2 1 1 1 1 ( )( ) r = ( ) ( ) n n n i i i i i i i i n n n n i i i i i i i i n X Y X Y n X X n Y Y                             = 2 2 6.54 12.24 6.36 12 6.100 24          3.3.Ước lượng tham số 3.3.1. Ước lượng điểm Giả sử θ là tham số cần ước lượng. Chúng ta chỉ có một mẫu ngẫu nhiên (X1, X2, , Xn). Để ước lượng θ không thể dựa vào mẫu ngẫu nhiên. Ta dùng một hàm nào đó của mẫu, tức là một hàm nào đó của các biến X1, X2, , Xn để làm ước lượng cho θ. Kí hiệu hàm đó là Tn = φ(X1, X2, , Xn) chỉ phụ thuộc vào quan sát (X1, X2, , Xn) mà không phụ thuộc θ. Định nghĩa 1: Ước lượng Tn của tham số θ được gọi là ước lượng không chệch nếu E(Tn) = θ. Ví dụ: Cho mẫu ngẫu nhiên (X1, X2, , Xn) rút từ biến ngẫu nhiên X của phân phối chuẩn dạng tổng quát N(a; σ2). Khi đó 1 2 ... nX X XX n     là ước lượng không chệch của a . Vì: 1 1 ( ) ( ) n i i na E X E X a n n    . *2 2 1 1 S ( ) 1 n i i X X n      là ước lượng không chệch của σ2 . Định nghĩa 2: Ước lượng nT của tham số θ được gọi là ước lượng không chệch tốt nhất nếu i, n( T )E = θ ii, ( ) D ( )n nD T T . 37 Trong đó Tn là ước lượng không chệch bất kì của θ. Dθ là kí hiệu của phương sai với điều kiện phân phối có chứa tham số θ. Định nghĩa 3: Ước lượng cho xác suất p của biến cố A nào đó (hay ước lượng cho tỉ lệ nào đó) là p* = m n trong đó n là số lần quan sát, m là số lần suất hiện biến cố A. Đây cũng là ước lượng không chệch cho xác suất p. Ví dụ: Tiến hành đo chiều cao của 100 em học sinh lớp 3 (8 tuổi) ở một trường tiểu học, ta có kết quả sau: Khoảng chiều cao (cm) Số em (mi) (110 - 112] (112 - 114] (114 - 116] (116 - 118] (118 - 120] (120 - 122] (122 - 124] (124 - 126] (126 - 128] 5 8 14 17 20 16 10 6 4  100 Gọi X là chiều cao của em học sinh (cm). Hãy chỉ ra ước lượng điểm cho EX, DX và tính p = P({116 < X <124}). Giải: Gọi xi là điểm đại diện cho mỗi khoảng, ta thu gọn số liệu với ui = 119 2 ix  Ta có bảng tính sau: 38 19 u 0,19 X 119 2u 118,62 100         2 2 n 2 2 2 n n 399 S (u) = ( 0,19) 3,9529 100 S (X) h .S (u) = 4.3,9539 = 15,8156     S ≈ 3,977 ; * 63 p 0,63 100   . Vậy: - Ước lượng điểm cho EX là 118,62 - Ước lượng điểm cho DX là 15,8156 - Ước lượng điểm cho p là 0,63 . 3.3.2. Ước lượng khoảng Cho mẫu quan sát (X1, X2, , Xn) từ phân phối f(x,θ), θ là tham số. Định nghĩa 1: Gọi khoảng ước lượng của tham số θ với độ tin cậy 1 - α là khoảng ( 1 2;  ) sao cho P[ 1 2    ] = 1 - α . 3.3.2.1.Khoảng ước lượng của kì vọng a trong phân phối chuẩn. Cho mẫu quan sát (X1, X2, ..., Xn) rút từ biến ngẫu nhiên X có phân phối chuẩn dạng tổng quát N(a;σ2). Khoảng ước lượng của kì vọng a với độ tin cậy 1 - α được tính theo một trong các công thức sau: + Trường σ đã biết: khoảng ước lượng được xác định theo công thức ; X x X x n n           (1) trong đó xα được tra từ bảng phân phối chuẩn N(0; 1) sao cho ( ) 1 2 x     + Trường σ chưa biết: Khoảng ước lượng được xác định theo công thức Khoảng chiều Cao ( X ) mi xi ui miui miui2 (110 - 112] (112 - 114] (114 - 116] (116 - 118] (118 - 120] (120 - 122] (122 - 124] (124 - 126] (126 - 128] 5 8 14 17 20 16 10 6 4 111 113 115 117 119 121 123 125 127 -4 -3 -2 -1 0 1 2 3 4 -20 -24 -28 -17 0 16 20 18 16 80 72 56 17 0 16 40 54 64 Σ 100 -19 399 39 * * ; S S X t X t n n          (2) trong đó * *2 2 2 2 1 1 1 1 ( ) ( ) 1 1 1 n k X i i i X i i n S S X X n x X S n n n             - Nếu n ≥ 30 thì tα tra như xα tra trong bảng phân phối chuẩn N(0;1) sao cho ( ) 1 2 t     . - Nếu n < 30 tα tra trong bảng phân phối Studen với n - 1 bậc tự do và mức ý nghĩa là α (bảng 2 phía) Ví dụ 1: Tìm khoảng ước lượng của kì vọng a với độ tin cậy 0,95 của biến ngẫu nhiên X có phân phối chuẩn, nếu độ lệch tiêu chuẩn của X là σ = 5 và trung bình mẫu X = 14 và kích thước mẫu là n = 25. Giải : Ở đây σ = 5 đã biết nên khoảng ước lượng được tính theo công thức : ; X x X x n n           1 - α = 0,95 suy ra α = 0,05 ; ( ) 1 2 x     = 0,975, tra bảng N(0, 1) ta có xα = 1,96 ; X = 14. Thế các giá trị vào công thức ta có khoảng ước lượng cần tìm là   5 5 14 1,96. ; 14 1,96. 12,04 ; 15,96 25 25         . Ví dụ 2: Tiến hành kiểm tra ngẫu nhiên 10 học sinh. Kết quả cho ở bảng sau (thang điểm 10) X : 5 4 3 5 6 7 6 2 8 5 Giả sử X có phân phối chuẩn dạng N(a, σ2). Tìm khoảng ước lượng của a với độ tin cậy 0,95. Giải Ta thấy σ chưa biết nên khoảng ước lượng được xác định theo công thức sau * * ; S S X t X t n n          ; với *2 2 2 2 2 2 2 2 2 5 4 3 5 6 7 6 2 8 5 5,1 10 1 [(5 - 5,1) (4 5,1) (3 5,1) 5 5,1) (6 5,1) (7 5,1) 9 (6 5,1) (2 5,1) (8 X X S                             2 25,1) (5 5,1) ]=3,21  * *2 3,21XS S   1,792 n = 25 < 30 nên tα tra trong bảng phân phối Studen tα = t(9; 0,05) = 2,26 40 thế các giá trị vào công thức ta có khoảng ước lượng cần tìm là 1,792 1,792 5,1 2,26. ; 5,1 2,26. (3,71 ; 6,39) 25 25         . 3.3.2.2.Khoảng ước lượng của tỉ lệ hay xác suất trong phân phối nhị thức Khoảng ước lượng của xác suất p với độ tin cậy 1 - α là: (1 ) (1 ) ; p p p p p x p x n n             (3) trong đó xα tra ở bảng phân phối N(0; 1) sao cho ( ) 1 2 x     , k p n  ; k là số lần xuất hiện biến cố A trong n phép thử. Ví dụ: Gieo 400 hạt đậu tương thấy có 5 hạt không nảy mầm. Hãy tìm khoảng ước lượng của xác suất không nảy mầm của mỗi hạt với độ tin cậy 0,999. Giải: Ta có 1 - α = 0,999. suy ra α = 0.001, do đó ( ) 1 2 x     = 0,9995 Tra bang N(0;1) ta có xα = 3,3 n = 400 ; k = 5 thay các giá trị vào công thức ta có khoảng ước lượng cần tìm là 5 5 5 5 (1 ) (1 ) 5 5400 400 400 4003,3 ; 3,3 400 400 400 400               Rút gọn ta có (-0,0058 ; 0,0308) vì xác suất không âm nên khoảng ước lượng cần xác định là (0 ; 0,0308) Ví dụ 2: Trong kho có 100 nghìn sản phẩm. Lấy ngẫu nhiên 1600 sản phẩm thấy có 320 phế phẩm. Hãy tìm khoảng ước lượng của số phế phẩm trong kho với độ tin cậy 99%. Giải: Ta có n = 1600, k = 320 nên tỉ lệ phế phẩm của mẫu là 320 0,2 1600 k p n    1 - α = 0,99 suy ra α = 0,01 do đó ( ) 1 2 x     = 0,995 tra bảng ta có xα = 2,58 Gọi p là tỉ lệ phế phẩm trong kho, khoảng ước lương của p theo công thức (3) là: 0,2(1 0,2) 0,2(1 0,2) 0,2 2,58 ; 0,2 2,58 1600 1600          Rút gọn ta có (0,1742 ; 0,2258) Như vậy 0,1742 < p < 0,2258 41 Gọi N là số phế phẩm có trong 100.000 sản phẩm, ta có 100.000 N p  suy ra 0,1742 < 100.000 N p  < 0,2258 Do đó 17420 < N < 22580 . Vậy với độ tin cậy 99% , số phế phẩm có trong kho khoảng từ 17420 đến 22580 sản phẩm. Ví dụ 3: Để nghiên cứu tuổi thọ của mỗi loại bóng đèn người ta lấy ra 100 bóng thắp thử và có số liệu : Tuổi thọ X (giờ) 1200 -1250 1250- 1300 1300 – 1350 1350- 1400 1400- 1450 1450– 1500 Số bóng (ni) 10 20 40 15 10 5 a) Hãy tìm khoảng ước lượng tuổi thọ trung bình của loại bóng đèn đó với độ tin cậy 95%. b) Người ta nói bóng đèn loại I là bóng đèn có tuổi thọ từ 1250 giờ trở lên. Hãy tìm khoảng ước lượng tỉ lệ bóng đèn loại I với độ tin cậy 90%. c) Có ý kiến cho rằng : tuổi thọ trung bình của loại bóng đèn đó là 1300 giờ, đồng thời cũng có ý kiến cho rằng tuổi thọ trung bình của loại bóng đèn đó lớn hơn 1300giờ. Với mức ý nghĩa là 0,05; hãy cho kết luận về các ý kiến trên. Biết rằng tuổi thọ trung bình của các bóng đèn có phân phối chuẩn. Giải: a) Ta lập bảng thống kê sau (lấy x0 = 1325 ; h = 50 ) Khoảng X xi ni ui = i 0 x x h  niui ni 2 iu 1200 – 1250 1250 - 1300 1300 - 1350 1350 - 1400 1400 - 1450 1450 - 1500 1225 1275 1325 1375 1425 1475 10 20 40 15 10 5 -2 -1 0 1 2 3 -20 -20 0 15 20 15 40 20 0 15 40 45 Σ 100 10 160 1 1 u 0,1in u n   ; 2 2 2 1 ( ) 1,59n i iS n u u n    . Trung bình mẫu: 0 . 1325 50.(0,1) 1330X X h u     . Phương sai mẫu: 2 2 2 2 * * 100 . 50 .1,59=3975 ; S . .3975 1 99 X u X n S h s S n      = 63,365. 42 Ta có σ chưa biết, n = 100 > 30 , khoảng ước lượng của khối lượng trung bình được xác định theo công thức (2): * * . , . S S X t X t n n          1- α = 0,99 → α = 0,01 ; tα = xα ( ) 1 2 x     = 0,975, tra bảng ta được xα = 1,96. thế các giá trị vào công thức ta có 63,365 63,365 1330 1,96. ; 1330 1,96. 100 100        Rút gọn ta được khoảng ước lượng của tuổi thọ trung bình của bóng đèn là (1317,58 ; 1342,42) b) Khoảng ước lượng tỉ lệ loại bóng đèn loại I, độ tin cậy 0,9 được xác định theo công thức : (1 ) (1 ) ; p p p p p x p x n n             90 0,9 100 p   ; 1 - α = 0,9 suy ra α = 0,1 tra bảng ta được xα = 1,65 ; n = 100 thế các giá trị vào công thức ta có 0,9(1 0,9) 0,9(1 0,9) 0,9 1,65. ; 0,9 1,65. 100 100          Rút gọn ta được khoảng ước lượng của tỉ lệ bóng đèn loại I do nhà máy sản xuất là (0,8505 ; 0,9495) . c) Giải ở cuối mục 3.3.4 3.4. Kiểm định giải thiết thống kê 3.4.1. Thiết lập bài toán Giả sử X là biến ngẫu nhiên có hàm phân phối F(x) - Những giả thiết về hàm phân phối F(x) được gọi là giả thiết thống kê và kí hiệu là H0 . - Những giả thiết cũng về hàm phân phối F(x) nhưng khác với giả thiết H0 được gọi là đối thiết, kí hiệu là K. Khi hàm phân phối F(x) = F(x,θ) phụ thuộc vào tham số θ thì giả thiết về hàm phân phối được chuyển sang giả thiết về tham số θ . Ví dụ : Đối với phân phối chuẩn N(a; σ2) ta có thể có các giả thiết sau + H0 : a = a0 với K : a ≠ a0 + H0 : a = 10 hoặc 15 < a < 20 với K : a < 10 hoặc 10 < a < 15. - Kiểm định giả thiết thống kê là việc chọn 1 trong 2 quyết định: chấp nhận H0 hoặc bác bỏ H0 trên cơ sở thực nghiệm, tức là mẫu ngẫu nhiên (X1, X2, ..., Xn) cho 43 phép ta chọn một trong hai quyết định đó. Muốn có quyết định trên ta phải tìm một tiêu chuẩn để kiểm định giả thiết H0 với đối thiết K . - Tiêu chuẩn để kiểm định giả thiết là một đại lượng ngẫu nhiên Z phụ thuộc vào mẫu (X1, X2, ..., Xn). Vận dụng các kết quả của lý thuyết xác suất ta tìm được tập S sao cho khi Z  S thì ta bác bỏ giả thiết H0; ngược lại Z  S thì ta chấp nhận H0. Tập S gọi là miền tiêu chuẩn 3.4.2. Kiểm định giả thiết về xác suất trong phân phối nhị thức Bài toán: Giả sử trong dãy n phép thử Bernoulli, biến cố A xuất hiện X lần. Gọi p là xác suất xuất hiện biến cố A trong mỗi phép thử. Hãy kiểm định giả thiết : H0 : p = p0 với K : p ≠ p0 ở mức α. Lời giải : Giả thiết H0 bị bác bỏ ở mức α nếu 0 0 0(1 ) X np Z np p    ≥ xα Nếu Z < xα thì chấp nhận H0; trong đó xα tra từ bảng phân phối chuẩn dạng N(0; 1) sao cho ( ) 1 2 x     . Ví dụ: Gieo 300 hạt đậu tương thấy có 261 hạt nảy mần. Người ta nói rằng tỉ lệ nảy mầm của đậu tương là 90%. Điều nhận định đó đúng không ? Cho mức ý nghĩa α = 5% . Giải: Gieo 300 hạt đậu tương như thực hiện 300 phép thử Bernoulli. Gọi p là xác suất nảy mầm. Ta đưa bài toán về dạng bài toán kiểm định sau : H0 : p = 0,9 với K : p ≠ 0,9 ở mức 0,05 Ta có n = 300 ; X = 261 ; p0 = 0,9 0 0 0 261 300.0,9 1,73 (1 ) 300.0,9(1 0,9) X np Z np p        . ( ) 1 2 x     = 1 - 0,025 , tra bảng ta được xα = 1,96 . Ta thấy Z < xα , ta chấp nhận H0 ; tức là với mức ý nghĩa 0,05 không đủ cơ sở để bác bỏ điều khẳng định đã nêu . * Tiêu chuẩn một phía: - Nếu xu thế thực nghiệm mà 0 X p n  thì ta có thể đưa bài toán về thành bài toán kiểm định giả thiết: H0 : p = p0 với K : p > p0 ở mức α Giả thiết H0 bị bác bỏ ở mức α nếu 0 0 0(1 ) X np Z np p    ≥ xα Nếu Z < xα thì chấp nhận H0 . Trong đó xα tra từ bảng phân phối chuẩn dạng N(0; 1) sao cho ( ) 1x    . 44 - Nếu xu thế thực nghiệm mà 0 X p n  thì ta đưa bài toán về thành bài toán kiểm định giả thiết: H0 : p = p0 với K : p < p0 ở mức α Giả thiết H0 bị bác bỏ ở mức α nếu 0 0 0(1 ) np X Z np p    ≥ xα Nếu Z < xα thì chấp nhận H0 . Trong đó xα tra từ bảng phân phối chuẩn dạng N(0; 1) sao cho ( ) 1x    . Ví dụ: như ví dụ trên ta thấy 261 0,87 300 X n   < 0,9 ta có thể đưa về bài toán kiểm định H0 : p = 0,9 với K : p < 0,9 ở mức 0,05 Ta có n = 300 ; X = 261 ; p0 = 0,9 0 0 0 300.0,9 261 1,73 (1 ) 300.0,9(1 0,9) np X Z np p        . ( ) 1x    = 1 - 0,05 = 0,95 , tra bảng ta được xα = 1,65 . Z > xα như vậy ta bác bỏ H0, tức là tỉ lệ nảy mầm của lô hạt giống cà phê trên nhỏ hơn 90% . 3.4.3. Kiểm định về kì vọng (giá trị trung bình) trong mẫu độc lập từ phân phối chuẩn Giả sử (X1, X2, ..., Xn) là mẫu ngẫu nhiên rút rừ biến ngẫu nhiên X có phân phối chuẩn dạng N(a; σ2). Từ mẫu đã cho bài toán yêu cầu kiểm định giả thiết H0 : a = a0 với K : a ≠ a0 ở mức α . 1. Trường hợp σ đã biết: H0 bị bác bỏ ở mức α nếu |Z| = 0X a n   ≥ xα . Nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối chuẩn sao cho ( ) 1 2 x     . 2. Trường hợp σ chưa biết: H0 bị bác bỏ ở mức α nếu |Z| = 0 * X X a n S  ≥ tα Nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau : - Nếu n ≥ 30 thì tα tra như xα tra trong bảng phân phối chuẩn sao cho ( ) 1 2 t     . 45 - Nếu n < 30 thì tα tra trong bảng phân phối Studen với n - 1 bậc tự do và mức ý nghĩa là α (tra trong bảng tiêu chuẩn 2 phía) Ví dụ 1: Giả sử mẫu ngẫu nhiên (X1, X2, , Xn) rút từ phân phối chuẩn dạng N(a; 4) và có X = 15; n= 100. Hãy kiểm định giả thiết H0 : a = 16,5 với K : a ≠ 16,5 ở mức α = 5% . Giải: α = 0,05 ; ta có ( ) 1 2 t     = 0,975, tra bảng phân phối chuẩn ta có xα = 1,96 0 15 16,5 100 2 X a n Z      = 7,5. Ta thấy |Z| > xα nên giả thiết H0 bị bác bỏ ở mức α = 5%, tức là a ≠ 16,5 . Ví dụ 2: Sau một đợt huấn luyện người ta kiểm tra ngẫu nhiên 15 học sinh với kết quả điểm X như sau : X : 2 3 7 6 9 7 6 6 1 2 7 8 6 5 6. Giả sử X tuân theo luật phân phối chuẩn N(a; σ2). Hãy kiểm định giả thiết H0 : a = 6 với K : a ≠ 6 ở mức α = 5% . Giải: Ta thấy σ chưa biết, n = 15 < 30 do đó tα = t(5%; 14) = 2,14; 81 5, 4 15 X   . *2 *5,5 nên 5,5 2,35X XS S  0 * 5,4 6 15 0,987 2,35X X a n Z S      . |Z| < tα nên chấp nhận H0, tức là với mức ý nghĩa 0,05 điểm trung bình của học sinh các học sinh sau đợt huấn luyện là 6. • Tiêu chuẩn một phía: - Nếu X > a0 thì đưa về kiểm định giả thiết : H0 : a = a0 với K : a > a0 Tiêu chuẩn kiểm định giả thiết này là : a. Trường hợp σ đã biết : H0 bị bác bỏ ở mức α nếu Z = 0 ( )X a n   ≥ xα Nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối chuẩn sao cho ( ) 1x    . b. Trường hợp σ chưa biết : H0 bị bác bỏ ở mức α nếu 46 Z = 0 * ( ) X X a n S  ≥ tα Nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau : + Khi n > 30 thì tα tra như xα trong bảng N(0;1) sao cho ( ) 1t    . + Khi n < 30 thì tα được tra trong bảng phân phối Studen với n - 1 bậc tự do và mức α . (Bảng tiêu chuẩn một phía). - Nếu X < a0 thì đưa về kiểm định giả thiết : H0 : a = a0 với K : a < a0 ở mức α . Tiêu chuẩn kiểm định giả thiết này là : a. Trường hợp σ đã biết : H0 bị bác bỏ ở mức α nếu Z = 0 ( )a X n   ≥ xα , nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối chuẩn sao cho ( ) 1x    . b. Trường hợp σ chưa biết : H0 bị bác bỏ ở mức α nếu Z = 0 * ( ) X a X n S  ≥ tα , nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau : + Khi n > 30 thì tα tra như xα trong bảng N(0;1) sao cho ( ) 1t    . + Khi n < 30 thì tα được tra trong bảng phân phối Studen với n - 1 bậc tự do và mức α . (Bảng tiêu chuẩn một phía). Ví dụ: Ta giải câu c trong ví dụ 3 của mục 3.3.2. Ta thấy 01330 1300X a   nên ta đưa về kiểm định bài toán H0 : a = 1300 với K : a > 1300 ở mức 0,05 Ta có Z = 0 * ( ) X X a n S  = (1330 1300) 100 63,365  = 4,734. ( ) 1t    = 0,95, tra bảng N(0; 1) ta có tα = 1,65 < Z Giả thiết H0 bị bác bỏ, chấp nhận K, tức với mức ý nghĩa 0,05 thì tuổi thọ bình của bóng đèn lớn hơn 1300 giờ. 3.4.4. So sánh hai giá trị trung bình Giả sử mẫu (X1, X2, ..., Xn1) được rút ra từ biến ngẫu nhiên X có phân phối là F1(x), mẫu ngẫu nhiên (Y1, Y2, ..., Yn2) được rút từ biến ngẫu nhiên Y có phân phối là F2(x). Ta xét xem, với mức ý nghĩa α nào đó, trung bình mẫu của hai phân phối trên có bằng nhau không ? Kí hiệu a1 = Ex , a2 = EY 47 2 1 = DX , 2 2 = DY Ta kiểm định các giả thiết H0 : a1 = a2 với K : a1 ≠ a2 (1) H0 : a1 = a2 với K : a1 > a2 (2) H0 : a1 = a2 với K : a1 < a2 (3) Trong các trường hợp sau: 1- Nếu 2 1 , 2 2 đã biết: Giả thiết H0 của (1) bị bác bỏ khi 2 2 1 2 1 2 X Y n n     ≥ xα , với xα được xác định thỏa điều kiệu ( ) 1 2 x     Giả thiết H0 của (2) bị bác bỏ khi 2 2 1 2 1 2 X Y n n     ≥ xα , với xα được xác định thỏa điều kiệu ( ) 1x    Giả thiết H0 của (3) bị bác bỏ khi 2 2 1 2 1 2 Y X n n     ≥ xα , với xα được xác định thỏa điều kiệu ( ) 1x    2- Nếu 2 1 , 2 2 chưa biết: Trong trường hợp này ta phải giả thiết X, Y đều có phân phối chuẩn X ≈ N(a1; 2 1 ) ; Y ≈ N(a2 ; 2 2 ) và 2 2 1 2  Ta tính t = 2 2 1 2 1 2 1 2 1 2 . 2 X Y X Y n S n S n n n n n n      Tra trong bảng phân phối Studen tìm 1 2 1 22 2 ; ( ) 2 n n n nt t            Ta kết luận các bài toán trên như sau: Giả thiết H0 của (1) bị bác bỏ khi 1 2 2 2 n nt t           . Giả thiết H0 của (2) bị bác bỏ khi 48   1 2 2n n t t   . Giả thiết H0 của (3) bị bác bỏ khi   1 2 2n n t t    . Ví dụ 1: Để so sánh trọng lượng con so và con rạ lúc mới đẻ người ta lấy số liệu từ các nhà hộ sinh nào đó, thống kê và sắp xếp số liệu, Ta có bảng sau : Khoảng trọng Lượng (gam) Điểm đại diện xi Số trẻ Con so (mi) Số trẻ Con rạ (m'i) mixi m'ixi 1700 – 1900 1900 - 2100 2100 - 2300 2300 - 2500 2500 - 2700 2700 - 2900 2900 - 3100 3100 - 3300 3300 - 3500 3500 - 3700 3700 - 3900 3900 - 4100 4100 - 4300 4300 – 4500 1800 2000 2200 2400 2600 2800 3000 3200 3400 3600 3800 4000 4200 4400 3 5 7 5 13 21 20 11 6 3 0 1 1 0 2 4 7 13 22 18 15 10 7 3 2 1 5400 10000 15400 12000 33800 58800 60000 35200 20400 10800 0 4000 1800 0 4400 9600 18200 36400 66000 57600 51000 36000 26600 12000 8400 4400 ∑ n1= 95 n2 = 105 265800 332400 Giả sử độ lệch bình phương trung bình đối với con so 2 1 =190000, đối với con rạ là 2 2 = 200704. Có ý kiến cho rằng trọng lượng trung bình của con so và con rạ bằng nhau. Hãy kiểm định giả thiết ở mức ý nghiã α = 0,05. Giải: Ở đây n1 = 95 , n2 = 105 Từ hai cột cuối ta có : 265800 2797,8947 2798 95 X    gam 332400 3165,7142 3166 105 Y    gam Ta kiểm định giả thiết H0 : a1 = a2 , K : a1 < a2 ở mức 0,05 Φ(xα) = 1 - α = 1 - 0,05 = 0,95 tra bảng N(0; 1) ta được xα = 1,65. 49 2 2 1 2 1 2 3166 2798 5,88 19000 200704 95 105 Y X n n        > xα Như vậy giả thiết H0 bị bác bỏ, chấp nhận K, tức là trọng lượng trung bình của con so nhỏ hơn con rạ . Ví dụ 2: Người ta thí nghiệm hai phương pháp chăn nuôi gà khác nhau, sau thời gian một tháng kết quả tăng trọng lượng như sau Phương pháp I : n1 = 100 con , 21,1 , 0,04XX kg S  Phương pháp II: n2 = 150 con , 21,2 , 0,098YY kg S  Với mức ý nghĩa α = 0,05 ta có thể kết luận phương pháp II hiệu quả hơn phương pháp I được không ? Giả thiết mức tăng trọng lượng của gà tuân theo luật chuẩn và 2 2 1 2  . Giải: Ta kiểm định giả thiết H0 : a1 = a2 , K : a1 < a2 Ta có 1,1 1,2 2,914 100 0,04 150 0,09 100 150 100 150 2 100 150 t            α = 0,05 tra bảng phân phối Studen ta có t100+150-2(0,05) = t248(0,05) = 1,645 Ta thấy t < - t248(0,05). Ta bác bỏ giả thiết a1 = a2, chấp nhận a2 > a1, tức là phương pháp II hiệu quả hơn phương pháp I Chú ý: Trong trường hợp σ1, σ2 chưa biết, thiết về tính chuẩn của hai mẫu và σ1 ≠σ2 không được nêu ra. Song nếu n1, n2 đủ lớn(n1 ≥ 30, n2 ≥ 30) thì mặc dù các giả thiết trên không được thỏa mãn ta cũng có thể xấp xỉ 2 1 bởi *2 XS , 2 2 bởi *2 YS trong các công thức của trường hợp 2 1 , 2 2 đã biết và kết luận các bài toán như trường hợp này. Ví dụ 3: Trong ví dụ 2 nếu không có giả thiết "mức tăng trọng lượng của gà tuân theo luật chuẩn và 2 2 1 2  " ta có thể làm như sau : Φ(xα) = 1 - α = 1 - 0,05 = 0,95 tra bảng N(0; 1) ta được xα = 1,65. *2 *2 2 2 1 2 1 2 1 2 1 2 1,2 1,1 3,147 0,04 0,09 99 1491 1 Y X Y X S S S S n n n n           > xα . Như vậy, ta bác bỏ giả thiết "Hiệu quả của hai phương pháp là như nhau", chấp nhận K, tức là phương pháp II hiệu quả hơn phương pháp I. Ví dụ 4: Để khảo sát tình hình đọc báo của sinh viên người ta tiến hành điều tra ở 3 trường đại học : 50 * Trường A: Điều tra 50 người thấy trung bình mỗi sinh viên bỏ ra 10 giờ một tháng để đọc báo, độ lệch bình phương mẫu là 10. * Trường B: Điều tra 40 sinh viên, thấy trung bình là 12 giờ, phương sai mẫu là 5,6 * Trường C: Điều tra 30 người, thấy trung bình là 11,5 giờ, phương sai mẫu là 5,4. Với xác suất 95%, hãy kiểm tra xem sinh viên các trường trên giành thời gian đọc báo có như nhau không ? (Bài tập) 3.4.5. So sánh hai xác suất (hay hai tỉ lệ) Bài toán: Xét hai dãy phép thử Bernoulli. Dãy I gồm n phép thử , X là số lần xuất hiện biến cố A trong dãy I; p1 = P(A) là xác suất để biến cố A xuất hiện trong mỗi phép thử trong dãy I. Dãy II gồm m phép thử, Y là số lần xuất hiện A trong dãy II; p2 = P(A) là xác suất để A xuất hiện trong mỗi phép thử trong dãy II. Hãy so sánh hai xác suất p1 và p2 ở mức α . Để trả lời câu hỏi, ta đưa về kiểm định giả thiết : H0 : p1 = p2 với K : p1 ≠ p2 ở mức α . Tiêu chuẩn kiểm định giả thiết này là : Giả thiết H0 bị bác bỏ ở mức α nếu : 1 1 1 X Y n m Z x X Y X Y n m n m n m                    Nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối chuẩn N(0,1) sao cho 1 ( ) 1x     . Tiêu chuẩn một phía: - Nếu X Y n m  thì ta đưa về bài toán kiểm định giả thiết : H0 : p1 = p2 với K : p1 < p2 ở mức α Giả thiết H0 bị bác bỏ ở mức α nếu 1 1 1 Y X n mZ x X Y X Y n m n m n m                    , nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối chuẩn N(0,1) sao cho ( ) 1x    . - Nếu X Y n m  thì ta đưa về bài toán kiểm định giả thiết : H0 : p1 = p2 với K : p1 > p2 ở mức α Giả thiết H0 bị bác bỏ ở mức α nếu 51 1 1 1 X Y n mZ x X Y X Y n m n m n m                    , nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối chuẩn N(0,1) sao cho ( ) 1x    . Ví dụ: Có hai loại thuốc A và B cùng điều trị một bệnh nào đó. Qua theo dõi ta thấy có 160 người dùng thuốc A có 120 khỏi bệnh, có 56 người dùng thuốc B thấy có 40 khỏi bệnh. Hỏi tác dụng của hai laọi thuốc trên trong việc chữa bệnh có như nhau không ? Lấy mức kiểm định α = 0,05. Giải: Ta có n = 160 , X = 120 ; m = 56 , Y = 40 X 120 40 > n 160 56 Y m   Gọi p1 là tỉ lệ người khỏi bệnh khi dùng thuốc A, p2 là tỉ lệ người khỏi bệnh khi dung thuốc B. Ta kiểm định giả thiết H0 : p1 = p2 , K : p1 > p2 ở mức α = 0,05 Ta có 120 40 160 56 0,529 1 1 120 40 120 40 1 160 56 160 56 160 56 Z                   ( ) 1 0,95x     , tra bảng ta được xα = 1,65 > Z Ta chấp nhận H0, tức là tác dụng chữa khỏi bệnh của 2 loại thuốc là như nhau. 3.5. Các yếu tố thống kê trong môn toán ở tiểu học Thống kê là một trong năm mạch kiến thức của môn toán ở Tiểu học. Nó bao gồm các nội dung: - Dãy số liệu thống kê, - Bảng số liệu thống kê, - Biểu đồ, - Số trung bình của dãy số liệu, - Giải toán về thống kê. 3.5.1. Dãy số liệu thống kê - Các khái niệm cơ bản của dãy số liệu : Thứ tự của các số liệu trong dãy. Cách đọc và phân tích phân tích các số liệu trong dãy, - Biết xử lí số liệu của dãy ở mức độ đơn giản, - Thực hành lập dãy số liệu từ một quan sát cụ thể. 3.5.2. Bảng số liệu thống kê 52 - Cấu tạo của số liệu thống kê: gồm các hàng và các cột, - Biết cách các số liệu trong bảng, - Biết cách xử lí các số liệu trong bảng, - Thực hành lập bảng số liệu từ một quan sát cụ thể. 3.5.3. Biểu đồ - Cấu tạo của ba loại biểu đồ: biểu đồ trang, biểu đồ cột và biểu đồ hình quạt. - Biết đọc số liệu trong mỗi loại biểu đồ. - Thực hành lập biểu đồ từ một quan sát cụ thể. 3.5.4. Giá trị trung bình - Khái niệm về số trung bình cộng. - Qui tắc tìm số trung bình cộng của hai hay nhiều số cho trước. - Thực hành tìm số trung bình cộng của các số liệu quan sát. 3.5.5. Giải toán về thống kê số liệu - Thực hành đọc và phân tích các số liệu thống kê ; - Thực hành và xử lí các số liệu thống kê ; - Thực hành lập dãy các số liệu, bảng số liệu và biểu đồ từ một quan sát cụ thể ; - Thực hành tìm các giá trị trung bình các số liệu từ một quan sát cụ thể. - Thực hành giải toán về tỉ lệ phần trăm. Chúng ta có thể tham khảo những ví dụ để làm sáng tỏ cho từng nội dung này trong sách Toán 3 : bài 1, bài 4; Toán 4 : bài 1, bài 2, bài 3. 53 BÀI TẬP CHƯƠNG 3 1. Cho mẫu quan sát của đại lượng ngẫu nhiên X là: a. X -5 1 3 ni 2 5 3 b. X 1 4 8 ni 5 3 2 Tìm hàm phân phối mẫu, tính trung bình mẫu và phương sai mẫu tương ứng các dữ liệu a, b. 2. Cho mẫu quan sát của cặp biến ngẫu nhiên (X, Y) như sau: a. X 1 2 3 4 5 6 7 8 9 10 Y 2 3 7 8 9 10 15 15 18 21 b. X 2 3 4 5 6 7 8 9 Y 3 7 8 9 13 15 16 17 c. X Y 2 3 4 2 9 1 1 2 8 3 3 7 d. X Y 2 3 4 1 8 2 2 3 7 3 1 9 Viết hàm phân phối mẫu của X. Tính trung mẫu, phương sai mẫu 2 2( ), ( )n nS X S Y , hệ số tương quan quan mẫu r. 3. Ta giả thiết rằng biến nhiên X, bằng sản lượng tính ra tạ/ha của loại lúa đã cho trong một miền xác định, có qui luật chuẩn và gọi a là kì vọng của X, σ2 là phương sai của X. Hãy ước lượng a và σ2 và các khoảng ước lượng của a với độ tin cậy 90%. Biết rằng các kết quả thu được trên 10 mảnh đất là: 54 Mảnh 1 2 3 4 5 6 7 8 9 10 Sản lượng 51 48 46 57 44 52 54 60 46 47 4. Độ cao trung bình của trẻ em có phân phối chuẩn dạng tổng quát N(a, σ2). Hãy ước lượng a và σ2 và tìm khoảng ước lượng của a với độ tin cậy là 0,95. Biết rằng ta đo ngẫu nhiên 10 em với kết quả sau: STT 1 2 3 4 5 6 7 8 9 10 Chiều cao X 1,5 1,55 1,49 1,51 1,5 1,52 1,45 1,6 1,5 1,46 5. Đại lượng ngẫu nhiêu X tuân theo luật chuẩn với tham số DX = σ2, kích thước mẫu n, độ tin cậy 1-α và trung bình mẫu X như sau: a. σ = 2 ; n = 25 ; 1-α = 0,95 ; X = 6 b. σ = 3 ; n = 36 ; 1-α = 0,999 ; X = 35 c. σ = 0,3 ; n = 36 ; 1-α = 0,99 ; X = 5 d. σ = 0,4 ; n = 81 ; 1-α = 0,95 ; X = 10 Tìm khoảng ước lượng của kì vọng a với độ tin cậy cho tương ứng ở các câu a, b, c, d. 6. Bắn 1000 viên đạn độc lập độc lập vào một mục tiêu thấy có 700 viên trúng đích. Hãy tìm khoảng ước lượng của xác suất bắn trúng đích của mỗi viên đạn với độ tin cậy la 0,95. 7. gieo ngẫu nhiên 1000 hạt đậu tương có 900 hạt nảy mầm. Tìm khoảng ước lượng của xác suất nảy mầm p với độ tin cậy 0,99.. 8. Để ước lượng số tờ bạc giả loại 50.000đồng đang lưu hành, Ngân hàng nhà nước tung thêm 1000 tờ bạc giả loại 50.000đồng có đánh dấu. Sau đó thu hồi 400 tờ bạc giả loại 50.000đồng thấy có 80 tờ có đánh dấu. Hãy ước lượng số bạc giả loại 50.000đồng không đánh dấu đang lưu hành với độ tin cậy 95%. 9. Công ty sản xuất bếp ga A đã bán ra trên địa bàn B 5000 bếp ga. Người ta kiểm tra 2500 hộ trên địa bàn B thấy có 1600 hộ có bếp ga trong đó có 320 hộ có bếp ga nhản hiệu A. Hãy ước lượng số hộ có bếp ga ở địa bàn B với độ tin cậy 95% . 10. Người ta cân ngẫu nhiên 10 trẻ em 2 tuổi. Kết quả như sau: Trọng lượng (kg) 12,3 12,5 12,8 13,0 13,5 Tần số 1 2 3 4 5 Giả sử trọng lượng X của trẻ em tuân theo luật chuẩn N(a, σ2). Hãy kiểm định giả thiết H0: a = 12 với K : a ≠ 12 ở mức α = 5%. 55 11. Cho mẫu quan sát của biến ngẫu nhiên X có phân phối chuẩn dạng tổng quát N(a, σ2) với giả thiết n = 100, X = 27,56 và σ = 5,2. Hãy kiểm định giả thiết H0: a = 26 với K : a ≠ 26 ở mức α = 5%. 12. Người ta muốn so sánh trọng lượng óc ở các nhóm người trên và dưới 50 tuổi ta xét các kết quả ghi trong bảng sau: (Các trọng lượng được nhóm thành các lớp cách nhau 50g, mỗi lớp được xác định bởi trung điểm của nó). Tuổi Trọng lượng 1175 1225 1275 1325 1375 1425 1475 Trên 50 tuổi 6 15 27 25 28 18 8 Dưới 50 tuổi 15 36 42 50 54 44 24 Ta có thể cho là trọng lượng trung bình của óc người trên 50 tuổi và dưới 50 tuổi như nhau không ? Cho mức kiểm định α = 0,05. 13. Đợt kiểm tra sức khỏe của trẻ em ở các nhà trẻ, người ta khám ngẫu nhiên 100 cháu thấy có 20 cháu có triệu chứng còi xương do suy dinh dưỡng. Gọi p là xác suất để một trẻ em là còi xương do thiếu dinh dưỡng ở vùng đang khảo sát. Hãy kiểm định giả thiết H0: p = 0,15 với K : p ≠ 0,15 ở mức α = 5%. 14. Tỷ lệ phế phẩm trong một lô sản phẩm là 0,02. Người ta kiểm tra ngẫu nhiên 480 sản phẩm từ một lô hàng thấy có 12 phế phẩm. Hỏi tỉ lệ phế phẩm công bố trên có đúng không ? Cho mức kiểm định α = 0,05. 15. Điều trị bệnh nhân bằng loại thuốc A tỷ lệ khỏi bệnh là 0,8. Áp dụng phương pháp điều trị mới bằng cách dùng thuốc B trên 800 bệnh nhân thấy có 660 người khỏi bệnh. Hỏi hiệu quả tác dụng của thuốc B có giống thuốc A không ? Cho mức kiểm định α = 5%. 16. Áp dụng hai phương pháp gieo hạt. Theo phương pháp A gieo 180 hạt có 150 hạt nảy mầm. Theo phương pháp B gieo 256 hạt có 160 hạt nảy mầm. Hãy so sánh hiệu quả của hai phương pháp ở mức α = 0,05. 56 TÀI LIỆU THAM KHẢO [1] Trần Diên Hiển – Vũ Viết Yên (2009), Nhập môn lý thuyến xác suất và thống kê toán, Nhà xuất bản Giáo dục, Hà Nội. [2] Trần Diên Hiển – Phạm Văn Kiều (2003), Toán cao cấp 2, Nhà xuất bản đại học sư phạm, Hà Nội. [3] Đào Hữu Hồ (1996), Xác suất thống kê, Nhà xuất bản Đại học quốc gia Hà Nội, Hà Nội. [4] Phạm Văn Kiều - Lê Thiên Hương (1998), Xác suất thống kê, Nhà xuất bản Giáo dục, Hà Nội. [5] Phạm Văn Kiều (2005), xác suất thống kê, Nhà xuất bản đại học sư phạm, Hà Nội. [6] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 3, NXB Giáo dục, Hà Nội. [7] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 4, NXB Giáo dục, Hà Nội. [8] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 5, NXB Giáo dục, Hà Nội. 57 MỤC LỤC Trang Lời nói đầu . 3 Chương 1.Biến cố ngẫu nhiên và xác suất 4 1.1. Khái niệm về biến cố. .. 4 1.2. Định nghĩa xác suất ................................................................................. 6 1.3. Biến cố ngẫu nhiên độc lập .11 1.4.Xác suất có điều kiện 12 1.5. Công thức Bernoulli .14 Bài tập chương 1 ..16 Chương 2. Biến ngẫu nhiên 21 2.1. Khái niệm biến ngẫu nhiên ...21 2.2. Phân phối của biến ngẫu nhiên rời rạc .. 21 2.3. Hàm phân phối của biến ngẫu nhiên 23 2.4. Biến ngẫu nhiên nhị thức 25 2.5. Biến ngẫu nhiên liên tục.25 2.6. Phân phối tiệm cận chuẩn ........................................................................ 27 2.7. Kì vọng và phương sai 27 Bài tập chương 2 ............................................................................................ 29 Chương 3. Thống kê toán học ..32 3.1.Mẫu quan sát (mẫu ngẫu nhiên) 32 3.2.Các đặc trưng mẫu 33 3.3.Ước lượng tham số ..............................................................................36 3.4. Kiểm định giải thiết thống kê 42 3.5. Các yếu tố thống kê trong môn toán ở tiểu học ....................................... 51 Bài tập chương 3 ............................................................................................. 53 Tài liệu tham khảo .....................................................................................56 Phục lục ....................................................................................................57

Các file đính kèm theo tài liệu này:

  • pdfnhap_mon_li_thuyet_xs_t_toan_2288_2042749.pdf
Tài liệu liên quan