13. Đợt kiểm tra sức khỏe của trẻ em ở các nhà trẻ, người ta khám ngẫu nhiên 100
cháu thấy có 20 cháu có triệu chứng còi xương do suy dinh dưỡng. Gọi p là xác
suất để một trẻ em là còi xương do thiếu dinh dưỡng ở vùng đang khảo sát. Hãy
kiểm định giả thiết
H0: p = 0,15 với K : p ≠ 0,15 ở mức α = 5%.
14. Tỷ lệ phế phẩm trong một lô sản phẩm là 0,02. Người ta kiểm tra ngẫu nhiên
480 sản phẩm từ một lô hàng thấy có 12 phế phẩm.
Hỏi tỉ lệ phế phẩm công bố trên có đúng không ? Cho mức kiểm định α =
0,05.
15. Điều trị bệnh nhân bằng loại thuốc A tỷ lệ khỏi bệnh là 0,8. Áp dụng phương
pháp điều trị mới bằng cách dùng thuốc B trên 800 bệnh nhân thấy có 660 người
khỏi bệnh. Hỏi hiệu quả tác dụng của thuốc B có giống thuốc A không ? Cho
mức kiểm định α = 5%.
16. Áp dụng hai phương pháp gieo hạt. Theo phương pháp A gieo 180 hạt có 150
hạt nảy mầm. Theo phương pháp B gieo 256 hạt có 160 hạt nảy mầm. Hãy so
sánh hiệu quả của hai phương pháp ở mức α = 0,05.
57 trang |
Chia sẻ: HoaNT3298 | Lượt xem: 1900 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Nhập môn lý thuyết xác xuất và thống kê toán - Võ Tuấn Thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
< b}) = F(b) - F(a) .
25
2.4. Biến ngẫu nhiên nhị thức
Định nghĩa: Xét dãy n phép tử Bernoulle với xác suất thành công của biến cố A
là P(A) = p. Gọi X là số lần xuất hiện biến cố A trong n phép thử trên, phân phối của X
được gọi phân phối nhị thức và ký hiệu X B(n,p), ta có :
P{(X = m)} = m
nc p
m(1 - p)n-m , (m = 0, 1, 2, ..., n)
Hàm phân phối của X là :
F(X) = k
m
k x
C
pk(1 - p)n-k , x R .
Ví dụ: Một xạ thủ bắn 3 viên đạn độc lập vào một mục tiêu trong cùng một điều
kiện xác định. Xác suất để mỗi viên đạn trúng mục tiêu là 0,4. Gọi X là số viên đạn
trúng mục tiêu. Lập bảng phân phối của đại lượng ngẫu nhiên X.
Giải.
Đại lượng ngẫu nhiên X có thể nhận một và chỉ một trong các giá trị 0, 1, 2, 3
với xác suất
P{(X = k)} =
3
kc (0,4)k(1 - 0,4)3-k , k = 0, 1 , 2 , 3.
Cụ thể là : P({X=0}) = 0,216 ;
P({X=1}) = 0,432 ;
P({X=2}) = 0,288 ;
P({X=3}) = 0,064 .
Do đó bảng phân phối của X là :
X 0 1 2 3
P 0.216 0,432 0,288 0,064
2.5.Biến ngẫu nhiên liên tục
Nếu tập các giá trị mà biến ngẫu nhiên nhận lấp đầy một khoảng nào đó, các
biến ngẫu nhiên này gọi là biến ngẫu nhiên liên tục.
Để mô tả (hoặc xác định) biến ngẫu nhiên liên tục ta dùng khái niệm hàm mật độ.
Hàm p(x) được gọi là hàm mật độ của biến ngẫu nhiên nào đó nếu nó thoả mãn
hai kiện kiện sau :
1. p(x) 0 , x (- , +)
2. ( )p x dx
= 1
Trong trường hợp này, xác suất để X (x0 , x1) được tính như sau :
P(x0 < X < x1) =
1
0
( )
x
x
p x dx .
Hàm phân phối của biến ngẫu nhiên X là
F(x) = P(X < x) =
1
( )
x
p x dx
Như vậy F’(x) = p(x).
26
Chú ý: Tích phân với các cận -, + được xác định như sau :
( )p x dx
= ( )
a
p x dx
+ ( )
a
p x dx
, aR
( )
a
p x dx
= ( )lim
a
b b
p x dx
, ( )
a
p x dx
= ( )lim
b
b a
p x dx
.
Ví dụ 1: p(x) =
0 , ,
1
,
x a x b
a x b
b a
p(x) là hàm mật độ của biến ngẫu nhiên nhận mọi giá trị trên [a, b] với khả năng
đều như nhau, gọi tắt là mật độ đều trên [a, b].
Ví dụ 2: p(x) =
2
2
1
( )
2
1
2
x
e
p(x) là hàm mật độ của biến ngẫu nhiên nhận giá trị trên toàn trục số. Hàm mật
độ này gọi là hàm mật độ của biến ngẫu nhiên có phân phối chuẩn dạng N(,2).
Ví dụ 3: Cho hàm p(x) = a sin2x . Xác định hằng số a để p(x) trở thành hàm mật độ
của biến ngẫu nhiên nhận giá trị tập trung trong đoạn [0,
2
] .
Ta có p(x) =
0 , 0
2
2 , 0
2
x x
asin x x
Trong [0,
2
] thì sin2x 0 nên a 0
Ta có :
0 02 2
0 0
2 2
( ) ( ) ( ) ( ) 0 sin(2 ) 0p x dx p x dx p x dx p x dx dx a x dx dx
= a
2
0
sin(2 )x dx
= - 2
0
cos 2
2
a
x
2
a
(-2) = a = 1 .
Vậy a = 1 và p(x) = sin(2x) là hàm mật độ của biến ngẫu nhiên nhận giá trị tập trung
trong [0,
2
].
* Tính chất của biến ngẫu nhiên liên tục:
Ngoài những tính chất đã được nêu ở mục 2.3.2, biến ngẫu nhiên liên tục còn có
những tính chất sau
- Nếu hàm mật độ liên tục tại x thì tại đó ta có F'(x) = p(x).
- Nếu hàm phân phối của biến ngẫu nhiên liên tục tại x0 thì
P({= x0}) = 0.
27
2.6. Phân phối tiệm cận chuẩn
Trong ví dụ 2 của mục 2.5 ta đã biết biến ngẫu nhiên X có phân phối chuẩn
dạng N(,2) thì hàm mật độ có dạng p(x) =
2
2
1
( )
2
1
2
x
e
.
Khi = 0, = 1 phân phối của X có dạng N(0; 1) với hàm mật độ kí hiệu là
(x), xác định như sau:
(x) =
21
2
1
2
x
e
Trong trường hợp này ta nói X có phân phối tiệm cận chuẩn hay phân phối dạng
chuẩn tắc, hàm phân phối của X kí hiệu là (x), được các định như sau:
(x) =
21
2
1
2
x
t
e dt
.
Khi đó P(X < x) = (x) =
21
2
1
2
x
t
e dt
. Giá trị của hàm (x) được tra
trong bảng phục lục của các giáo trình xác suất thống kê.
2.7. Kì vọng và phương sai
2.7.1. Kỳ vọng (giá trị trung bình)
2.7.1.1.Định nghĩa: Kỳ vọng của biến ngẫu nhiên là một con số được ký hiệu là E
và được xác định như sau:
- Nếu là biến ngẫu nhiên rời rạc, có phân phối
x1 x2 x3 . . . xn . . .
pi p1 p2 p3 . . . pn . . .
thì
E = i i
i
x p .
- Nếu là biến ngẫu nhiên liên tục có hàm mật độ p(x) thì
E = ( )xp x dx
Ví dụ : 1. Với bảng phân bố
Khi đó EX = (-1).1/4 + 1.3/4 = 1/2
2. Biến ngẫu nhiên X có phân phối chuẩn dạng N(,2) kì vọng được xác
định như sau:
EX =
2
2
1
( )
2
1
2
x
x e dx
= .
X -1 1
P ¼ ¾
28
Ý nghĩa: Kỳ vọng của biến ngẫu nhiên là giá trị trung bình mà biến ngẫu nhiên
nhận, hoặc kỳ vọng của biến ngẫu nhiên là trọng tâm của phân phối xác suất với khối
lượng 1. Chính vì vậy mà người ta luôn dùng kỳ vọng để xác định vị trí của phân bố.
2.7.1.2.Tính chất:
a. EC = C ( C là hằng số)
b. ECX = CEX
c. E(X Y) = EX EY
d. Nếu X, Y độc lập E(XY) = EX.EY
e. Ef(X) = ( )i i
i
f x p , nếu P(X = xi) = pi
Ef(X) = ( ) ( )f x p x dx
, nếu X có mật độ p(x)
2.7.2. Phương sai
2.7.2.1.Định nghĩa 1: Ta gọi E(X - EX)2 là phương sai của biến ngẫu nhiên X, kí
hiệu là DX và được xác định
DX = E(X - EX)2
Từ định nghĩa ta thấy:
- Nếu X là biến ngẫu nhiên rời rạc thì:
DX = 2( EX)i i
i
x p .
- Nếu X là biến ngẫu nhiên liên tục có hàm mật độ p(x) thì :
DX = 2(x ) ( )EX p x dx
.
- Phương sai DX có thể xác định theo công thức khác như sau
DX = EX2 – (EX)2
Ví dụ:
1. Với bảng phân phối xác suất ở ví dụ 1 của mục 2.6.1, phương sai của biến ngẫu
nhiên X được xác định như sau :
EX2 = 1.(1/4) + 1.(3/4) = 1
DX = EX2 – (EX)2 = 1 –
2
1
2
=
3
4
2. Biến ngẫu nhiên X có phân phối chuẩn dạng N(,2) phương sai là
DX =
2
2
1
( )
2 2
1
( )
2
x
x e dx
=
2
2.7.2.2.Định nghĩa 2: Độ lệch chuẩn của biến ngẫu nhiên X (độ lệch bình phương
trung bình) kí hiệu X là căn bậc hai số học của phương sai
X -1 1
X2 1 1
P ¼ ¾
29
X = DX .
Ý nghĩa của phương sai: Phương sai của biến ngẫu nhiên là một số không âm dùng
để đo mức độ phân tán (mức độ tản mát) của các giá trị của biến ngẫu nhiên X xung
quanh tâm (kỳ vọng) EX của nó. DX nhỏ thì mức độ phân tán nhỏ, độ tập trung lớn.
DX càng lớn thì độ phân tán càng cao.
EX : Tâm của phân phối
X - EX : Khoảng cách từ giá trị của biến ngẫu nhiên X đến tâm
(X - EX)2 : Bình phương khoảng cách trên
E(X - EX)2 : Trung bình của bình phương khoảng cách trên.
2.7.2.3.Tính chất của phương sai:
a. Dc = 0 , ( c = const )
b. DcX = c2DX
c. Nếu X và Y là hai biến ngẫu nhiên độc lập thì
D(X Y) = DX DY.
BÀI TẬP CHƯƠNG 2
1. Gọi X là số chấm xuất hiện ở mặt trên của con xúc xắc khi gieo 1 lần con xúc
xắc cân đối và đồng chất.
a. Tìm phân phối xác suất của X. Viết hàm phân phối F(x);
b. Tính kì vọng EX và phương sai DX;
c. Tính xác suất P[1 ≤ X < 3].
2. Kí hiệu X là biến ngẫu nhiên chỉ số học sinh thuộc bài khi kiểm tra hai em học
sinh. Biết rằng xác suất để mỗi học sinh thuộc bài là p =
1
2
a. Tìm phân phối xác suất của X, hàm phân phối của X;
b. Tính kì vọng EX và phương sai DX;
c. Tính xác suất P[0 ≤ X < 1].
3. Một đợt xổ số phát hành 10.000 vé, trong đó có 100 vé trúng thưởng. Một người
mua ngẫu nhiên 3 vé. Gọi X la biến ngẫu nhiên chỉ số vé trúng thưởng trong 3
vé. Tìm phân xác suất của X. Tính kì vọng của X.
30
4. Cho phân phối xác suất của biến ngẫu nhiên X là:
X -2 0 2
P 1
4
1
2
1
4
a. Tìm hàm phân phối F(x) ; Tính xác suất P[-1 ≤ X < 1];
b. Tính E(X), E(X3), DX.
5. Bắn không hạn chế vào một mục tiêu cho tới khi nào trúng đích thì dừng lại.
Gọi X là số viên đạn đã bắn.
a. Tìm phân phối xác suất của X. Viết hàm phân phối;
b. Tính kì vọng và phương sai của X.
Biết rằng xác suất bắn trúng đích của mỗi viên đạn là p = 0,4.
6. Gieo hai con xúc xắc: Một con màu xanh, một con màu đỏ. Gọi X là số chấm
xuất hiện ở mặt trên con xúc xắc màu xanh, Y là số chấm xuất hiện ở mặt trên
con xúc xắc màu đỏ
a. Tìm phân phối xác suất của X, của Y;
b. Tính xác suất P[X + Y = 3]. Tính kí vọng E(X+Y).
7. Giáo viên của một trường tiểu học có 15% nam. Gặp ngẫu nhiên 6 giáo viên của
trường. Gọi X là số giáo viên nam giới trong 6 giáo viên trên.
a. Tính xác suất để trong 6 giáo viên được gặp có đúng 2 giáo viên nam.
b. Tính kì vọng và phương sai của X.
8. Gieo liên tiếp 10 lần độc lập một con xúc xắc cân đối và đồng chất. Gọi X là số
lần xuất hiện mặt trên có 3 chấm. Lập phân phối xác suất của X. Tính kì vọng của X.
9. Gieo 100 hạt đậu tương. Xác suất nảy mầm của mỗi hạt là 0,9. Gọi X là số hạt nảy
mầm trong 100 hạt. Tìm phân phối xác suất của X; Tính kì vọng và phương sai của X.
10. Một đấu thủ tham gia trò chơi theo qui tắc: “Muốn được tham gia trò chơi phải nộp
x đồng. Khi chơi, gieo 3 con xúc xắc, nếu cả ba mặt trên đều có 6 chấm thì thu vê
3.600.000 đồng, nếu có 2 con xúc xắc có 6 chấm thì thu về 280.000 đồng, nếu chỉ có
một con xúc xắc ở mặt trên 6 chấm thì thu về 40.000 đồng, nếu không có mặt nào 6
chấm thì mất x đồng đã nộp”.
Tìm x sao cho trò chơi vô thưởng vô phạt, tức là trung bình tiền thu được bằng
không.
11. Gọi X là biến ngẫu nhiên chỉ số kiểu gen aa thấy được trong 40 cá thể sinh ra từ
giao 2 dị hợp tử Aa (ta nhắc lại rằng trong sự giao đó, xác suất để được một cá thể có
kiểu gen aa bằng
1
4
). Tìm phân phối xác suất của X và tính xác suất P[X ≤ 6].
12. Cho hàm phân phối của biến ngẫu nhiên X là:
31
F(x) =
0 , 0
1
, 0 4
4
1 , 4
x
x
x
a. Tìm hàm mật độ của biến X;
b. Tính kì vọng và phương sai của X;
c. Tính xác suất P[-1 ≤ X < 2].
13. Cho hàm phân phối của biến ngẫu nhiên X là:
F(x) =
1 , 0, 0
1 , 0
xe x
x
a. Tìm hàm mật độ của X;
b. Tính kì vọng và phương sai của X.
14. Giả sử hàm mật độ của biến ngẫu nhiên X là:
f(x) =
0 , (0 , )
sin , (0 , )
x
A x x
a. Tìm A;
b. Tìm hàm phân phối F(x);
c. Tính kì vọng và phương sai của X.
32
Chương 3. THỐNG KÊ TOÁN HỌC
A. MỤC TIÊU
KIẾN THÚC:
Người học sau khi học xong chủ đề này sẽ nắm được những kiến thức về:
- Các khái niệm cơ bản của thống kê toán.
- Các giá trị đặc trưng của mẫu quan sát: phương sai, độ lệch chuẩn, trung vị.
- Ước lượng điểm và ước lượng khoảng.
- Kiểm định giả thiết thống kê.
- Nội dung dạy các yếu tố thống kê trong môn toán ở trường tiểu học.
KĨ NĂNG:
Người học từng bước hình thành và rèn luyện các kĩ năng về:
- Lập biểu đồ tần suất.
- Tính các đặc trưng mẫu.
- Ước lượng tham số.
- Kiểm định giả thiết thống kê.
- Giải toán thống kê ở tiểu học.
THÁI ĐỘ:
- Chủ động tìm tòi ứng dụng của thống kê để xử lí các bài toán thống kê thường
gặp trong thực tế và trong nghiên cứu khoa học giáo dục.
- Phát hiện cơ sở toán học của mạch yếu tố thống kê trong môn Toán ở Tiểu
học.
B. NỘI DUNG
3.1.Mẫu quan sát (mẫu ngẫu nhiên)
Giả sử ta cần nghiên cứu một đặc tính nào đó ở các phần tử của một tập hợp các
đối tượng cùng loại. Trên thực tế tập hợp này có số lượng rất lớn (người ta thường gọi
là tập tổng quát hay đám đông) hoặc vì một khó khăn nào đó ta không thể nghiên cứu
tất cả các phần tử của tập hợp đó, nhưng lại muốn có một kết luận chung về đặc tính
phải nghiên cứu đối với tập hợp này. Để giải quyết bài toán nảy phải chọn ra một bộ
phận gồm các phần tử đại diện của tập hợp đó và gọi là tập mẫu.
Định nghĩa: Tập mẫu, hay gọi tắt là mẫu, là tập những đối tượng được chọn theo
một phân phối xác suất nào đó.
Nếu tập mẫu gồm n phần từ thì n gọi là kích thước của mẫu. Người ta thường kí
hiệu mẫu ngẫu nhiên dưới dạng (X1, X2, , Xn). Các Xi là những phần tử của mẫu, đôi
khi còn gọi là các quan sát.
Ví dụ:
1) Phòng GD-ĐT về thanh tra đột xuất về chất lượng dạy và học ở một trường
Tiểu học nào đó, vì điều kiện thời gian không cho phép đoàn thanh tra thực
hiện kiểm tra, đánh giá trên tất cả các học sinh, nên chỉ chọn ngẫu nhiên mỗi
33
khối lớp 10 học sinh để kiểm tra và đánh giá chất lượng dạy và học. Mỗi tập
10 học sinh đã chọn ở từng khối lớp là các mẫu ngẫu nhiên.
2) Để đánh giá tuổi thọ của một loại bóng đèn điện, người ta không thể “quan
sát” mọi bóng đèn loại đó vì số lượng quá nhiều. Vì vậy người ta đã chọn ra
một số bóng đèn một cách ngẫu nhiên và cho chiếu sáng rồi quan sát ta thu
được dãy số liệu (X1, X2, , Xn) tương ứng với dãy tuổi thọ của các bóng
đèn được lấy ra.
3.2.Các đặc trưng mẫu
3.2.1.Trung bình mẫu
Cho mẫu quan sát (X1, X2, , Xn). Trung bình mẫu này là một số, kí hiệu
X , được xác định như sau :
1 2
... nX X XX
n
Nếu mẫu quan sát được thu gọn dưới dạng :
X x1 x2 ... xn
Tần số ni n1 n2 ... ni
Thì trung bình mẫu được tính như sau :
1 1 2 2 1
1 2
...
...
k
i i
k k i
k
n x
n x n x n x
X
n n n n
3.2.2. Trung vị
Định nghĩa : Trung vị mẫu (X1, X2, , Xn) kí hiệu m hoặc Xme, là một số mà
các giá trị của mẫu ≥ m bằng số các giá trị của mẫu ≤ m. Nghĩa là m thỏa mãn
Card{k ≤ n/Xk ≤ m} = Card{ k ≤ n/Xk ≥ m}
Theo định nghĩa trên, để tính trung vị của mẫu, ta sắp xếp lại mẫu theo thứ tự tăng dần
* * *
1 2 ... nX X X
thì m = *
1
2
nX nếu n lẻ và m=
* *
1
2 2
2
n nX X
nếu n chẳn .
3.2.3. Mode
Định nghĩa : Mode là một giá trị của mẫu có tần số lớn nhất
3.2.4. Phương sai mẫu
- Phương sai của mẫu (X1, X2, , Xn) là một số được kí hiệu là S2(X) hay
2 ( )nS X và xác định như sau :
34
2
12 2 2 2 2
1 1 1
1 1 1
( ) ( ) ( )
n
in n n
i
n i i i
i i i
X
S X X X X X X
n n n n
- Một phương sai khác kí hiệu là *2( )nS X hay
*2( )S X hay '2 ( )S X gọi là
phương sai điều chỉnh (hay phương sai có điều chỉnh) được xác định như
sau :
*2 2
1
1
( ) ( )
1
n
n i
i
S X X X
n
Ta thấy
*2 2( ) ( )
1
n n
n
S X S X
n
Giá trị s = *2ns gọi là độ lệch chuẩn của mẫu
Nếu mẫu quan sát cho dưới dạng :
X x1 x2 ... xk
Tần số ni n1 n2 ... nk
Thì phương sai mẫu có thể được tính theo công thức :
2
2 1
1
( )
( )
k
i i
i
n k
i
i
n x X
S X
n
hoặc 2 2 2
1
1
1
( ) ( )
k
n i ik
i
i
i
S X n x X
n
Ví dụ: Khi lấy ngẫu nhiên 20 học sinh của một trường tiểu học, cho kiểm tra môn
Toán điểm của các học sinh lần lượt như sau :
5 6 7 5 8 9 7 6 4 4
5 4 6 6 7 5 9 8 6 9
Ta sắp xếp số liệu của mẫu theo các giá trị khác nhau như sau:
Trung bình mẫu:
3.4 4.5 5.6 3.7 2.8 3.9 126
6,3
20 20
X
Trung vị mẫu là: m = 6.
Mode của mẫu là: mode = 6
Các giá trị khác nhau của X 4 5 6 7 8 9
Tần số (số em đạt được): ni 3 4 5 3 2 3
35
Phương sai:
2 2 2 2 2 2 21( ) 3(4 6,3) 4(5 6,3) 5(6 6,3) 3(7 6,3) 2(8 6,3) 3(9 6,3)
20
nS X
= 2,62
Chú ý: Ta có thể thu gọn số liệu để giảm bớt sự tính toán với những con số quá
lớn như sau:
Tính ui = 0i
x x
h
, i = 1, 2, ... , Chọn x0 là giá trị xi ở quảng giữa của dãy
số liệu, h là độ dài khoảng cách đều giữa các xi
1 2 ... ku u uu
n
; 2 2 2
1
1
(u) ( )
k
n i i
i
S n u u
n
Trở lại số liệu ban đầu ta có :
2 2 20 . ; S ( ) . ( )n nX x h u X h S u
3.2.5. Hệ số tương quan mẫu
Cho mẫu quan sát (X1,Y1) ; (X2,Y2) ; ... ; (Xn,Yn). Số r được xác định như
sau :
1
1
( )( )
=
( ). ( )
n
i i
i
n n
X X Y Y
n
r
S X S Y
Gọi là hệ số tương quan mẫu.
Khai triển cụ thể ta có
1 1
2 2 2 2
1 1 1 1
( )( )
r =
( ) ( )
n n n
i i i i
i i i i
n n n n
i i i i
i i i i
n X Y X Y
n X X n Y Y
Ví dụ: Cho mẫu quan sát của cặp biến ngẫu nhiên (X, Y) như sau :
X 0 1 1 3 3 4
Y 3 3 4 4 5 5
Tính 2 2 , , ( ) , ( ) , n nX Y S X S Y r
Ta lập bảng sau:
Xi Yi Xi.Yi 2
iX
2
iY
0
1
1
3
3
4
3
3
4
4
5
5
0
3
4
12
15
20
0
1
1
9
9
16
9
9
16
16
25
25
12iX 24iY 54i iX Y 2 36iX 2 100iY
36
12 24
2 ; Y 4.
6 6
X
2
6
2
12 2
6
1
)
1 1 12
( ) 36 2
6 6 6 6
in
i
i
i
X
S X X
2
2
6
1 24 2
( ) 100
6 6 3
S Y
1 1
2 2 2 2
1 1 1 1
( )( )
r =
( ) ( )
n n n
i i i i
i i i i
n n n n
i i i i
i i i i
n X Y X Y
n X X n Y Y
=
2 2
6.54 12.24
6.36 12 6.100 24
3.3.Ước lượng tham số
3.3.1. Ước lượng điểm
Giả sử θ là tham số cần ước lượng. Chúng ta chỉ có một mẫu ngẫu nhiên (X1,
X2, , Xn). Để ước lượng θ không thể dựa vào mẫu ngẫu nhiên. Ta dùng một hàm nào
đó của mẫu, tức là một hàm nào đó của các biến X1, X2, , Xn để làm ước lượng cho
θ. Kí hiệu hàm đó là Tn = φ(X1, X2, , Xn) chỉ phụ thuộc vào quan sát (X1, X2, , Xn)
mà không phụ thuộc θ.
Định nghĩa 1: Ước lượng Tn của tham số θ được gọi là ước lượng không chệch nếu
E(Tn) = θ.
Ví dụ: Cho mẫu ngẫu nhiên (X1, X2, , Xn) rút từ biến ngẫu nhiên X của phân phối
chuẩn dạng tổng quát N(a; σ2). Khi đó
1 2
... nX X XX
n
là ước lượng không chệch của a . Vì:
1
1
( ) ( )
n
i
i
na
E X E X a
n n
.
*2 2
1
1
S ( )
1
n
i
i
X X
n
là ước lượng không chệch của σ2 .
Định nghĩa 2: Ước lượng
nT của tham số θ được gọi là ước lượng không chệch tốt
nhất nếu
i,
n( T )E = θ
ii, ( ) D ( )n nD T T .
37
Trong đó Tn là ước lượng không chệch bất kì của θ. Dθ là kí hiệu của phương
sai với điều kiện phân phối có chứa tham số θ.
Định nghĩa 3: Ước lượng cho xác suất p của biến cố A nào đó (hay ước lượng cho tỉ
lệ nào đó) là
p* =
m
n
trong đó n là số lần quan sát, m là số lần suất hiện biến cố A. Đây cũng là ước lượng
không chệch cho xác suất p.
Ví dụ: Tiến hành đo chiều cao của 100 em học sinh lớp 3 (8 tuổi) ở một trường tiểu
học, ta có kết quả sau:
Khoảng chiều cao (cm) Số em (mi)
(110 - 112]
(112 - 114]
(114 - 116]
(116 - 118]
(118 - 120]
(120 - 122]
(122 - 124]
(124 - 126]
(126 - 128]
5
8
14
17
20
16
10
6
4
100
Gọi X là chiều cao của em học sinh (cm). Hãy chỉ ra ước lượng điểm cho EX,
DX và tính p = P({116 < X <124}).
Giải:
Gọi xi là điểm đại diện cho mỗi khoảng, ta thu gọn số liệu với
ui =
119
2
ix
Ta có bảng tính sau:
38
19
u 0,19 X 119 2u 118,62
100
2 2
n
2 2 2
n n
399
S (u) = ( 0,19) 3,9529
100
S (X) h .S (u) = 4.3,9539 = 15,8156
S ≈ 3,977 ; *
63
p 0,63
100
.
Vậy: - Ước lượng điểm cho EX là 118,62
- Ước lượng điểm cho DX là 15,8156
- Ước lượng điểm cho p là 0,63 .
3.3.2. Ước lượng khoảng
Cho mẫu quan sát (X1, X2, , Xn) từ phân phối f(x,θ), θ là tham số.
Định nghĩa 1: Gọi khoảng ước lượng của tham số θ với độ tin cậy 1 - α là khoảng
(
1 2; ) sao cho
P[
1 2 ] = 1 - α .
3.3.2.1.Khoảng ước lượng của kì vọng a trong phân phối chuẩn.
Cho mẫu quan sát (X1, X2, ..., Xn) rút từ biến ngẫu nhiên X có phân phối chuẩn
dạng tổng quát N(a;σ2). Khoảng ước lượng của kì vọng a với độ tin cậy 1 - α được tính
theo một trong các công thức sau:
+ Trường σ đã biết: khoảng ước lượng được xác định theo công thức
; X x X x
n n
(1)
trong đó xα được tra từ bảng phân phối chuẩn N(0; 1) sao cho
( ) 1
2
x
+ Trường σ chưa biết: Khoảng ước lượng được xác định theo công thức
Khoảng chiều
Cao ( X )
mi xi ui miui miui2
(110 - 112]
(112 - 114]
(114 - 116]
(116 - 118]
(118 - 120]
(120 - 122]
(122 - 124]
(124 - 126]
(126 - 128]
5
8
14
17
20
16
10
6
4
111
113
115
117
119
121
123
125
127
-4
-3
-2
-1
0
1
2
3
4
-20
-24
-28
-17
0
16
20
18
16
80
72
56
17
0
16
40
54
64
Σ 100 -19 399
39
* *
;
S S
X t X t
n n
(2)
trong đó * *2 2 2 2
1 1
1 1
( ) ( )
1 1 1
n k
X i i i X
i i
n
S S X X n x X S
n n n
- Nếu n ≥ 30 thì tα tra như xα tra trong bảng phân phối chuẩn N(0;1) sao cho
( ) 1
2
t
.
- Nếu n < 30 tα tra trong bảng phân phối Studen với n - 1 bậc tự do và mức ý
nghĩa là α (bảng 2 phía)
Ví dụ 1: Tìm khoảng ước lượng của kì vọng a với độ tin cậy 0,95 của biến ngẫu
nhiên X có phân phối chuẩn, nếu độ lệch tiêu chuẩn của X là σ = 5 và trung bình mẫu
X = 14 và kích thước mẫu là n = 25.
Giải : Ở đây σ = 5 đã biết nên khoảng ước lượng được tính theo công thức :
; X x X x
n n
1 - α = 0,95 suy ra α = 0,05 ; ( ) 1
2
x
= 0,975, tra bảng N(0, 1) ta có
xα = 1,96 ; X = 14.
Thế các giá trị vào công thức ta có khoảng ước lượng cần tìm là
5 5
14 1,96. ; 14 1,96. 12,04 ; 15,96
25 25
.
Ví dụ 2: Tiến hành kiểm tra ngẫu nhiên 10 học sinh. Kết quả cho ở bảng sau (thang
điểm 10)
X : 5 4 3 5 6 7 6 2 8 5
Giả sử X có phân phối chuẩn dạng N(a, σ2). Tìm khoảng ước lượng của a với độ tin
cậy 0,95.
Giải Ta thấy σ chưa biết nên khoảng ước lượng được xác định theo công thức sau
* *
;
S S
X t X t
n n
; với
*2 2 2 2 2 2 2
2 2
5 4 3 5 6 7 6 2 8 5
5,1
10
1
[(5 - 5,1) (4 5,1) (3 5,1) 5 5,1) (6 5,1) (7 5,1)
9
(6 5,1) (2 5,1) (8
X
X
S
2 25,1) (5 5,1) ]=3,21
* *2 3,21XS S 1,792
n = 25 < 30 nên tα tra trong bảng phân phối Studen
tα = t(9; 0,05) = 2,26
40
thế các giá trị vào công thức ta có khoảng ước lượng cần tìm là
1,792 1,792
5,1 2,26. ; 5,1 2,26. (3,71 ; 6,39)
25 25
.
3.3.2.2.Khoảng ước lượng của tỉ lệ hay xác suất trong phân phối nhị thức
Khoảng ước lượng của xác suất p với độ tin cậy 1 - α là:
(1 ) (1 )
;
p p p p
p x p x
n n
(3)
trong đó xα tra ở bảng phân phối N(0; 1) sao cho ( ) 1
2
x
,
k
p
n
; k là số lần xuất
hiện biến cố A trong n phép thử.
Ví dụ: Gieo 400 hạt đậu tương thấy có 5 hạt không nảy mầm. Hãy tìm khoảng ước
lượng của xác suất không nảy mầm của mỗi hạt với độ tin cậy 0,999.
Giải:
Ta có 1 - α = 0,999. suy ra α = 0.001, do đó
( ) 1
2
x
= 0,9995 Tra bang N(0;1) ta có xα = 3,3
n = 400 ; k = 5
thay các giá trị vào công thức ta có khoảng ước lượng cần tìm là
5 5 5 5
(1 ) (1 )
5 5400 400 400 4003,3 ; 3,3
400 400 400 400
Rút gọn ta có (-0,0058 ; 0,0308)
vì xác suất không âm nên khoảng ước lượng cần xác định là
(0 ; 0,0308)
Ví dụ 2: Trong kho có 100 nghìn sản phẩm. Lấy ngẫu nhiên 1600 sản phẩm thấy có
320 phế phẩm. Hãy tìm khoảng ước lượng của số phế phẩm trong kho với độ tin cậy
99%.
Giải:
Ta có n = 1600, k = 320 nên tỉ lệ phế phẩm của mẫu là
320
0,2
1600
k
p
n
1 - α = 0,99 suy ra α = 0,01 do đó ( ) 1
2
x
= 0,995 tra bảng ta có xα = 2,58 Gọi p
là tỉ lệ phế phẩm trong kho, khoảng ước lương của p theo công thức (3) là:
0,2(1 0,2) 0,2(1 0,2)
0,2 2,58 ; 0,2 2,58
1600 1600
Rút gọn ta có (0,1742 ; 0,2258)
Như vậy 0,1742 < p < 0,2258
41
Gọi N là số phế phẩm có trong 100.000 sản phẩm, ta có
100.000
N
p
suy ra 0,1742 <
100.000
N
p < 0,2258
Do đó 17420 < N < 22580 .
Vậy với độ tin cậy 99% , số phế phẩm có trong kho khoảng từ 17420 đến 22580 sản
phẩm.
Ví dụ 3: Để nghiên cứu tuổi thọ của mỗi loại bóng đèn người ta lấy ra 100 bóng thắp
thử và có số liệu :
Tuổi thọ X
(giờ)
1200 -1250 1250- 1300 1300 – 1350 1350- 1400 1400- 1450 1450– 1500
Số bóng (ni) 10 20 40 15 10 5
a) Hãy tìm khoảng ước lượng tuổi thọ trung bình của loại bóng đèn đó với độ tin cậy
95%.
b) Người ta nói bóng đèn loại I là bóng đèn có tuổi thọ từ 1250 giờ trở lên. Hãy tìm
khoảng ước lượng tỉ lệ bóng đèn loại I với độ tin cậy 90%.
c) Có ý kiến cho rằng : tuổi thọ trung bình của loại bóng đèn đó là 1300 giờ, đồng
thời cũng có ý kiến cho rằng tuổi thọ trung bình của loại bóng đèn đó lớn hơn 1300giờ.
Với mức ý nghĩa là 0,05; hãy cho kết luận về các ý kiến trên.
Biết rằng tuổi thọ trung bình của các bóng đèn có phân phối chuẩn.
Giải:
a) Ta lập bảng thống kê sau (lấy x0 = 1325 ; h = 50 )
Khoảng X xi ni
ui = i 0
x x
h
niui ni
2
iu
1200 – 1250
1250 - 1300
1300 - 1350
1350 - 1400
1400 - 1450
1450 - 1500
1225
1275
1325
1375
1425
1475
10
20
40
15
10
5
-2
-1
0
1
2
3
-20
-20
0
15
20
15
40
20
0
15
40
45
Σ 100 10 160
1
1
u 0,1in u
n
; 2 2 2
1
( ) 1,59n i iS n u u
n
.
Trung bình mẫu: 0 . 1325 50.(0,1) 1330X X h u .
Phương sai mẫu:
2 2 2 2 * *
100
. 50 .1,59=3975 ; S . .3975
1 99
X u X
n
S h s S
n
= 63,365.
42
Ta có σ chưa biết, n = 100 > 30 , khoảng ước lượng của khối lượng trung bình được
xác định theo công thức (2):
* *
. , .
S S
X t X t
n n
1- α = 0,99 → α = 0,01 ; tα = xα
( ) 1
2
x
= 0,975, tra bảng ta được xα = 1,96.
thế các giá trị vào công thức ta có
63,365 63,365
1330 1,96. ; 1330 1,96.
100 100
Rút gọn ta được khoảng ước lượng của tuổi thọ trung bình của bóng đèn là
(1317,58 ; 1342,42)
b) Khoảng ước lượng tỉ lệ loại bóng đèn loại I, độ tin cậy 0,9 được xác định theo
công thức :
(1 ) (1 )
;
p p p p
p x p x
n n
90
0,9
100
p ; 1 - α = 0,9 suy ra α = 0,1 tra bảng ta được xα = 1,65 ; n = 100
thế các giá trị vào công thức ta có
0,9(1 0,9) 0,9(1 0,9)
0,9 1,65. ; 0,9 1,65.
100 100
Rút gọn ta được khoảng ước lượng của tỉ lệ bóng đèn loại I do nhà máy sản xuất là
(0,8505 ; 0,9495) .
c) Giải ở cuối mục 3.3.4
3.4. Kiểm định giải thiết thống kê
3.4.1. Thiết lập bài toán
Giả sử X là biến ngẫu nhiên có hàm phân phối F(x)
- Những giả thiết về hàm phân phối F(x) được gọi là giả thiết thống kê và kí
hiệu là H0 .
- Những giả thiết cũng về hàm phân phối F(x) nhưng khác với giả thiết H0 được
gọi là đối thiết, kí hiệu là K.
Khi hàm phân phối F(x) = F(x,θ) phụ thuộc vào tham số θ thì giả thiết về hàm
phân phối được chuyển sang giả thiết về tham số θ .
Ví dụ : Đối với phân phối chuẩn N(a; σ2) ta có thể có các giả thiết sau
+ H0 : a = a0 với K : a ≠ a0
+ H0 : a = 10 hoặc 15 < a < 20 với K : a < 10 hoặc 10 < a < 15.
- Kiểm định giả thiết thống kê là việc chọn 1 trong 2 quyết định: chấp nhận H0
hoặc bác bỏ H0 trên cơ sở thực nghiệm, tức là mẫu ngẫu nhiên (X1, X2, ..., Xn) cho
43
phép ta chọn một trong hai quyết định đó. Muốn có quyết định trên ta phải tìm một tiêu
chuẩn để kiểm định giả thiết H0 với đối thiết K .
- Tiêu chuẩn để kiểm định giả thiết là một đại lượng ngẫu nhiên Z phụ thuộc
vào mẫu (X1, X2, ..., Xn). Vận dụng các kết quả của lý thuyết xác suất ta tìm được tập S
sao cho khi Z S thì ta bác bỏ giả thiết H0; ngược lại Z S thì ta chấp nhận H0. Tập S
gọi là miền tiêu chuẩn
3.4.2. Kiểm định giả thiết về xác suất trong phân phối nhị thức
Bài toán: Giả sử trong dãy n phép thử Bernoulli, biến cố A xuất hiện X lần. Gọi p
là xác suất xuất hiện biến cố A trong mỗi phép thử. Hãy kiểm định giả thiết :
H0 : p = p0 với K : p ≠ p0 ở mức α.
Lời giải : Giả thiết H0 bị bác bỏ ở mức α nếu
0
0 0(1 )
X np
Z
np p
≥ xα
Nếu Z < xα thì chấp nhận H0; trong đó xα tra từ bảng phân phối chuẩn
dạng N(0; 1) sao cho ( ) 1
2
x
.
Ví dụ: Gieo 300 hạt đậu tương thấy có 261 hạt nảy mần. Người ta nói rằng tỉ lệ
nảy mầm của đậu tương là 90%. Điều nhận định đó đúng không ? Cho mức ý nghĩa
α = 5% .
Giải: Gieo 300 hạt đậu tương như thực hiện 300 phép thử Bernoulli. Gọi p là xác
suất nảy mầm. Ta đưa bài toán về dạng bài toán kiểm định sau :
H0 : p = 0,9 với K : p ≠ 0,9 ở mức 0,05
Ta có n = 300 ; X = 261 ; p0 = 0,9
0
0 0
261 300.0,9
1,73
(1 ) 300.0,9(1 0,9)
X np
Z
np p
.
( ) 1
2
x
= 1 - 0,025 , tra bảng ta được xα = 1,96 .
Ta thấy Z < xα , ta chấp nhận H0 ; tức là với mức ý nghĩa 0,05 không đủ cơ sở
để bác bỏ điều khẳng định đã nêu .
* Tiêu chuẩn một phía:
- Nếu xu thế thực nghiệm mà 0
X
p
n
thì ta có thể đưa bài toán về thành bài toán
kiểm định giả thiết: H0 : p = p0 với K : p > p0 ở mức α
Giả thiết H0 bị bác bỏ ở mức α nếu
0
0 0(1 )
X np
Z
np p
≥ xα
Nếu Z < xα thì chấp nhận H0 . Trong đó xα tra từ bảng phân phối chuẩn dạng
N(0; 1) sao cho ( ) 1x .
44
- Nếu xu thế thực nghiệm mà 0
X
p
n
thì ta đưa bài toán về thành bài toán kiểm
định giả thiết: H0 : p = p0 với K : p < p0 ở mức α
Giả thiết H0 bị bác bỏ ở mức α nếu
0
0 0(1 )
np X
Z
np p
≥ xα
Nếu Z < xα thì chấp nhận H0 . Trong đó xα tra từ bảng phân phối chuẩn dạng
N(0; 1) sao cho ( ) 1x .
Ví dụ: như ví dụ trên ta thấy
261
0,87
300
X
n
< 0,9 ta có thể đưa về bài toán kiểm
định
H0 : p = 0,9 với K : p < 0,9 ở mức 0,05
Ta có n = 300 ; X = 261 ; p0 = 0,9
0
0 0
300.0,9 261
1,73
(1 ) 300.0,9(1 0,9)
np X
Z
np p
.
( ) 1x = 1 - 0,05 = 0,95 , tra bảng ta được xα = 1,65 .
Z > xα như vậy ta bác bỏ H0, tức là tỉ lệ nảy mầm của lô hạt giống cà phê trên
nhỏ hơn 90% .
3.4.3. Kiểm định về kì vọng (giá trị trung bình) trong mẫu độc lập từ phân phối
chuẩn
Giả sử (X1, X2, ..., Xn) là mẫu ngẫu nhiên rút rừ biến ngẫu nhiên X có phân phối
chuẩn dạng N(a; σ2). Từ mẫu đã cho bài toán yêu cầu kiểm định giả thiết
H0 : a = a0 với K : a ≠ a0
ở mức α .
1. Trường hợp σ đã biết: H0 bị bác bỏ ở mức α nếu
|Z| =
0X a n
≥ xα .
Nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối chuẩn sao
cho
( ) 1
2
x
.
2. Trường hợp σ chưa biết: H0 bị bác bỏ ở mức α nếu
|Z| =
0
*
X
X a n
S
≥ tα
Nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau :
- Nếu n ≥ 30 thì tα tra như xα tra trong bảng phân phối chuẩn sao cho
( ) 1
2
t
.
45
- Nếu n < 30 thì tα tra trong bảng phân phối Studen với n - 1 bậc tự do và mức ý
nghĩa là α (tra trong bảng tiêu chuẩn 2 phía)
Ví dụ 1: Giả sử mẫu ngẫu nhiên (X1, X2, , Xn) rút từ phân phối chuẩn dạng
N(a; 4) và có X = 15; n= 100. Hãy kiểm định giả thiết
H0 : a = 16,5 với K : a ≠ 16,5
ở mức α = 5% .
Giải: α = 0,05 ; ta có ( ) 1
2
t
= 0,975, tra bảng phân phối chuẩn ta có
xα = 1,96
0 15 16,5 100
2
X a n
Z
= 7,5.
Ta thấy |Z| > xα nên giả thiết H0 bị bác bỏ ở mức α = 5%, tức là a ≠ 16,5
.
Ví dụ 2: Sau một đợt huấn luyện người ta kiểm tra ngẫu nhiên 15 học sinh với kết
quả điểm X như sau :
X : 2 3 7 6 9 7 6
6 1 2 7 8 6 5 6.
Giả sử X tuân theo luật phân phối chuẩn N(a; σ2). Hãy kiểm định giả thiết
H0 : a = 6 với K : a ≠ 6 ở mức α = 5% .
Giải: Ta thấy σ chưa biết, n = 15 < 30 do đó
tα = t(5%; 14) = 2,14;
81
5, 4
15
X .
*2 *5,5 nên 5,5 2,35X XS S
0
*
5,4 6 15
0,987
2,35X
X a n
Z
S
.
|Z| < tα nên chấp nhận H0, tức là với mức ý nghĩa 0,05 điểm trung bình của học
sinh các học sinh sau đợt huấn luyện là 6.
• Tiêu chuẩn một phía:
- Nếu X > a0 thì đưa về kiểm định giả thiết :
H0 : a = a0 với K : a > a0
Tiêu chuẩn kiểm định giả thiết này là :
a. Trường hợp σ đã biết : H0 bị bác bỏ ở mức α nếu
Z = 0
( )X a n
≥ xα
Nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối chuẩn
sao cho ( ) 1x .
b. Trường hợp σ chưa biết : H0 bị bác bỏ ở mức α nếu
46
Z = 0
*
( )
X
X a n
S
≥ tα
Nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau :
+ Khi n > 30 thì tα tra như xα trong bảng N(0;1) sao cho
( ) 1t .
+ Khi n < 30 thì tα được tra trong bảng phân phối Studen với n - 1
bậc tự do và mức α . (Bảng tiêu chuẩn một phía).
- Nếu X < a0 thì đưa về kiểm định giả thiết :
H0 : a = a0 với K : a < a0 ở mức α .
Tiêu chuẩn kiểm định giả thiết này là :
a. Trường hợp σ đã biết : H0 bị bác bỏ ở mức α nếu
Z = 0
( )a X n
≥ xα ,
nếu Z < xα thì chấp nhận H0, trong đó xα tra trong bảng phân phối
chuẩn sao cho
( ) 1x .
b. Trường hợp σ chưa biết : H0 bị bác bỏ ở mức α nếu
Z = 0
*
( )
X
a X n
S
≥ tα ,
nếu Z < tα thì chấp nhận H0, trong đó tα được xác định như sau :
+ Khi n > 30 thì tα tra như xα trong bảng N(0;1) sao cho
( ) 1t .
+ Khi n < 30 thì tα được tra trong bảng phân phối Studen với n - 1
bậc tự do và mức α . (Bảng tiêu chuẩn một phía).
Ví dụ: Ta giải câu c trong ví dụ 3 của mục 3.3.2.
Ta thấy 01330 1300X a nên ta đưa về kiểm định bài toán
H0 : a = 1300 với K : a > 1300 ở mức 0,05
Ta có Z = 0
*
( )
X
X a n
S
=
(1330 1300) 100
63,365
= 4,734.
( ) 1t = 0,95, tra bảng N(0; 1) ta có tα = 1,65 < Z
Giả thiết H0 bị bác bỏ, chấp nhận K, tức với mức ý nghĩa 0,05 thì tuổi thọ bình của
bóng đèn lớn hơn 1300 giờ.
3.4.4. So sánh hai giá trị trung bình
Giả sử mẫu (X1, X2, ..., Xn1) được rút ra từ biến ngẫu nhiên X có phân phối là
F1(x), mẫu ngẫu nhiên (Y1, Y2, ..., Yn2) được rút từ biến ngẫu nhiên Y có phân phối là
F2(x). Ta xét xem, với mức ý nghĩa α nào đó, trung bình mẫu của hai phân phối trên có
bằng nhau không ?
Kí hiệu a1 = Ex , a2 = EY
47
2
1 = DX ,
2
2 = DY
Ta kiểm định các giả thiết H0 : a1 = a2 với K : a1 ≠ a2 (1)
H0 : a1 = a2 với K : a1 > a2 (2)
H0 : a1 = a2 với K : a1 < a2 (3)
Trong các trường hợp sau:
1- Nếu 2
1 ,
2
2 đã biết:
Giả thiết H0 của (1) bị bác bỏ khi
2 2
1 2
1 2
X Y
n n
≥ xα ,
với xα được xác định thỏa điều kiệu ( ) 1
2
x
Giả thiết H0 của (2) bị bác bỏ khi
2 2
1 2
1 2
X Y
n n
≥ xα ,
với xα được xác định thỏa điều kiệu ( ) 1x
Giả thiết H0 của (3) bị bác bỏ khi
2 2
1 2
1 2
Y X
n n
≥ xα , với xα được xác định thỏa điều kiệu
( ) 1x
2- Nếu 2
1 ,
2
2 chưa biết:
Trong trường hợp này ta phải giả thiết X, Y đều có phân phối chuẩn
X ≈ N(a1;
2
1 ) ; Y ≈ N(a2 ;
2
2 ) và
2 2
1 2
Ta tính
t =
2 2
1 2 1 2
1 2 1 2
.
2
X Y
X Y
n S n S n n
n n n n
Tra trong bảng phân phối Studen tìm
1 2 1 22 2
; ( )
2
n n n nt t
Ta kết luận các bài toán trên như sau:
Giả thiết H0 của (1) bị bác bỏ khi
1 2 2 2
n nt t
.
Giả thiết H0 của (2) bị bác bỏ khi
48
1 2 2n n
t t .
Giả thiết H0 của (3) bị bác bỏ khi
1 2 2n n
t t .
Ví dụ 1: Để so sánh trọng lượng con so và con rạ lúc mới đẻ người ta lấy số liệu từ các
nhà hộ sinh nào đó, thống kê và sắp xếp số liệu, Ta có bảng sau :
Khoảng trọng
Lượng (gam)
Điểm
đại diện
xi
Số trẻ
Con so
(mi)
Số trẻ
Con rạ
(m'i)
mixi
m'ixi
1700 – 1900
1900 - 2100
2100 - 2300
2300 - 2500
2500 - 2700
2700 - 2900
2900 - 3100
3100 - 3300
3300 - 3500
3500 - 3700
3700 - 3900
3900 - 4100
4100 - 4300
4300 – 4500
1800
2000
2200
2400
2600
2800
3000
3200
3400
3600
3800
4000
4200
4400
3
5
7
5
13
21
20
11
6
3
0
1
1
0
2
4
7
13
22
18
15
10
7
3
2
1
5400
10000
15400
12000
33800
58800
60000
35200
20400
10800
0
4000
1800
0
4400
9600
18200
36400
66000
57600
51000
36000
26600
12000
8400
4400
∑ n1= 95 n2 = 105 265800 332400
Giả sử độ lệch bình phương trung bình đối với con so 2
1 =190000, đối với con rạ là
2
2 = 200704. Có ý kiến cho rằng trọng lượng trung bình của con so và con rạ bằng
nhau. Hãy kiểm định giả thiết ở mức ý nghiã α = 0,05.
Giải: Ở đây n1 = 95 , n2 = 105
Từ hai cột cuối ta có :
265800
2797,8947 2798
95
X gam
332400
3165,7142 3166
105
Y gam
Ta kiểm định giả thiết
H0 : a1 = a2 , K : a1 < a2 ở mức 0,05
Φ(xα) = 1 - α = 1 - 0,05 = 0,95 tra bảng N(0; 1) ta được xα = 1,65.
49
2 2
1 2
1 2
3166 2798
5,88
19000 200704
95 105
Y X
n n
> xα
Như vậy giả thiết H0 bị bác bỏ, chấp nhận K, tức là trọng lượng trung bình của con so
nhỏ hơn con rạ .
Ví dụ 2: Người ta thí nghiệm hai phương pháp chăn nuôi gà khác nhau, sau thời gian
một tháng kết quả tăng trọng lượng như sau
Phương pháp I : n1 = 100 con ,
21,1 , 0,04XX kg S
Phương pháp II: n2 = 150 con ,
21,2 , 0,098YY kg S
Với mức ý nghĩa α = 0,05 ta có thể kết luận phương pháp II hiệu quả hơn
phương pháp I được không ? Giả thiết mức tăng trọng lượng của gà tuân theo luật
chuẩn và 2 2
1 2 .
Giải: Ta kiểm định giả thiết
H0 : a1 = a2 , K : a1 < a2
Ta có
1,1 1,2
2,914
100 0,04 150 0,09 100 150
100 150 2 100 150
t
α = 0,05 tra bảng phân phối Studen ta có t100+150-2(0,05) = t248(0,05) = 1,645
Ta thấy t < - t248(0,05).
Ta bác bỏ giả thiết a1 = a2, chấp nhận a2 > a1, tức là phương pháp II hiệu quả
hơn phương pháp I
Chú ý: Trong trường hợp σ1, σ2 chưa biết, thiết về tính chuẩn của hai mẫu và σ1 ≠σ2
không được nêu ra. Song nếu n1, n2 đủ lớn(n1 ≥ 30, n2 ≥ 30) thì mặc dù các giả thiết
trên không được thỏa mãn ta cũng có thể xấp xỉ 2
1 bởi
*2
XS ,
2
2 bởi
*2
YS trong các công
thức của trường hợp 2
1 ,
2
2 đã biết và kết luận các bài toán như trường hợp này.
Ví dụ 3: Trong ví dụ 2 nếu không có giả thiết "mức tăng trọng lượng của gà tuân theo
luật chuẩn và 2 2
1 2 " ta có thể làm như sau :
Φ(xα) = 1 - α = 1 - 0,05 = 0,95 tra bảng N(0; 1) ta được xα = 1,65.
*2 *2 2 2
1 2 1 2
1 2 1 2
1,2 1,1
3,147
0,04 0,09
99 1491 1
Y X Y X
S S S S
n n n n
> xα .
Như vậy, ta bác bỏ giả thiết "Hiệu quả của hai phương pháp là như nhau", chấp
nhận K, tức là phương pháp II hiệu quả hơn phương pháp I.
Ví dụ 4: Để khảo sát tình hình đọc báo của sinh viên người ta tiến hành điều tra ở 3
trường đại học :
50
* Trường A: Điều tra 50 người thấy trung bình mỗi sinh viên bỏ ra 10 giờ một tháng
để đọc báo, độ lệch bình phương mẫu là 10.
* Trường B: Điều tra 40 sinh viên, thấy trung bình là 12 giờ, phương sai mẫu là 5,6
* Trường C: Điều tra 30 người, thấy trung bình là 11,5 giờ, phương sai mẫu là 5,4.
Với xác suất 95%, hãy kiểm tra xem sinh viên các trường trên giành thời gian
đọc báo có như nhau không ? (Bài tập)
3.4.5. So sánh hai xác suất (hay hai tỉ lệ)
Bài toán: Xét hai dãy phép thử Bernoulli. Dãy I gồm n phép thử , X là số lần
xuất hiện biến cố A trong dãy I; p1 = P(A) là xác suất để biến cố A xuất hiện trong mỗi
phép thử trong dãy I. Dãy II gồm m phép thử, Y là số lần xuất hiện A trong dãy II;
p2 = P(A) là xác suất để A xuất hiện trong mỗi phép thử trong dãy II. Hãy so sánh hai
xác suất p1 và p2 ở mức α .
Để trả lời câu hỏi, ta đưa về kiểm định giả thiết :
H0 : p1 = p2 với K : p1 ≠ p2 ở mức α .
Tiêu chuẩn kiểm định giả thiết này là :
Giả thiết H0 bị bác bỏ ở mức α nếu :
1 1
1
X Y
n m
Z x
X Y X Y
n m n m n m
Nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối
chuẩn N(0,1) sao cho
1
( ) 1x
.
Tiêu chuẩn một phía:
- Nếu
X Y
n m
thì ta đưa về bài toán kiểm định giả thiết :
H0 : p1 = p2 với K : p1 < p2 ở mức α
Giả thiết H0 bị bác bỏ ở mức α nếu
1 1
1
Y X
n mZ x
X Y X Y
n m n m n m
,
nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối chuẩn
N(0,1) sao cho
( ) 1x .
- Nếu
X Y
n m
thì ta đưa về bài toán kiểm định giả thiết :
H0 : p1 = p2 với K : p1 > p2 ở mức α
Giả thiết H0 bị bác bỏ ở mức α nếu
51
1 1
1
X Y
n mZ x
X Y X Y
n m n m n m
,
nếu Z x thì chấp nhận giả thiết H0, trong đó xα tra trong bảng phân phối chuẩn
N(0,1) sao cho
( ) 1x .
Ví dụ: Có hai loại thuốc A và B cùng điều trị một bệnh nào đó. Qua theo dõi ta thấy có
160 người dùng thuốc A có 120 khỏi bệnh, có 56 người dùng thuốc B thấy có 40 khỏi
bệnh. Hỏi tác dụng của hai laọi thuốc trên trong việc chữa bệnh có như nhau không ?
Lấy mức kiểm định α = 0,05.
Giải: Ta có n = 160 , X = 120 ; m = 56 , Y = 40
X 120 40
>
n 160 56
Y
m
Gọi p1 là tỉ lệ người khỏi bệnh khi dùng thuốc A, p2 là tỉ lệ người khỏi bệnh khi
dung thuốc B. Ta kiểm định giả thiết
H0 : p1 = p2 , K : p1 > p2 ở mức α = 0,05
Ta có
120 40
160 56 0,529
1 1 120 40 120 40
1
160 56 160 56 160 56
Z
( ) 1 0,95x , tra bảng ta được xα = 1,65 > Z
Ta chấp nhận H0, tức là tác dụng chữa khỏi bệnh của 2 loại thuốc là như nhau.
3.5. Các yếu tố thống kê trong môn toán ở tiểu học
Thống kê là một trong năm mạch kiến thức của môn toán ở Tiểu học. Nó bao
gồm các nội dung:
- Dãy số liệu thống kê,
- Bảng số liệu thống kê,
- Biểu đồ,
- Số trung bình của dãy số liệu,
- Giải toán về thống kê.
3.5.1. Dãy số liệu thống kê
- Các khái niệm cơ bản của dãy số liệu : Thứ tự của các số liệu trong dãy.
Cách đọc và phân tích phân tích các số liệu trong dãy,
- Biết xử lí số liệu của dãy ở mức độ đơn giản,
- Thực hành lập dãy số liệu từ một quan sát cụ thể.
3.5.2. Bảng số liệu thống kê
52
- Cấu tạo của số liệu thống kê: gồm các hàng và các cột,
- Biết cách các số liệu trong bảng,
- Biết cách xử lí các số liệu trong bảng,
- Thực hành lập bảng số liệu từ một quan sát cụ thể.
3.5.3. Biểu đồ
- Cấu tạo của ba loại biểu đồ: biểu đồ trang, biểu đồ cột và biểu đồ hình
quạt.
- Biết đọc số liệu trong mỗi loại biểu đồ.
- Thực hành lập biểu đồ từ một quan sát cụ thể.
3.5.4. Giá trị trung bình
- Khái niệm về số trung bình cộng.
- Qui tắc tìm số trung bình cộng của hai hay nhiều số cho trước.
- Thực hành tìm số trung bình cộng của các số liệu quan sát.
3.5.5. Giải toán về thống kê số liệu
- Thực hành đọc và phân tích các số liệu thống kê ;
- Thực hành và xử lí các số liệu thống kê ;
- Thực hành lập dãy các số liệu, bảng số liệu và biểu đồ từ một quan sát cụ
thể ;
- Thực hành tìm các giá trị trung bình các số liệu từ một quan sát cụ thể.
- Thực hành giải toán về tỉ lệ phần trăm.
Chúng ta có thể tham khảo những ví dụ để làm sáng tỏ cho từng nội dung này
trong sách Toán 3 : bài 1, bài 4; Toán 4 : bài 1, bài 2, bài 3.
53
BÀI TẬP CHƯƠNG 3
1. Cho mẫu quan sát của đại lượng ngẫu nhiên X là:
a.
X -5 1 3
ni 2 5 3
b.
X 1 4 8
ni 5 3 2
Tìm hàm phân phối mẫu, tính trung bình mẫu và phương sai mẫu tương
ứng các dữ liệu a, b.
2. Cho mẫu quan sát của cặp biến ngẫu nhiên (X, Y) như sau:
a.
X 1 2 3 4 5 6 7 8 9 10
Y 2 3 7 8 9 10 15 15 18 21
b.
X 2 3 4 5 6 7 8 9
Y 3 7 8 9 13 15 16 17
c.
X
Y
2
3
4
2 9 1
1 2 8
3 3 7
d.
X
Y
2
3
4
1 8 2
2 3 7
3 1 9
Viết hàm phân phối mẫu của X. Tính trung mẫu, phương sai mẫu 2 2( ), ( )n nS X S Y ,
hệ số tương quan quan mẫu r.
3. Ta giả thiết rằng biến nhiên X, bằng sản lượng tính ra tạ/ha của loại lúa đã cho
trong một miền xác định, có qui luật chuẩn và gọi a là kì vọng của X, σ2 là
phương sai của X. Hãy ước lượng a và σ2 và các khoảng ước lượng của a với độ
tin cậy 90%. Biết rằng các kết quả thu được trên 10 mảnh đất là:
54
Mảnh 1 2 3 4 5 6 7 8 9 10
Sản lượng 51 48 46 57 44 52 54 60 46 47
4. Độ cao trung bình của trẻ em có phân phối chuẩn dạng tổng quát N(a, σ2). Hãy
ước lượng a và σ2 và tìm khoảng ước lượng của a với độ tin cậy là 0,95. Biết
rằng ta đo ngẫu nhiên 10 em với kết quả sau:
STT 1 2 3 4 5 6 7 8 9 10
Chiều
cao X
1,5 1,55 1,49 1,51 1,5 1,52 1,45 1,6 1,5 1,46
5. Đại lượng ngẫu nhiêu X tuân theo luật chuẩn với tham số DX = σ2, kích thước
mẫu n, độ tin cậy 1-α và trung bình mẫu X như sau:
a. σ = 2 ; n = 25 ; 1-α = 0,95 ; X = 6
b. σ = 3 ; n = 36 ; 1-α = 0,999 ; X = 35
c. σ = 0,3 ; n = 36 ; 1-α = 0,99 ; X = 5
d. σ = 0,4 ; n = 81 ; 1-α = 0,95 ; X = 10
Tìm khoảng ước lượng của kì vọng a với độ tin cậy cho tương ứng ở các câu a,
b, c, d.
6. Bắn 1000 viên đạn độc lập độc lập vào một mục tiêu thấy có 700 viên trúng
đích. Hãy tìm khoảng ước lượng của xác suất bắn trúng đích của mỗi viên đạn
với độ tin cậy la 0,95.
7. gieo ngẫu nhiên 1000 hạt đậu tương có 900 hạt nảy mầm. Tìm khoảng ước
lượng của xác suất nảy mầm p với độ tin cậy 0,99..
8. Để ước lượng số tờ bạc giả loại 50.000đồng đang lưu hành, Ngân hàng nhà
nước tung thêm 1000 tờ bạc giả loại 50.000đồng có đánh dấu. Sau đó thu hồi
400 tờ bạc giả loại 50.000đồng thấy có 80 tờ có đánh dấu. Hãy ước lượng số bạc
giả loại 50.000đồng không đánh dấu đang lưu hành với độ tin cậy 95%.
9. Công ty sản xuất bếp ga A đã bán ra trên địa bàn B 5000 bếp ga. Người ta kiểm
tra 2500 hộ trên địa bàn B thấy có 1600 hộ có bếp ga trong đó có 320 hộ có bếp
ga nhản hiệu A. Hãy ước lượng số hộ có bếp ga ở địa bàn B với độ tin cậy 95% .
10. Người ta cân ngẫu nhiên 10 trẻ em 2 tuổi. Kết quả như sau:
Trọng lượng (kg) 12,3 12,5 12,8 13,0 13,5
Tần số 1 2 3 4 5
Giả sử trọng lượng X của trẻ em tuân theo luật chuẩn N(a, σ2). Hãy kiểm
định giả thiết
H0: a = 12 với K : a ≠ 12 ở mức α = 5%.
55
11. Cho mẫu quan sát của biến ngẫu nhiên X có phân phối chuẩn dạng tổng quát
N(a, σ2) với giả thiết n = 100, X = 27,56 và σ = 5,2. Hãy kiểm định giả thiết
H0: a = 26 với K : a ≠ 26 ở mức α = 5%.
12. Người ta muốn so sánh trọng lượng óc ở các nhóm người trên và dưới 50 tuổi ta
xét các kết quả ghi trong bảng sau:
(Các trọng lượng được nhóm thành các lớp cách nhau 50g, mỗi lớp được xác
định bởi trung điểm của nó).
Tuổi
Trọng lượng
1175 1225 1275 1325 1375 1425 1475
Trên 50 tuổi 6 15 27 25 28 18 8
Dưới 50 tuổi 15 36 42 50 54 44 24
Ta có thể cho là trọng lượng trung bình của óc người trên 50 tuổi và dưới
50 tuổi như nhau không ? Cho mức kiểm định α = 0,05.
13. Đợt kiểm tra sức khỏe của trẻ em ở các nhà trẻ, người ta khám ngẫu nhiên 100
cháu thấy có 20 cháu có triệu chứng còi xương do suy dinh dưỡng. Gọi p là xác
suất để một trẻ em là còi xương do thiếu dinh dưỡng ở vùng đang khảo sát. Hãy
kiểm định giả thiết
H0: p = 0,15 với K : p ≠ 0,15 ở mức α = 5%.
14. Tỷ lệ phế phẩm trong một lô sản phẩm là 0,02. Người ta kiểm tra ngẫu nhiên
480 sản phẩm từ một lô hàng thấy có 12 phế phẩm.
Hỏi tỉ lệ phế phẩm công bố trên có đúng không ? Cho mức kiểm định α =
0,05.
15. Điều trị bệnh nhân bằng loại thuốc A tỷ lệ khỏi bệnh là 0,8. Áp dụng phương
pháp điều trị mới bằng cách dùng thuốc B trên 800 bệnh nhân thấy có 660 người
khỏi bệnh. Hỏi hiệu quả tác dụng của thuốc B có giống thuốc A không ? Cho
mức kiểm định α = 5%.
16. Áp dụng hai phương pháp gieo hạt. Theo phương pháp A gieo 180 hạt có 150
hạt nảy mầm. Theo phương pháp B gieo 256 hạt có 160 hạt nảy mầm. Hãy so
sánh hiệu quả của hai phương pháp ở mức α = 0,05.
56
TÀI LIỆU THAM KHẢO
[1] Trần Diên Hiển – Vũ Viết Yên (2009), Nhập môn lý thuyến xác suất và
thống kê toán, Nhà xuất bản Giáo dục, Hà Nội.
[2] Trần Diên Hiển – Phạm Văn Kiều (2003), Toán cao cấp 2, Nhà xuất bản đại
học sư phạm, Hà Nội.
[3] Đào Hữu Hồ (1996), Xác suất thống kê, Nhà xuất bản Đại học quốc gia Hà
Nội, Hà Nội.
[4] Phạm Văn Kiều - Lê Thiên Hương (1998), Xác suất thống kê, Nhà xuất bản
Giáo dục, Hà Nội.
[5] Phạm Văn Kiều (2005), xác suất thống kê, Nhà xuất bản đại học sư phạm,
Hà Nội.
[6] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 3, NXB Giáo dục, Hà Nội.
[7] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 4, NXB Giáo dục, Hà Nội.
[8] Đỗ Đình Hoan và tập thể tác giả (2004), Toán 5, NXB Giáo dục, Hà Nội.
57
MỤC LỤC
Trang
Lời nói đầu . 3
Chương 1.Biến cố ngẫu nhiên và xác suất 4
1.1. Khái niệm về biến cố. .. 4
1.2. Định nghĩa xác suất ................................................................................. 6
1.3. Biến cố ngẫu nhiên độc lập .11
1.4.Xác suất có điều kiện 12
1.5. Công thức Bernoulli .14
Bài tập chương 1 ..16
Chương 2. Biến ngẫu nhiên 21
2.1. Khái niệm biến ngẫu nhiên ...21
2.2. Phân phối của biến ngẫu nhiên rời rạc .. 21
2.3. Hàm phân phối của biến ngẫu nhiên 23
2.4. Biến ngẫu nhiên nhị thức 25
2.5. Biến ngẫu nhiên liên tục.25
2.6. Phân phối tiệm cận chuẩn ........................................................................ 27
2.7. Kì vọng và phương sai 27
Bài tập chương 2 ............................................................................................ 29
Chương 3. Thống kê toán học ..32
3.1.Mẫu quan sát (mẫu ngẫu nhiên) 32
3.2.Các đặc trưng mẫu 33
3.3.Ước lượng tham số ..............................................................................36
3.4. Kiểm định giải thiết thống kê 42
3.5. Các yếu tố thống kê trong môn toán ở tiểu học ....................................... 51
Bài tập chương 3 ............................................................................................. 53
Tài liệu tham khảo .....................................................................................56
Phục lục ....................................................................................................57
Các file đính kèm theo tài liệu này:
- nhap_mon_li_thuyet_xs_t_toan_2288_2042749.pdf