Ví dụ: Một lô hàng gồm 100 sản phẩm, trong đó có 10 phế phẩm. Rút ngẫu nhiên lần lượt 4 sản phẩm theo kiểu mỗi lần rút không hoàn lại và kiểm tra. Nếu tất cả sản phẩm này đều tốt thì lô hàng được nhận. Tìm xác suất để lô hàng này được nhận.
60 trang |
Chia sẻ: aloso | Lượt xem: 5457 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Xác suất và thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRẦN AN HẢI
BÀI GIẢNG
XÁC SUẤT & THỐNG KÊ
HÀ NỘI - 2009
TÀI LIỆU THAM KHẢO
[1] Trần Mạnh Tuấn, Xác suất & Thống kê, Lí thuyết và thực
hành tính toán, Nhà xuất bản Đại học Quốc gia Hà Nội, 2004
[2] Đặng Hùng Thắng, Mở đầu về lí thuyết xác suất và các ứng
dụng, Nhà xuất bản Giáo dục, 2005
[3] Đặng Hùng Thắng, Thống kê và ứng dụng, Nhà xuất bản
Giáo dục, 2005
[4] Nguyễn Cao Văn - Trương Giêu, Bài tập Lý thuyết xác suất
& Thống kê toán, Nhà xuất bản KHKT, 2006
NỘI DUNG
Chương 1 Các định nghĩa xác suất
Chương 2 Biến ngẫu nhiên
Chương 3 Luật số lớn
Chương 4 Thống kê mô tả
Chương 5 Ước lượng tham số
Chương 6 Kiểm định giả thuyết thống kê
Sau khi học hết chương 3 kiểm tra lần 1
Sau khi học hết chương 6 kiểm tra lần 2
TUẦN 1
Chương 1
CÁC ĐỊNH NGHĨA XÁC SUẤT
_________________________________________________
'1 PHÉP THỬ NGẪU NHIÊN
VÀ KHÔNG GIAN MẪU
Khi cho cuộn dây quay đều trong từ trường của một
thanh nam châm, kết quả là chắc chắn xuất hiện
dòng điện trong cuộn dây
Đây là một phép th không ngu nhiên.
Khi gieo 1 con xúc xắc cân đối và đồng chất, ta
không đoán chắc chắn được kết quả. Chỉ biết được
kết quả là xuất hiện số chấm trong {1, …, 6}.
Đây là một phép th ngu nhiên.
Ta còn gặp rất nhiều phép thử ngẫu nhiên khác
như: quan sát thị trường chứng khoán, chơi xổ số
và các trò may rủi, thống kê tai nạn và bảo hiểm,
thống kê khách hàng đến các máy rút tiền ATM,
đếm số lần gọi đến các tổng đài, xét chất lượng sản
phẩm, quan sát thời tiết, xét khả năng phòng thủ
trong quân sự,…
Vào năm 1651 nhà quý tộc Pháp De Méré nhờ nhà toán học
Blaise Pascal giải đáp một số vấn đề rắc rối nảy sinh trong
các trò cờ bạc. Pascal đã “toán học hóa” các trò chơi này,
nâng lên thành những bài toán phức tạp hơn và trao đổi vấn
đề này với nhà toán học Pierre de Fermat, người được
mệnh danh là “quái kiệt” trong giới toán học đương thời.
Những cuộc trao đổi đó đã khai sinh ra Lý thuyết xác suất,
một ngành toán học nghiên cứu các phép thử ngẫu nhiên.
Blaise Pascal (1623-1662)
Ngày nay Lý thuyết xác suất đã trở thành một
ngành toán học quan trọng, được ứng dụng trong
rất nhiều lĩnh vực của khoa học tự nhiên, khoa học
xã hội, công nghệ, kinh tế, y học, sinh học,… Chẳng
hạn như nó cho phép xác định rủi ro trong buôn bán
hàng hóa. Chính phủ cũng áp dụng các phương
pháp xác suất để điều tiết môi trường hay còn gọi là
phân tích đường lối. Nhiều sản phẩm tiêu dùng như
xe hơi, đồ điện tử áp dụng lý thuyết xác suất trong
thiết kế để giảm thiểu sự hỏng hóc.
Do bài giảng này chỉ xét các phép thử ngẫu nhiên,
nên ta gọi tắt chúng là phép thử.
• Phép thử ngẫu nhiên được ký hiệu bởi chữ T .
Mỗi kết quả của T được gọi là một bin c s
cp. Tập hợp tất cả các kết quả có thể xảy ra
của T được gọi là không gian mu của T và
được ký hiệu bởi chữ Ω.
Ví dụ
T = gieo một con xúc xắc và i = số chấm xuất hiện.
Không gian mẫu của T là
Ω = {1, 2, 3, 4, 5, 6}.
'2 BIẾN CỐ VÀ MỐI QUAN HỆ GIỮA CHÚNG
Khi gieo một con xúc xắc, sẽ ra số chấm lẻ nếu kết
quả là ra mặt có số chấm ∈ {1, 3, 5}. Như vậy, các
kết quả này thuận lợi cho sự kiện ra số chấm lẻ.
• Một bin c liên quan đến phép thử T là một sự
kiện mà việc nó xảy ra hay không xảy ra tùy
thuộc vào kết quả của T. Kết quả ω của T được
gọi là một kt qu thun l i cho bin c A nếu
A xảy ra khi kết quả của T là ω. Tập hợp các kết
quả thuận lợi cho A được ký hiệu là ΩA.
Ví dụ
A là biến cố “ra số chấm chẵn” khi gieo một con xúc
xắc , thì ΩA = {2, 4, 6}.
Chú ý
• Mỗi biến cố A tương ứng với một và chỉ một tập
con ΩA ⊂ Ω.
• Mỗi biến cố sơ cấp ω cũng là một biến cố, và đó
là biến cố mà Ωω = {ω}.
• Bin c không th
là biến cố không bao giờ xảy
ra khi thực hiện T. Nó tương ứng với tập ∅⊂ Ω
nên cũng được ký hiệu là ∅.
• Bin c chc chn là biến cố luôn luôn xảy ra
khi thực hiện T. Nó tương ứng với chính Ω nên
cũng được ký hiệu là Ω.
a) Quan hệ giữa các biến cố
• Biến cố A được gọi là kéo theo biến cố B, ký
hiệu A ⊂ B, nếu A xảy ra thì B cũng xảy ra.
Ta có ΩA ⊂ ΩB.
• Biến cố A được gọi là tưng đưng với biến
cố B, ký hiệu A = B, nếu A xảy ra thì B xảy ra
và ngược lại. Ta có ΩA = ΩB.
• Bin c đi của biến cố A, ký hiệu A, là biến
cố xảy ra khi và chỉ khi A không xảy ra. Ta có
AΩ = Ω \ ΩA.
Ví dụ
A là biến cố “ra số chấm chẵn” khi gieo một con xúc
xắc , thì A = “ra số chấm lẻ” và
AΩ = {1, 3, 5} = {1, 2, 3, 4, 5, 6} \ {2, 4, 6} = Ω \ ΩA .
b) Hợp của các biến cố
• Nếu A1, A2, …, An là các biến cố liên quan đến
cùng một phép thử, thì h p (hay tng) của
chúng, ký hiệu là A1∪A2∪ …∪An, là biến cố xảy
ra nếu có ít nhất một biến cố nào đó trong các
biến cố A1, A2, …, An xảy ra. Ta có
nn AAAAAA Ω∪∪Ω∪Ω=Ω ∪∪ K2121 ... .
c) Giao của các biến cố
• Nếu A1, A2, …, An là các biến cố liên quan đến
cùng một phép thử, thì giao (hay tích) của
chúng, ký hiệu là A1A2 …An, là biến cố xảy ra
nếu tất cả các biến cố A1, A2, …, An đều xảy ra.
Ta có
nn AAAAAA Ω∩∩Ω∩Ω=Ω K2121 ... .
• Hai biến cố A và B được gọi là xung khc nếu
AB = ∅.
Ví dụ
T = gieo một con xúc xắc cân đối và
Ai = "Ra i chấm",
A = "Ra số chấm chẵn",
B = "Ra số chấm chia hết cho 3".
Ta có
A = A2∪A4∪A6, B = A3∪A6,
AB = A6.
A1, A2, …, A6 đôi một xung khắc.
Chú ý
• A∪B =B∪A, AB =BA
• A∪A = A, AA = A
• A∪Ω = Ω, AΩ = A, A∪∅ = A, A∅ = ∅
• (A∪B)C = AC∪BC, AB∪C = (A∪C)(B∪C)
• AA =
• nn AAAAAA LL 2121 =∪∪∪
• nn AAAAAA ∪∪∪= LL 2121
Ngôn ngữ xác suất Ngôn ngữ tập hợp
Biến cố sơ cấp ω
Không gian mẫu Ω
Biến cố A ΩA
B.c A kéo theo b.c B ΩA ⊂ ΩB
B.c A, B tương đương ΩA = ΩB
Biến cố hợp A∪B ΩA ∪ ΩB
Biến cố giao AB ΩA ∩ ΩB
Các biến cố A, B xung khắc ΩA ∩ ΩB = ∅
'3 XÁC SUẤT CỦA MỘT BIẾN CỐ
Trong cuộc sống hàng ngày có những câu nói kiểu
như “Chiều nay có thể mưa”, “Giá vàng ngày mai có
thể giảm”, “Mua loại cổ phiếu này có thể thắng lợi”.
Đây chính là khẳng định về khả năng xảy ra của
biến cố. Toán học đã định lượng hóa các khả năng
này bằng cách gán cho mỗi biến cố một con số
thuộc [0; 1], gọi là xác sut ca bin c đó. Ký
hiệu xác suất của biến cố A là P(A).
a) Định nghĩa xác suất cổ điển
• Giả sử một phép thử T có tất cả n kết quả
đồng khả năng, trong đó m kết quả thuận lợi
cho biến cố A (tức là |Ω| = n, |ΩA| = m). Khi đó
P(A) =
n
m
.
Nói cách khác, P(A) bằng tỉ số của số kết quả thuận
lợi cho A trên số kết quả có thể xảy ra.
Ví dụ
T = gieo một con xúc xắc cân đối.
A = “Ra số chấm chẵn”,
B = “Ra số chấm chia hết cho 3”.
Ta có P(A) =
6
3
và P(B) =
6
2
.
Chú ý
Từ tính đối xứng của phép thử (đồng tiền cân đối,
con xúc xắc cân đối,…) ta suy ra các kết quả của
nó đồng khả năng.
b) Định nghĩa xác suất theo hình học
Bài toán Hai người hẹn gặp nhau tại một địa điểm
đã định trước trong khoảng thời gian từ 19 đến 20
giờ. Mỗi người có thể đến điểm hẹn một cách ngẫu
nhiên tại một thời điểm trong khoảng thời gian nói
trên và họ qui ước rằng người đến trước sẽ chỉ đợi
người đến sau trong vòng 10 phút. Tính xác suất để
hai người này có thể gặp nhau.
Phân tích Gọi x và y lần lượt là thời điểm (tính
bằng phút) người thứ nhất và người thứ hai đến
điểm hẹn. x và y thuộc [0; 60].
Ở đây phép thử là hành động hai người gặp nhau,
còn mỗi cặp thời điểm (x; y) là một kết quả. Trong
mặt phẳng (Oxy) tập hợp các cặp thời điểm này là
hình vuông Ω có cạnh bằng 60.
Biến cố A = “hai người gặp nhau” xảy ra khi và chỉ
khi |x – y| ≤ 10 hay x – 10 ≤ y ≤ x + 10.
Tập hợp các kết quả thuận lợi cho A được biểu
diễn bởi miền hình học ΩA gạch chéo.
Xác suất của biến cố A được tính theo định nghĩa
sau đây.
• Giả sử một phép thử T có vô hạn biến cố sơ
cấp đồng khả năng có thể biểu diễn như các
điểm của một miền hình học Ω nào đó, các
biến cố sơ cấp thuận lợi cho biến cố A được
biểu diễn như các điểm của miền hình học ΩA.
Khi đó
P(A) = độ đo của ΩA/độ đo của Ω.
Độ đo sẽ là độ dài, diện tích hay thể tích tùy theo
Ω là đoạn thẳng, miền phẳng hay khối không gian.
Trong bài toán trên
P(A) = 2
22
60
5060 −
=
36
11
.
c) Định nghĩa xác suất bằng tần suất
Việc tính: khả năng để một máy nào đó sản xuất
ra một phế phẩm, khả năng để doanh nghiệp đạt
được doanh số tối thiểu 50 triệu đ/tháng,…rõ ràng
phải dựa vào quan sát thực tế để giải quyết nên
không thể dùng hai định nghĩa trên.
• Giả sử phép thử T có thể được thực hiện lặp lại
rất nhiều lần trong những điều kiện giống hệt
nhau. Nếu trong n lần thực hiện T, biến cố A
xuất hiện m(A) lần thì tỉ số fn(A) =
n
Am )(
được
gọi là tn sut xut hin của biến cố A trong n
phép thử. Khi số phép thử n tăng ra vô hạn,
nếu fn(A) dần tới một con số p thì
P(A) = p.
Ví dụ
người gieo số lần gieo số lần sấp tần suất để sấp
Buffon 4040 2048 0.5069
Pearson 12000 6019 0.5016
Pearson 24000 12012 0.5005
Tần suất dần tới số 0.5
Ví dụ
Thống kê của Đacnon tại Pháp
năm 1806 1816 1836 1856 1903 1920
tần suất sinh con gái 0.485 0.484 0.485 0.487 0.488 0.489
Trên thực tế lấy P(A) ≈ fn(A) với n đủ lớn.
Ví dụ
Muốn xác định xác suất để một máy sản xuất ra
một phế phẩm, người ta theo dõi 100000 sản
phẩm do nó sản xuất và thấy có 138 phế phẩm.
Vậy xác suất cần tìm xấp xỉ bằng
100000
138
.
Trong 3 định nghĩa trên:
• 0 ≤ P(A) ≤ 1 ;
• P(∅) = 0, P(Ω) = 1 ;
• Nếu P(A) > P(B) thì khả năng xuất hiện
của A cao hơn khả năng xuất hiện của B.
d) Nguyên lý xác suất nhỏ
Qua thực nghiệm và quan sát thực tế, người ta
thấy rằng các biến cố có xác suất bé sẽ khó xảy ra
khi chỉ thực hiện một hay một vài phép thử. Chẳng
hạn việc một vé số trúng giải độc đắc là rất hiếm.
Từ đó người ta thừa nhận nguyên lý sau đây
Nguyên lý xác suất nhỏ: Nếu một biến cố có xác
suất rất nhỏ thì thực tế có thể cho rằng trong một
phép thử biến cố đó sẽ không xảy ra.
Tương tự như vậy, ta có
Nguyên lý xác suất lớn: Nếu một biến cố có xác
suất gần bằng 1 thì thực tế có thể cho rằng biến cố
đó sẽ xảy ra trong một phép thử.
Hai nguyên lý này được ứng dụng rộng rãi trong đời
sống khi xét sự tin cậy của khẳng định nào đó.
Ví dụ
Trong một lớp có 50 người, nhất định có các bạn
sinh nhật trùng nhau, bởi vì biến cố "Không có 2
người nào có ngày sinh giống nhau" có xác suất rất
bé (xấp xỉ 0,0295).
'4 CÁC QUY TẮC TÍNH XÁC SUẤT
a) Quy tắc cộng xác suất:
Nếu các biến cố A1, A2, …, An liên quan đến phép
thử T và xung khắc từng đôi một, thì
∑=
∪
==
n
i
ii
n
i
APAP
11
)( .
Ví dụ
Trong một lớp gồm 100 sinh viên có 60 em ở tỉnh X
còn 12 em ở tỉnh Y. Chọn ngẫu nhiên một em. Tính
xác suất để em này ở tỉnh X hoặc tỉnh Y.
Giải
A = “Em đó ở tỉnh X”, B = “Em đó ở tỉnh Y”.
A và B xung khắc, nên
P(A∪B) = P(A) + P(B) =
100
12
100
60
+ = 0, 72. ☺
b) Quy tắc cộng xác suất tổng quát:
Nếu các biến cố A1, A2, …, An liên quan đến phép
thử T, thì
( )
( ) ( ) ( ) ( ).nn
kji kjiji ji
n
i
ii
n
i
AAAPAAAPAAP
APAP
LL 21
1
11
1 −
<<<
==
−++∑+∑−
∑ −=
∪
c) Quy tắc chuyển sang biến cố đối
( ) ( )APAP −=1 .
Ví dụ
Theo thống kê trung bình một năm (365 ngày) có 60
ngày mưa thật to, 40 ngày gió thật lớn và 20 ngày
có bão (vừa mưa thật to, vừa gió thật lớn). Tính xác
suất để một ngày chọn ngẫu nhiên trong năm có
thời tiết bất thường.
Giải
A = “Ngày đó có mưa thật to”,
B = “Ngày đó có gió thật lớn”
⇒ AB = “Ngày đó có bão”.
P(A∪B) = P(A) + P(B) – P(AB)
=
365
80
365
20
365
40
365
60
=−+ . ☺
Ví dụ
Chọn ngẫu nhiên 3 người X, Y, Z. Tính xác suất để
trong đó có ít nhất 2 người có cùng ngày sinh nhật.
Giải
A = “Có ít nhất 2 người có cùng ngày sinh nhật” ⇒
A = “Cả 3 người đều có ngày sinh nhật khác nhau”.
Ký hiệu x, y, z tương ứng là ngày sinh nhật của X,
Y, Z thì mỗi (x, y, z) với 1≤ x, y, z ≤ 365 là một kết
quả.
Ta có |Ω| = 3653, AΩ = 365⋅364⋅363 nên
( ) ( )APAP −=1 = 0820
365
3633643651 3 ,=
⋅⋅
− . ☺
d) Xác suất có điều kiện
Có những biến cố mà sự xảy ra của chúng có ảnh
hưởng nhau.
Ví dụ Chọn ngẫu nhiên một gia đình có 3 con.
Tính xác suất để gia đình này có hai con trai trong
mỗi trường hợp sau:
i) Nếu không biết số con gái của gia đình này;
ii) Nếu được thông báo gia đình này có đứa con
cả là con gái.
Giải
A1 := “Gia đình đó có đứa con cả là con gái”.
A2 := “Gia đình đó có 2 con trai”,
Ω = {TTT, TTG, TGT, GTT, TGG, GTG, GGT, GGG},
2AΩ = {TTG, TGT, GTT},
nên P(A2) = 3/8.
Nếu biết rằng A1 đã xảy ra thì không gian mẫu bây
giờ thu hẹp lại chỉ còn là
{GTT, GTG, GGT, GGG} =
1AΩ .
Còn tập hợp các kết quả thuận lợi cho A2 là
{GTT} =
21AAΩ .
Vậy đáp số của ii) bằng
4
1
1
21
=
Ω
Ω
||
||
A
AA
. ☺
Trong bài toán này ta thấy rằng khả năng để gia
đình đó có hai con trai phụ thuộc vào việc biết biến
cố A1 đã xảy ra hay chưa. Điều này dẫn tới khái
niệm xác sut có điu kin. Nhưng nên định nghĩa
xác suất có điều kiện như thế nào ?
Xem lại lời giải của ii) ta có
( )
( )1
21
1
21
1
21
4
1
AP
AAP
A
AA
A
AA
=
Ω
Ω
Ω
Ω
=
Ω
Ω
= ||
||
.
Nhận xét này cho phép ta định nghĩa xác suất có
điều kiện như sau
• Nếu P(A1)>0 thì xác suất có điều kiện của A2
khi A1 đã xảy ra, ký hiệu là ( )12 AAP / , được cho
bởi
( ) ( )( )1
21
12 AP
AAPAAP =/ .
Chú ý Xác suất có điều kiện có thể tính trực tiếp từ
bối cảnh bài toán mà không cần thông qua công
thức trên.
Ví dụ
Gieo đồng thời 2 con xúc xắc cân đối. Tính xác suất
để tổng số nốt trên 2 con là 7, biết rằng có ít nhất
một con ra mặt 5.
Giải
Cách 1
Không gian mẫu thu gọn bao gồm 11 biến cố sơ
cấp có ít nhất một con ra mặt 5 là:
(i, 5) với i∈{1, 2, 3, 4, 5, 6} và
(5, j) với j∈{1, 2, 3, 4, 6}.
Trong tập này có 2 trường hợp mà tổng bằng 7.
⇒
11
2
=P .
Cách 2
A = “Ít nhất một con ra 5”,
B = “Tổng số chấm trên hai con bằng 7”.
|Ω| = 62, AΩ = {(i, j)| i và j ∈ {1, 2, 3, 4, 6}}.
ΩAB = {(2, 5), (5, 2)}
⇒P(A) = ( )AP−1 =
36
11
6
51
2
=
− và P(AB)
36
2
=
⇒ ( ) ( )( ) 11
2
==
AP
ABPABP / . ☺
e) Quy tắc nhân xác suất
Từ Định nghĩa Xác suất có điều kiện của A2 khi A1
(P(A1) > 0) đã xảy ra:
( ) ( )( )1
21
12 AP
AAPAAP =/ ,
ta suy ra
Quy tắc nhân xác suất
Nếu P(A1) > 0, thì P(A1A2) = P(A1)P(A2/A1).
Mở rộng công thức P(A1A2) = P(A1)P(A2/A1) cho n
biến cố, ta có
Quy tắc nhân xác suất tổng quát
Nếu P(A1A2⋅⋅⋅An-1) > 0 (n>1), thì
P(A1A2⋅⋅⋅An) =
P(A1)P(A2/A1)P(A3/A1A2)⋅⋅⋅P(An/A1A2⋅⋅⋅An-1).
Chứng minh
Từ A1A2⋅⋅⋅An-1⊂ A1A2⋅⋅⋅An-2 ⊂ ⋅⋅⋅⊂ A1 ta có ( ) ( ) ( )12211210 APAAAPAAAP nn ≤≤≤< −− KLL .
Vì vậy, ta có thể áp dụng công thức tính xác suất có
điều kiện để có:
P(A2/A1) = P(A1A2) / P(A1)
P(A3/A1A2) = P(A1A2A3) / P(A1A2)
……………………………………..
P(An-1/A1A2⋅⋅⋅An-2) = P(A1A2⋅⋅⋅An-1) / P(A1A2⋅⋅⋅An-2)
P(An/A1A2⋅⋅⋅An-1) = P(A1A2⋅⋅⋅An) / P(A1A2⋅⋅⋅An-1)
Từ đây ta suy ra
P(A2/A1)P(A3/A1A2)⋅⋅⋅P(An/A1A2⋅⋅⋅An-1)
= P(A1A2⋅⋅⋅An) / P(A1).
Nhân hai vế với P(A1) ta có Công thức nhân xác
suất tổng quát. ☺
Ví dụ
Một lô hàng gồm 100 sản phẩm, trong đó có 10 phế
phẩm. Rút ngẫu nhiên lần lượt 4 sản phẩm theo
kiểu mỗi lần rút không hoàn lại và kiểm tra. Nếu tất
cả 4 sản phẩm này đều tốt thì lô hàng được nhận.
Tìm xác suất để lô hàng này được nhận.
Giải
H = “Lô hàng được nhận”,
Ai = “Sản phẩm rút ở lần thứ i là tốt”, (i = 1, 2, 3, 4)
H = A1A2A3A4 ⇒
P(H) = P(A1A2A3A4)
= P(A1)P(A2/A1)P(A3/A1A2)P(A4/A1A2A3)
=
97
87
98
88
99
89
100
90
⋅⋅⋅ ≈ 0,6516. ☺