Bài giảng Lý thuyết xác suất và thống kê toán - Phần II: Thống kê toán - Chương 7: Ước lượng các số đặc trưng của tổng thể - Trường Đại học Kinh tế TP. Hồ Chí Minh
5- Xác định độ tin cậy
Khi tìm ước lượng khoảng của
(hoặc p), với kích thước mẫu (n) và
độ chính xác cho trước thì độ tin
cậy của ước lượng khoảng sẽ đạt
được bao nhiêu %?
77 trang |
Chia sẻ: thucuc2301 | Lượt xem: 773 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Lý thuyết xác suất và thống kê toán - Phần II: Thống kê toán - Chương 7: Ước lượng các số đặc trưng của tổng thể - Trường Đại học Kinh tế TP. Hồ Chí Minh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 7
ƯỚC LƯỢNG CÁC SỐ
ĐẶC TRƯNG CỦA
TỔNG THỂ
Các số đặc trưng của tổng thể như
trung bình tổng thể, tỷ lệ tổng thể,
phương sai của tổng thể, . . . được
sử dụng rất nhiều trong phân tích
kinh tế - xã hội và các lĩnh vực
khác.
Nhưng các số đặc trưng này
thường là chưa biết. Vì vậy đặt
ra vấn đề cần ước lượng chúng
bằng phương pháp mẫu.
Chúng ta có thể nêu vấn đề thực
tế đó dưới dạng toán học như
sau:
Cho đại lượng ngẫu nhiên X có thể
đã biết hoặc chưa biết phân phối
xác suất và chưa biết tham số nào
đó của X. Hãy ước lượng bằng
phương pháp mẫu.
Vì là một hằng số nên ta có thể
dùng một con số để ước lượng .
Ước lượng như vậy được gọi là
ước lượng điểm
Ngoài ước lượng điểm, ta còn
dùng ước lượng khoảng. Tức là
chỉ ra một khoảng số (1, 2) có
thể chứa được .
1- Mô tả phương pháp:
Giả sử cần ước lượng tham số
của đ.l.n.n X. Từ X ta lập mẫu
ngẫu nhiên kích thước n:
WX = (X1, X2, , . . . , Xn)
Chọn
I- PHƯƠNG PHÁP HÀM ƯỚC LƯỢNG
= f(X1, X2, . . . , Xn)
được gọi là hàm ước lượng của ˆ
ˆ
Trong thực tế người ta thường
chọn hàm ước lượng như sau:
ª Chọn = nếu là ước
lượng trung bình của tổng thể
ˆ
n
1i
iX
n
1
X
ª Chọn = S2 =
nếu là ước lượng phương sai của
tổng thể
ˆ
n
1i
2
i )XX(
1n
1
ª Chọn = F = nếu là ước
lượng tỷ lệ tổng thể
ˆ
n
1i
iX
n
1
= f(x1, x2, . . . , xn)
*ˆ
Ước lượng điểm của chính là
giá trị vừa tính được.*ˆ
Tức là:
Từ mẫu cụ thể Wx = (x1, x2,..., xn),
ta tính giá trị của (ký hiệu là ).ˆ *ˆ
được gọi là ước lượng không
chệch của tham số nếu:
ˆ
)ˆ(E
Ngược lại, nếu thì là
ước lượng chệch của tham số
)ˆ(E
2 -Ước lượng không chệch
* Định nghĩa:
* Thí dụ:
ª Trung bình mẫu ngẫu nhiên ( ) là
ước lượng không chệch của trung
bình tổng thể () vì E( ) =
X
X
* Ý nghĩa:
Ứớc lượng không chệch là ước
lượng có sai số trung bình bằng 0.
ª Phương sai mẫu ngẫu nhiên (S2)
là ước lượng không chệch của
phương sai tổng thể (2) vì:
E(S2) = 2
ª Tỷ lệ mẫu ngẫu nhiên (F) là ước
lượng không chệch của tỷ lệ tổng
thể (p) vì E(Fn) = p
(phương pháp ước lượng khoảng)
Phương pháp khoảng tin cậy dùng
một khoảng số để ước lượng .
II- PHƯƠNG PHÁP KHOẢNG TIN CẬY
Phương pháp này được nhà toán học
Pháp P.S. Laplace ng/c (1841) và được
hoàn thiện bởi nhà thống kê Mỹ J.
Neyman (1937).
1 - Mô tả phương pháp khoảng
tin cậy
Để ước lượng tham số của đ.l.n.n
X, từ X ta lập mẫu ngẫu nhiên WX
= (X1, X2, . . . , Xn).
Chọn thống kê:
= f(X1, X2, . . . , Xn)
Sao cho: mặc dù chưa biết giá trị
của nhưng phân phối xác suất
của được xác định.
ˆ
ˆ
Do đó với xác suất khá bé (
≤ 0,05) ta có thể tìm được 2 số a, b
sao cho:
P(a ≤ ≤ b) = 1- (6.1)ˆ
Nếu từ biểu thức (6.1) ta giải ra
được . Tức ta đưa biểu thức (6.1)
về dạng:
1)ˆˆ(P 21
Khoảng gọi là khoảng tin cậy
của .
21 ˆ,ˆ
Vì , là các ĐLNN nên khoảng
là khoảng ngẫu nhiên.
1
ˆ 2ˆ
21 ˆ,ˆ
1- gọi là độ tin cậy (hệ số tin
cậy) của ước lượng.
Trong thực tế người ta thường
yêu cầu 1- 95% để có thể sử
dụng nguyên lý xác suất lớn cho
biến cố:
)ˆˆ( 21
gọi là độ dài khoảng
tin cậy
l có thể là hằng số và cũng có thể
là ĐLNN.
12
ˆˆl
= l/2 gọi là độ chính xác của ước
lượng khoảng.
Do xác suất 1- khá lớn nên theo
nguyên lý xác suất lớn ta có thể
coi biến cố:
Hầu như chắc chắn xảy ra trong
một phép thử
)ˆˆ( 21
Thực hiện một phép thử đối với
mẫu ngẫu nhiên WX, ta sẽ thu
được mẫu cụ thể. Từ mẫu cụ thể
này ta sẽ tính được giá trị của ,
Ký hiệu các giá trị đó tương ứng
là
1ˆ 2ˆ
*
2
*
1
ˆ,ˆ
Như vậy có thể kết luận:
Với độ tin cậy 1-, qua mẫu cụ thể
Wx, nằm trong khoảng
Tức là:
)ˆ,ˆ( *2
*
1
)ˆˆ( *2
*
1
Phương pháp này có ưu điểm là:
Chẳng những tìm được khoảng
để ước lượng mà còn cho
biết độ tin cậy của ước lượng.
)ˆ,ˆ( *
2
*
1
Tuy nhiên phương pháp này cũng
chứa đựng khả năng mắc phải sai
lầm. Xác suất mắc phải sai lầm là
.
2 - Ước lượng trung bình tổng thể
Giả sử trung bình của tổng thể là
chưa biết, ta cần ước lượng với
độ tin cậy 1 .
Lập mẫu ngẫu nhiên
WX = (X1, X2, . . . . , Xn)
và xét các trường hợp sau:
Trường hợp kích thước mẫu
n 30 (hoặc n < 30 nhưng X có
phân phối chuẩn); 2 đã biết
Xét đại lượng ngẫu nhiên
Z =
n/
X
Z có phân phối xấp xỉ với phân
phối N(0, 1) khi n khá lớn.
Trường hợp n < 30 thì do giả
thiết X có phân phối chuẩn nên Z
có phân phối N(0, 1)
Với xác xuất khá bé ta tìm được
một số z/2 thỏa mãn: z/2 > 0 và
P(Z > z/2) = (*)
Thay biểu thức của Z vào (*) và
sau một số biến đổi, ta được:
P( ) = 1
Vậy với độ tin cậy 1 , khoảng tin
cậy của là:
n
zX;
n
zX 2/2/
n
zX
n
zX 2/2/
Ký hiệu: = z/2
n
được gọi là độ chính xác của
ước lượng khoảng.
Khi đó ta có thể viết:
P( < < + ) = 1XX
( ; + ) được gọi là khoảng
tin cậy đối xứng của .
XX
Ứng với độ tin cậy 1, khoảng tin
cậy đối xứng có độ dài ngắn nhất.
Vì vậy khi cần tìm khoảng tin cậy,
thông thường ta chỉ cần tìm
khoảng tin cậy đối xứng.
Ngoài khoảng tin cậy đối xứng ta
cũng có thể tìm khoảng tin cậy
phía bên trái:
n
zX
hoặc khoảng tin cậy phía bên
phải:
n
zX
Giá trị x + z được dùng
để ước lượng chặn trên của .
n
Giá trị x - z được dùng
để ước lượng chặn dưới của .
n
Vì độ tin cậy 1 khá lớn, nên
theo nguyên lý xác suất lớn ta có
thể coi biến cố ( < < + )
hầu như chắc chắn xảy ra trong
một phép thử. Thực hiện một
phép thử đối với mẫu ngẫu nhiên
WX, ta sẽ thu được mẫu cụ thể:
Wx = (x1, x2, . . . , xn)
XX
Từ mẫu cụ thể ta tính được:
n
1i
ix
n
1
x
Với độ tin cậy 1 cho trước,
tra bảng hàm Laplace để tìm giá
trị z/2.
z/2 là giá trị của đại lượng ngẫu
nhiên Z N(0, 1) thỏa mãn điều
kiện: z/2 > 0 và P( Z > z/2) = /2
(z/2) =
1 -
2
Hay:
Minh họa z/2 trên đồ thị:
Một số giá trị Z và Z/2
với 1- thông dụng
Chú ý:
Có thể dùng hàm:
NORMSINV(1-/2)
trong Excel để tìm trị z/2.
Thí dụ: Với độ tin cậy 98% thì:
z/2 = z0,01 = NORMSINV(0,99)
= 2,326348 2,326
Với độ tin cậy 1 , qua mẫu cụ
thể Wx, ước lượng khoảng của
là:
(x - < < x + )
Trong đó: = z/2
n
Trường hợp này, vì kích thước
mẫu lớn (n > 30) nên ta có thể
dùng ước lượng của Var(X) là S2
để thay cho 2 (chưa biết)
Trường hợp n 30; 2 chưa biết
Tiến hành các bước tương tự như
trường hợp 1, ta được ước lượng
khoảng của (với độ tin cậy
1 ) là:
(x - < < x + )
Trong đó: = z/2
n
s
Trường hợp n < 30; 2 chưa
biết; X có phân phối chuẩn.
Trường hợp này ta xét đại lượng
ngẫu nhiên:
T =
n/S
X
T có phân phối Student với bậc tự
do là (n 1).
Xác định khoảng tin cậy của
theo công thức:
Trong đó:
= t/2
n
s
(x - < < x + )
Trong đó t/2 là giá trị của đại
lượng ngẫu nhiên T có phân phối
Student với n1 bậc tự do thoả
mãn điều kiện: t/2 > 0 và
P(T > t/2) = /2
Để tìm t/2 có thể tra bảng hoặc
dùng hàm TINV trong Excel.
Thí dụ 1:
Điều tra năng suất lúa trên diện
tích 100 héc ta trồng lúa của một
vùng, người ta tính được: x = 56
tạ/ha; s = 3,3.
Hãy ước lượng năng suất lúa
trung bình của toàn vùng với độ
tin cậy 95%.
Giải: Gọi là năng suất lúa trung
bình của toàn vùng. Ta cần ước
lượng với độ tin cậy 95%.
Vì n = 100 > 30; 2 chưa biết, nên
khoảng tin cậy của là:
(x - < < x + )
Độ tin cậy 1 = 95%, tra bảng
ta được: z/2 = z0,025 = 1,96
Vậy khoảng tin cậy của là:
(56 0,65 ; 56 + 0,65)
Hay:
65,06468,0
10
3,3
96,1
(55,35 < < 56,65) tạ/ha
Thí dụ 2: Theo dõi mức nguyên
liệu hao phí để sản xuất một đơn
vị sản phẩm người ta thu được
các số liệu cho ở bảng sau:
Mức ng/liệu
hao phí (xi - gr)
Số sản phẩm
19 – 19,5
19,5 – 20
20 – 20,5
20,5 – 21
2
10
8
5
Ước lượng mức hao phí nguyên
liệu trung bình để sản xuất một
đơn vị sản phẩm với độ tin cậy
1 = 95%. Giả thiết mức hao
phí nguyên liệu để sản xuất một
đơn vị sản phẩm là đ.l.n.n có
phân phối chuẩn.
Giải: Gọi mức nguyên liệu hao phí
trung bình để sản xuất một đơn vị
sản phẩm là . Ta cần ước lượng
với độ tin cậy 95%.
n = 25 < 30 ; 2 chưa biết.
x = 20,07 ; s = 0,4537
Với độ tin cậy 1 = 95% , tra
bảng phân phối Student với bậc tự
do
n 1 = 25 1 = 24
ta được:
t0,025 = 2,064
Vậy:
= 2,064 0,187
25
4537,0
Khoảng tin cậy của là:
(20,07 0,187 ; 20,07 + 0,187)
Hay:
(19,883 < < 20,257) gr
3- Ước lượng tỷ lệ của tổng thể
Giả sử tỷ lệ tổng thể (p) chưa
biết, ta cần ước lượng p với độ tin
cậy 1 -
Để cho việc giải bài toán được đơn
giản, ta thường yêu cầu kích thước
mẫu n khá lớn để có thể sử dụng
định lý Lindeberg - Levy.
Theo định lý Lindeberg - Levy,
đại lượng ngẫu nhiên:
Z =
n/pq
pF
có phân phối xấp xỉ N(0, 1)
Do n khá lớn nên ta có thể thay pq
bằng F (1 F).
Áp dụng phương pháp đã nêu ở
phần 2 ta có ước lượng khoảng
của p là:
Trong đó: = z/2 n
)f1(f
(f - < p < f + )
Thí dụ: Để ng/c nhu cầu tiêu dùng
của một loại hàng ở một thành phố,
người ta tiến hành điều tra nhu cầu
tiêu dùng về mặt hàng này ở 100 hộ
thì thấy có 60 hộ có nhu cầu về loại
hàng đó. Hãy ước lượng tỷ lệ hộ có
nhu cầu về mặt hàng này của thành
phố với độ tin cậy 95%.
Giải:
Gọi tỷ lệ gia đình có nhu cầu về
mặt hàng này là p (p chưa biết). Ta
cần ước lượng p với độ tin cậy
95%.
Theo giả thiết của bài toán ta có:
Tỷ lệ gia đình có nhu cầu về mặt
hàng này của mẫu là:
6,0
100
60
f
1 = 0,95 z/2 = 1,96
= 1,96 = 0,096100
)6,01(6,0
Vậy khoảng tin cậy của p (với độ
tin cậy 95%) là:
(0,6 0,096 ; 0,6 + 0,096)
(50,4% < p < 69,6%)
4- Xác định kích thước mẫu
Vấn đề đặt ra là: khi ước lượng
(hoặc p), ta muốn độ tin cậy 1
và độ chính xác đạt được ở một
mức nào đó cho trước thì cần kích
thước mẫu (n) tối thiểu là bao
nhiêu ?
a- Nếu biết Var(X) = 2
Từ công thức: = z/2
n
suy ra:
1- Xác định kích thước mẫu khi
ước lượng trung bình tổng thể
2
2/zn
b- Nếu chưa biết 2 , khi đó ta căn
cứ vào mẫu đã cho (nếu chưa có
mẫu thì ta có thể tiến hành lấy
mẫu với kích thước n1 30) để tính
s. Từ đó tính n theo công thức:
2
2/
s
zn
* Chú ý: Nếu bài toán thực tế đòi
hỏi n phải là số nguyên nhưng khi
tính n theo các công thức trên ta
thường được kết quả là số không
nguyên, khi đó ta lấy phần nguyên
của kết quả cộng với 1.
Thí dụ: Khảo sát thu nhập của 100
người của một ngành, người ta tính
được: s = 1,94936. Nếu muốn ước
lượng thu nhập trung bình của một
người ở ngành này với độ tin cậy
98% và độ chính xác = 0,4 triệu
đ/tháng thì cần khảo sát thu nhập
của bao nhiêu người?
Giải: Ta cần xác định kích thước
mẫu (n) khi ước lượng trung bình
tổng thể với độ tin cậy 98% và độ
chính xác = 0,4.
Với 1- = 98% thì z0,01= 2,326.
Vậy:
129
4,0
94936,1
326,2n
2
2- Xác định kích thước mẫu khi ước
lượng tỷ lệ tổng thể
= z/2
ta suy ra:
n = (z/2)
2
Nếu biết f , từ công thức:
n
)f1(f
2
)f1(f
Nếu không biết f, từ công thức:
= z/2
suy ra:
n =
n
pq
2
2
2/
4
)z(
5- Xác định độ tin cậy
Khi tìm ước lượng khoảng của
(hoặc p), với kích thước mẫu (n) và
độ chính xác cho trước thì độ tin
cậy của ước lượng khoảng sẽ đạt
được bao nhiêu %?
Từ công thức:
= z/2
suy ra:
z/2 =
1- Xác định độ tin cậy khi ước
lượng trung bình tổng thể
n
s
s
n
Sau khi tính được z/2 ta tra bảng
hàm Laplace để tìm (z/2)
Độ tin cậy 1 được xác định
theo công thức:
1 = 2(z/2)
2- Xác định độ tin cậy khi ước
lượng tỷ lệ tổng thể
= z/2
suy ra:
z/2 =
Từ công thức:
n
)f1(f
)f1(f
n
Độ tin cậy được xác định theo
công thức:
1 = 2(z/2)
Như vậy, trong 3 tham số: n ; ; z/2.
nếu ta biết được hai tham số thì có
thể tính được tham số còn lại (công
thức tính suy ra từ công thức tính
trong các bài toán ước lượng).
TÓM TẮT CHƯƠNG 7
Ước lượng điểm Ước lượng khoảng
Khái
niệm
Ước
lượng
không
chệch
Ưl k/chệch của
Ưl k/chệch của 2
Khái
niệm
Ước lượng
Ước lượng p
Xác định n
Xác định 1-
Ưl
Ưl
Ưl p
Ưl pƯl k/chệch của p
Biết
2
Chưa
Biết 2
n 30
Chưa
Biết 2
n < 30
Bài tập
7.6; 7.7; 7.8; 7.17
7.18; 7.19; 7.26.
Hết chương 7
Các file đính kèm theo tài liệu này:
- bai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_gv_bui_thi_le_thuychg_7_2908_2005574.pdf