Bài giảng kinh tế lượng Ứng Dụng
CHƯƠNG 1
XÁC SUẤT
CHƯƠNG 2
THỐNG KÊ
CHƯƠNG 3
BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
CHƯƠNG 4
LẤY MẪU VÀ PHÂN PHỐI MẪU
CHƯƠNG 5 ƯỚC LƯỢNG CÁC THAM SỐ THỐNG KÊ
Chương 6
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CHƯƠNG 7
TƯƠNG QUAN & HỒI QUI TUYẾN TÍNH
Chương 8: PHÂN TÍCH CHUỖI TUẦN TỰ THEO THỜI
GIAN VÀ DỰ BÁO
8 trang |
Chia sẻ: aloso | Lượt xem: 2247 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Bài giảng kinh tế lượng Ứng Dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Gv. Cao Hào Thi
CHƯƠNG 4
LẤY MẪU VÀ PHÂN PHỐI MẪU
(Sampling and Sampling Distribution)
4.1. LẤY MẪU TỪ TẬP HỢP CHÍNH (Sampling from a Population)
4.1.1. Tập hợp chính (Population)
Tập hợp chính là tập hợp tất cả các đối tương mà ta quan tâm nghiên cứu trong một vấn
đề nào đó. Số phần tử của tập hợp chính được ký hiệu là N.
• Nếu N là số hữu hạn ta có tập hợp chính hữu hạn (finite population)
• Nếu N là số vô hạn ta có tập hợp chính vô hạn (infinite population)
4.1.2. Mẫu (Sample)
Mẫu là tập hợp con của tập hợp chính. Số phần tử của mẫu đã ký hiệu là n và được gọi
là cỡ mẫu.
4.1.3. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
Đó là cách chọn n phần tử từ tập hợp chính gồm N phần tử sao mỗi tổ hợp trong nNC tổ
hợp đều có cùng khả năng được chọn như nhau. Kết quả của việc chọn này cho ta các
mẫu ngẫu nhiên (random sample).
Việc lấy mẫu ngẫu nhiên có thể tiến hành theo cách lấy mẫu không hoàn trả lại
(sampling without replacement) hay theo cách lấy mẫu có hoàn trả lại (sampling with
replacement).
4.1.4. Phân phối mẫu (Sampling Distribution)
Các mẫu đều có các đặc trưng thống kê của mẫu như số trung bình X, phuơng sai 2xS .
Phân phối xác suất của các đặc trưng thống kê của mẫu được gọi là phân phối mẫu.
Trong chương này ta khảo sát phân phối mẫu của X , 2xS .
Suy diễn thống kê (Statistic Inference)
Dựa vào các đặc trưng thống kê của mẫu ta có thể suy rộng ra cho các đặc trưng thống
kê của tập hợp chính.
4.2. PHÂN PHỐI MẪU CỦA SỐ TRUNG BÌNH CỦA MẪU X (Sampling Distribution
of the Sample Mean)
Phân phối mẫu của số trung bình của mẫu là phân phối xác suất của đại lượng X
4.2.1. Kỳ vọng của số trung bình mẫu E ( X )
Giả sử tập hợp chính có N phân tử, có trung bình là µx và phương sai là 2xσ . Ta có:
Gv. Cao Hào Thi 2
N
X
N
i
i
x
∑
=µ =1
N
)X(
N
i
i
x
∑ µ−
=σ =1
2
2
Gọi X1, X2 ... Xn là mẫu ngẫu nhiên có cỡ mẫu là n, được chọn từ tập hợp chính. Số
trung bình của mẫu là :
∑= iXnX
1
• Kỳ vọng của số trung bình mẫu của số trung bình mẫu E ( X ) là giá trị trung bình
của tập hợp chính µx. Nói cách khác, phân phối mẫu của X có số trung bình là µx.
E( X ) = µx
Thí dụ:
Giả sử tập hợp chính gồm 5 học sinh có số tuổi là 2, 4, 6, 8 và 10. Trong trường hợp này
số trung bình của tập hợp chính sẽ là
µx = 1/5(2+4+6+8+10) = 6
Giả sử lấy mẫu ngẫu nhiên không hoàn lại với cỡ mẫu là 2. Ta sẽ có 25C = 10 mẫu khác
nhau (với cỡ mẫu là 2). Và mỗi mẫu sẽ có số trung bình của mẫu X như sau :
Sample 2,4 2,6 2,8 2,10 4,6 4,8 4,10 6,8 6,10 8,10
X 3 4 5 6 5 6 7 7 8 9
Phân phối mẫu của số trung bình X là :
(Phân phối xác suất của đặc trưng thống kê của mẫu X
Sample 3 4 5 6 7 8 9 10
X 0.1 0.1 0.2 0.2 0.2 0.1 0.1 0.1
Kỳ vọng của X
E( X ) = ΣX * p( X )
= 3 * 0.1 + 4 * 0.1 + 5 * 0.2 + 6 * 0.2 + 7 * 0.2 + 8 * 0.1 + 9 * 0.1
E( X ) = 6 = µx
4.2.2. Phương sai của số trung bình mẫu ( 2Xσ )
Trường hợp tập hợp chính vô hạn (Infinite Polulation)
Phương sai của số trung bình mẫu X được ký hiệu là σ2x
Gv. Cao Hào Thi 3
Var ( X ) = σ2x = nxσ
2
Đúng khi n < N
Với σ2x là phương sai của tập hợp chính, n là cỡ mẫu.
Var ( X ) = σ2x = )( 1N
nN
n
2
x
−
−σ
Trường hợp tập hợp chính hữu hạn (Finite Population)
Thí dụ:
Tính phương sai của X trong thí dụ trên
Phương sai của tập hợp chính
σ2x = E[(Xi - µx)² = Σ(xi - µx)² * P(Xi) µx = 6; P(Xi) = 1/5
= 1/5[(2-6)² + (4 - 6)² + (6 -6 )² + (8-6)² + (10 - 6)²]
σ2x = 8
Phương sai của X tính từ định nghĩa
Var ( X ) = E [( X - E( X ))2] = E [( X - 6)2] vì E ( X ) = µx = 6
= [(3-6)2 * 0.1 + (4-6)2 * 0.1 + (5-6)2 * 0.2 + (6-6)2 * 0.2 + (7-6)2 * 0.2
+( 8-6)2 * 0.1 + (9-6)2 * 0.1]
Var ( X ) = σ2x = 3
Nếu áp dụng công thức :
Var ( X ) = 3
15
25
2
8
1N
nN
n
2
x2
X =−
−=−
−σ=σ **
4.2.3. Độ lệch chuẩn của số trung bình mẫu ( Xσ )
Độ lệch chuẩn của X được ký hiệu ( Xσ )
σ σ σx x xn= =
2 Đối với tập hợp chính vô hạn
hay
1N
nN
n
xx −
−σ=σ * Đối với tập hợp chính hữu hạn
xσ được xem như sai số chuẩn (Standard Error) của số trung bình mẫu X .
4.2.4. Lấy mẫu từ tập hợp chính tuân theo phân phối chuẩn (Sampling From Normal
Population)
Luật phân phối của số trung bình mẫu X
Gv. Cao Hào Thi 4
Nếu tập hợp chính của biến X tuân theo phân phối chuẩn với số trung bình là µx và
phương sai σx thì số trung bình mẫu X sẽ tuân theo phân phối chuẩn với số trung trình
là µx và phương sai là n2x /σ .
X ~ X N 2xX ==>σµ ),( ~ N nX
X( , )µ σ
2
4.2.5. Chuẩn hóa số trung bình mẫu X
Đặt : Z X X
X
= − µσ
Nếu X có số trung bình là µx và phương sai là σ2X thì Z có số trung bình là 0 và
phương sai là 1.
Nếu ( ) ( )102 ,N~Z ,N~X Xx ==>σµ
4.2.6. Định lý giới hạn trung tâm (Central Limit Theorem)
Khi n lớn thì
n
X
Z
X
X
σ
µ−= sẽ gần đúng có phân phối chuẩn chuẩn hóa hay X có phân
phối chuẩn với số trung bình hoá là µx phương sai nx
2σ
Khi n lớn ==> Z ~ N(0, 1) hay X N
nX
X~ ,µ σ
2
Thí dụ :
Chiều dài của các cây thước kẻ trong dây chuyền sản xuất thước tuân theo phân phối
chuẩn với µ = 30cm. Độ lệch chuẩn xung quanh số trung trung bình là δ = 0.1cm. Nhân
viên thanh tra lấy mẫu với cỡ mẫ n = 4 và nhận thấy số trung bình của mẫu là X =
29875cm.
Tìm xác suất để số trung bình của mẫu nhỏ hơn hoặc bằng 29875cm.
Giải :
( )
−≤
−=〈
4
0.1
3029875
n
30X P 29875 XP
= P (Z ≤ - 350)
= 0.062
Thí dụ :
Một nhà sản xuất phụ tùng xe ôtô cho biết tuổi thọ của phụ tùng xe tuân theo luật phân
phối chuẩn với số trung bình là 36,000 dặm và độ lệch chuẩn là 4,000 dặm. Đối với một
Gv. Cao Hào Thi 5
mẫu được chọn một cách ngẫu nhiên với cỡ mẫu là 16 thì tuổi thọ trung bình của mẫu là
34,500 dặm. Nếu nhà sản xuất nói đúng thì xác suất để số trung bình mẫu nhỏ hơn hoặc
bằng giá trị của mẫu đã đo là bao nhiêu.
Giải :
( )
−〈σ
µ−=〈
16
4000
0003650034
50034
,,
X
P , X P
X
X
= P (Z < -1.5)
= 0.0668
Thí dụ:
Giả sử tập họp chính tuân theo phân phối chuẩn với số trung bình là 40 và phương sai là
100.
Phân phối xác suất chuẩn với µ = 40, σ 2 = 100
Lấy 1,000 mẫu ngẫu nhiên với cỡ mẫu 5. Gọi X là số trung bình của mẫu. X tuân theo
phân phối với số trung bình là µ = 40 phương sai σ
2 100
5
20
n
= = .
Lấy 1,000 mẫu ngẫu nhiên với cỡ mẫu 10. Gọi là số trung bình của mẫu. X tuân theo
phân phối với số trung bình là µ = 40, phương sai σ
2 100
10
10
n
= = .
XF ( X )
60 40
Phân phối mẫu của X
20
N = 10
60 Giá trị của biến X 20 40
fx(x)
N = 5
X
Gv. Cao Hào Thi 6
Nhận xét :
Phương sai của phân phối mẫu sẽ giảm khi cỡ mẫu tăng.
4.3. PHÂN PHỐI MẪU CỦA PHƯƠNG SAI MẪU 2xS .
(Sampling Distribution Of The Sample Variance)
Phân phối mẫu của phương sai mẫu là phân phối xác suất của phương sai mẫu 2xS .
4.3.1. Kỳ vọng của phương sai mẫu E ( 2xS )
Phương sai mẫu ký hiệu là S2x.
( )2n
1I
2
X XX1N
1S
i
∑ −−= =
Kỳ vọng của phương sai mẫu E(S2x) chính là phương sai của tập hợp chính 2Xδ . Nói cách
khác, phân phối mẫu của ( 2xS ) có số trung bình là
2
Xσ .
E( 2xS ) =
2
Xσ Điều kiện : n < < N
4.3.2. Phương sai của phương sai mẫu
Phương sai của phương sai mẫu được ký hiệu Var( 2xS ).
Var( 2xS ) tùy thuộc vào luật phân phối của tập hợp chính. Nếu tập hợp chính tuân theo
phân phối chuẩn thì
( )
1n
2SVar
4
X2
X −
σ=
4.3.3. Phân phối χ2 (Chi - squared Distribution)
Biến ngẫu nhiên X2 tuân theo luật phân phối χ2 có độ tự do là ν (degree of freedom) nếu
hàm mật độ xác suất của X2 có dạng
≤
>
νΓ=
−−
ν
0 x nếu 0
0 x nếu e
2
x
2
2
1
xf
2
x122
2
X
2
2
*
)(
Gv. Cao Hào Thi 7
Ghi chú :
Người ta lập bảng tính sẵn các giá trị diện tích P(x², ν)
• Biến ngẫu nhiên X tuân theo luật phân phối χ2 với độ tự do là ν được ký hiệu.
X² ~ χ2v
4.3.4. Luật phân phối của 2
x
2
xS1n
σ
− )(
= χ²n-1
Ta có:
X²n-1= 2
x
2
xS1n
σ
− )(
=
2X
n
1i
2
i XX
σ
∑ −
=
)(
Nếu tập hợp chính tuân theo luật phân phối chuẩn thì 2
x
2
xS1n
σ
− )(
tuân theo luật phân
phối χ² với độ tự do là (n-1)
X ~ N(µx, 2xσ ) => 2
x
2
xS1n
σ
− )(
~ χ²n-1
Thí dụ :
Một nhà sản xuất sữa hộp muốn trọng lượng trung bình của các hộp sữa sản xuất ra phải
gần bằng trọng lượng đã được quảng cáo. Giả sử phân phối trọng lượng của tập hợp
chính tuân theo phân phối chuẩn. Nếu lấy ngẫu nhiên 20 hộp đem đi kiểm tra. Tìm 2 số
K1 và K2 sao cho :
a) P( 050KS 12
x
2
x .) =<σ
b) P( 050KS 22
x
2
x .) =>σ
n : cỡ mẫu
F(X²)
0 χ2
ν2
ν1 < ν2
P x v
p v
x
e
v x
dx
x
( , )
( / )
( )2
2
2
1
2
1
2 2
2
2
2
= − −
∞
∫
Gv. Cao Hào Thi 8
Giải :
a. 0.05 = ( =<σ )12x
2
x K
S
P[ 2
x
2
xS1n
σ
− )(
< (n-1)K1]
= P[χ²n-1 < (n-1) K1]
Với cỡ mẫu n =20 và χ²n-1 là biến ngẫu nhiên có độ tự do n-1 = 19. Ta có :
0.05 = P[χ²n-1 <19K1] = P[ χ²19<19K1]
hay
0.5 1-0.05 = 0.95= P[χ²n-1 >19K1] = P[χ²19<19K1]
Tra bảng ta có :
19K1 = 10.12
K1 = 0.533
Ý nghĩa :
Với xác suất 5%, phương sai của mẫu sẽ nhỏ hơn 53.3% lần phương sai của tập hợp
chính.
Hay
P( 2xS < 0.533
2
xσ ) = 0.05
b. 0.05 = P( S K P n S
X
n Kx
x
x
2
2 2
2
2
1 1 2σ σ> =
− > −) [ ( ) ( ) ]
= P[χ²n-1 >(n-1)K2]
0.05= P[χ²19> 19K2]
Tra bảng ta có : 19K2 = 30.14
K2 = 1.586
Ý nghĩa :
Với sản xuất 5%, phương sai của mẫu số sẽ lớn hơn 58.6% phương sai của tập hợp
chính.
P( 2xS >1.586
2
xσ = 0.05
Diện tích 0.05
0 10.12 30.14 χ²19
f(χ²19)
Diện tích 0.05