Kinh tế lượng - Vấn đề 2: Thống kê cơbản
Thông tin đầy đủ về Phân phối của một bộ dữ
liệu có thể thành lập và tham khảo hình dạng
của Phân phối. Thường người ta sử dụng
Phân phối chuẩn là phân phối phổ biến,
thường gặp nhất.
39 trang |
Chia sẻ: tlsuongmuoi | Lượt xem: 1817 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Kinh tế lượng - Vấn đề 2: Thống kê cơbản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Vấn đề 2. Thống kê cơ bản
Phân phối xác suất
Dữ liệu liên tục
Phân phối chuẩn (X, Z)
Phân phối hàm mũ
-Chú ý: Phân phối của mẫu
Z, t, F và Phân phối Khi bình phương (Tests)
Dữ liệu rời rạc*
Phân phối nhị thức
Phân phối Poisson
Phân phối Hình họcvà Nhị thức
Công cụ thống kê
Thông tin đầy đủ về Phân phối của một bộ dữ
liệu có thể thành lập và tham khảo hình dạng
của Phân phối. Thường người ta sử dụng
Phân phối chuẩn là phân phối phổ biến,
thường gặp nhất.
Phân phối chuẩn, có thể giúp ta trả lời nhiều
câu hỏi.
This image cannot currently be displayed.
Sử dụng hai tham số (trung bình & độ
lệch chuẩn)
Chú ý:
Giả sử ta biết giá trị của 2 tham số trung bình và
độ lệch chuẩn. Như thế ta sẽ biết về tổng thể
(Không phải của mẫu).
Phân phối chuẩn
Hình 1. Đường cong chuẩn
f(x) = chiều cao đường cong
x = biến
trung bình của x = am
Một phân phối chuẩn có thể được mô tả một
cách đầy đủ bởi hai giá trị: trung bình m và độ
lệch chuẩn sigma (hoặc phương sai của nó là
sigma2.)
Biến phân phối chuẩn có nhiều đặc điểm làm
cơ sở cho các tính toán và suy diễn.
A. Đặc điểm
1. đối xứng quanh đường thẳng có x = m
2. diện tích nằm bên phải của trung bình bằng
khoảng 1/2 diện tích chung, diện tích nằm bên trái
của trung bình bằng khoảng 1/2 diện tích chung
(nhìn slide tiếp)
3. giá trị khác µ (mean) & sigma2 (variance) xác
định đường cong khác; µ trung tâm của đường
cung & sigma2 xác định độ phân tán
f(x)
x
đối xưng qua đường thẳng đứng với x = m
a
f(x)
x
diện tích bên phải là bằng 1/2 của tổng diện tích;
diện tích bên phải là bằng 1/2 của tổng diện tích
µ
1/2 của tổng diện tích 1/2 của tổng diện tích
4. khoảng 68% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và một độ
lệch chuẩn
5. khoảng 95% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và hai độ lệch
chuẩn
6. khoảng 99.7% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và ba độ lệch
chuẩn
CHÚ Ý: độ lệch chuẩn ký hiệu bởi “s” hoặc s
68% của phân phối’ nằm trong vùng trung bình cộng với 1 độ
lệch chuẩn
68%
µ µ - s µ + s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
95% của phân phối’ nằm trong vùng trung bình cộng với 2 độ
lệch chuẩn
68%
95%
µ µ - s µ + sµ - 2s µ + 2s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
99.7% của phân phối’ nằm trong vùng trung bình cộng với 3
độ lệch chuẩn
68%
95%
99.7%
µ µ - s µ + sµ - 2s µ + 2sµ - 3s µ + 3s
f(x)
x
Diện tích nằm giữa đường cong và trục hoành
Example (see note page)
Cho X là đại lượng ngẫu nhiên biểu thị kết quả
đạt được qua kỳ thi quốc gia MBA. Giả sử X
tuân theo quy luật phân bố chuẩn với trung bình
là 600 và độ lệch chuẩn (sigma) là 65. Vậy xác
xuất để X nằm trong khoảng 2 sigma = 2(65) =
130 points của 600 is 95%. Nói một cách khác,
95% của kết quả sẽ nằm trong khoảng 470 và
730. Tương tự,
99.7% của kết quả sẽ nằm trong khoảng 405 và
795.
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
Diện tích nằm giữa đường cong và trục hoành
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
% nhỏ hơn 600
Diện tích nằm giữa đường cong và trục hoành
95%
99.7%
600600
-2(65)
600
+ 2(65)
600
-3(65)
600
+ 3(65)
f(x)
x
730470 795405
% nhoí hån 730
Diện tích nằm giữa đường cong và trục hoành
Think for a moment!!
Heaven or on the Earth?
How about skewness và kurtosis?
The analysis using the Phân phối chuẩn is based on the
assumptions of
(i) No skewness (skewness = 0)
(ii) No kurtosis (kurtosis = 3, excess kurtosis = 0)
Note: But, using the Phân phối chuẩn is still valid in
the sampling Phân phối.
From Lectures 3 và onward
“Regardless of the Phân phối in the population, the sampling
Phân phối of the sample thống kê is NORMAL” (Central
Limit Theorem)
Phân phối chuẩn tắc
1. biến ngẫu nhiên có phân phối chuẩn tắc là một
biến chuẩn với:
trung bình = 0 và
độ lệch chuẩn (sigma) = 1.
xem Hình trên slide tiếp.
biến này thường được ký hiệu là Z. Thường một
biến chuẩn được ký hiệu là X. Việc biến đổi thành
Z có thể trả lời được nhiều câu hỏi trong kinh tế và
quản trị.
f(z)
z
0-1 +1-3 -2 +2 +3
Hình 2. Đường cong chuẩn tắc: trung bình = 0 và độ lệch chuẩn (sigma) = 1
Chú ý “Z” khác “X”.
f(z)
z
0-1 +1-3 -2 +2 +3
Hình 2. Đường cong chuẩn tắc: trung bình = 0 và độ lệch chuẩn (sigma) = 1
Phần trăm của tỷ số nằm ngoài khoảng -2 & +2?
Chú ý “Z” khác “X”.
diện tích nằm dưới đường cong chuẩn tắc giữa z =
0 & z = z0 ở đây z0 => 0.
Also see the table in a few slides.
Example
See the next slide.
At the intersection of the row for 2.5 và the column
under 0.04, meaning Z = 2.54, you find a value of
0.4945.
This means that the area under the standard normal
curve between z = 0 & z = 2.54 is 0.4945 (49.45%
of total area under curve).
Table (in text)
z .00 .01 .02 .03 .04
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4778 .4783 .4788 .4793
.4826 .4830 .4834 .4838
.4864 .4868 .4871 .4875
.4896 .4898 .4901 .4904
.4920 .4922 .4925 .4927
.4940 .4941 .4943 .4945
.4955 .4956 .4957 .4959
.4966 .4967 .4968 .4969
.4975 .4976 .4977 .4977
.4982 .4982 .4983 .4984
for row value of 2.5 & column under 0.04, meaning Z = 2.54,
value = 0.4945
Table (in text)
z .00 .01 .02 .03 .04
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4778 .4783 .4788 .4793
.4826 .4830 .4834 .4838
.4864 .4868 .4871 .4875
.4896 .4898 .4901 .4904
.4920 .4922 .4925 .4927
.4940 .4941 .4943 .4945
.4955 .4956 .4957 .4959
.4966 .4967 .4968 .4969
.4975 .4976 .4977 .4977
.4982 .4982 .4983 .4984
giá trị hàng của 2.5 & và cột 0.04, có nghĩa là Z = 2.54,
giá trị = 0.4945
49.45 là diện tích nằm giữa
z=0 và z=2.54 và trục hoành
f(z)
z
0-1 +1-3 -2 +2 +3
49.45% là diện tích với z=0 và z=2.54
+2.54
3. Vùng nằm giữa
z = 0 & z = -2.54 (chú ý - 2.54) cũng là 0.4945
(49.45% của diện tích).
P(0 < Z < 2.54) = P(-2.54 < Z < 0) = .4945
Biến đổi thành phân phối chuẩn tắc Z
1. Chuyển mọi phân phối chuẩn thành chuẩn tắc
theo công thức:
Z = (X - xtb) / độ lệch chuẩn of X
Ví dụ: mean=600, sigma=65
để Z = 1.
(665 - 600) / 65 = 1
Example
Suppose that you have an X variable with a trung bình
of 125 & độ lệch chuẩn of 12. If one of X's values is
125 (its mean), then the corresponding value for a Z
variable is computed as follows:
Z = (X - µ) / 12 = (125 - 125) / 12 = 0
This means that a value for the X variable of 125 is 0 độ
lệch chuẩn units from its trung bình of 125 (which
makes sense.)
Example
Suppose you have data on an variable (call
it X) that is normally distributed with a
trung bình µ = 4 & a độ lệch chuẩn = 2.
Your assignment is to find how likely it is
that X can be a value between 0 và 6.
This can be stated as "find the probability
that X can be between 0 và 6."
This can also be stated as "find
P(0 < X < 6)."
0-2 z values1
640 x values
(Z’s sigma = 1)
(X’s sigma = 2)
Z = (X - µ) / sigma
Area A1
= 0.4772
Area A2
= 0.3413
0-2 z values1
640 x values
Z = (X - m) / s
Chú ý: P(0 < X < 6) = P(-2 < Z < 1)
0-2 z1
640 x
NOTE: 81.85% tất cả giá trị
Z = (X - m) / s
Here’s how to use the table of Z values to
find the hai areas I showed you earlier.
Repeating:
it is true that P(0 < X < 6) = P(-2 < Z < 1)
P(-2 < Z < 1) is area between z = -2 và z = 1; this
area is sum of area between
z = -2 & z =0 (area A1)
& area between
z = 0 & z = 1 (area A2)
0-2 z values1
640 x values
(Z’s sigma = 1)
(X’s sigma = 2)
Area A1 Area A2
Z = (X - m) / s
z .00 .01 .02 .03 .04
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4778 .4783 .4788 .4793
.4826 .4830 .4834 .4838
.4864 .4868 .4871 .4875
.4896 .4898 .4901 .4904
.4920 .4922 .4925 .4927
.4940 .4941 .4943 .4945
.4955 .4956 .4957 .4959
.4966 .4967 .4968 .4969
.4975 .4976 .4977 .4977
.4982 .4982 .4983 .4984
for row value of 2.0 & column under 0.00, meaning Z = 2.00,
value = 0.4772. For Z = -2.00, value also = 0.4772.
Table (in text)
Tìm diện tích nằm giữa z = -2 & z =0 (area A1)
Dấu âm
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
.00 .01 .02 .03 .04
.0000
.0398
.0793
.1179
.1554
.1915
.2258
.2580
.2881
.3159
.3413
.0040 .0080 .0120 .0160
.0438 .0478 .0517 .0557
.0832 .0871 .0910 .0948
.1217 .1255 .1293 .1331
.1591 .1628 .1664 .1700
.1950 .1985 .2019 .2054
.2291 .2324 .2357 .2389
.2612 .2642 .2673 .2704
.2910 .2939 .2967 .2996
.3186 .3212 .3238 .3264
.3438 .3461 .3485 .3508
Table (in text)
for row value of 1.0 & column under 0.00, meaning Z = 1.00,
value = 0.3413.
area between z = 0 & z = 1 (area A2)
0-2 z values1
640 x values
(Z’s sigma = 1)
(X’s sigma = 2)
DTich A1
= 0.4772
DTich A2
= 0.3413
Z = (X - m) / s
• P(-2 < Z < 1) = DTich A1 + DTich A2 = 0.4772 +
0.3413 = 0.8185;
• có nghĩa là xác suất để X nằm giữa 0 và 6 là 81.85%
Các file đính kèm theo tài liệu này:
- chuong_0_on_tap_sac_xuat_thong_ke_2_772.pdf