Kinh tế lượng - Vấn đề 2: Thống kê cơbản

Thông tin đầy đủ về Phân phối của một bộ dữ liệu có thể thành lập và tham khảo hình dạng của Phân phối. Thường người ta sử dụng Phân phối chuẩn là phân phối phổ biến, thường gặp nhất.

pdf39 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 1797 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Kinh tế lượng - Vấn đề 2: Thống kê cơbản, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Vấn đề 2. Thống kê cơ bản Phân phối xác suất Dữ liệu liên tục Phân phối chuẩn (X, Z) Phân phối hàm mũ -Chú ý: Phân phối của mẫu  Z, t, F và Phân phối Khi bình phương (Tests) Dữ liệu rời rạc* Phân phối nhị thức Phân phối Poisson Phân phối Hình họcvà Nhị thức Công cụ thống kê Thông tin đầy đủ về Phân phối của một bộ dữ liệu có thể thành lập và tham khảo hình dạng của Phân phối. Thường người ta sử dụng Phân phối chuẩn là phân phối phổ biến, thường gặp nhất. Phân phối chuẩn, có thể giúp ta trả lời nhiều câu hỏi. This image cannot currently be displayed. Sử dụng hai tham số (trung bình & độ lệch chuẩn) Chú ý:  Giả sử ta biết giá trị của 2 tham số trung bình và độ lệch chuẩn. Như thế ta sẽ biết về tổng thể (Không phải của mẫu). Phân phối chuẩn Hình 1. Đường cong chuẩn f(x) = chiều cao đường cong x = biến trung bình của x = am Một phân phối chuẩn có thể được mô tả một cách đầy đủ bởi hai giá trị: trung bình m và độ lệch chuẩn sigma (hoặc phương sai của nó là sigma2.)  Biến phân phối chuẩn có nhiều đặc điểm làm cơ sở cho các tính toán và suy diễn. A. Đặc điểm 1. đối xứng quanh đường thẳng có x = m 2. diện tích nằm bên phải của trung bình bằng khoảng 1/2 diện tích chung, diện tích nằm bên trái của trung bình bằng khoảng 1/2 diện tích chung (nhìn slide tiếp) 3. giá trị khác µ (mean) & sigma2 (variance) xác định đường cong khác; µ trung tâm của đường cung & sigma2 xác định độ phân tán f(x) x đối xưng qua đường thẳng đứng với x = m a f(x) x diện tích bên phải là bằng 1/2 của tổng diện tích; diện tích bên phải là bằng 1/2 của tổng diện tích µ 1/2 của tổng diện tích 1/2 của tổng diện tích 4. khoảng 68% trường hợp sẽ nằm trong vùng phân bố chuẩn có khoảng trung bình và một độ lệch chuẩn 5. khoảng 95% trường hợp sẽ nằm trong vùng phân bố chuẩn có khoảng trung bình và hai độ lệch chuẩn 6. khoảng 99.7% trường hợp sẽ nằm trong vùng phân bố chuẩn có khoảng trung bình và ba độ lệch chuẩn CHÚ Ý: độ lệch chuẩn ký hiệu bởi “s” hoặc s 68% của phân phối’ nằm trong vùng trung bình cộng với 1 độ lệch chuẩn 68% µ µ - s µ + s f(x) x Diện tích nằm giữa đường cong và trục hoành 95% của phân phối’ nằm trong vùng trung bình cộng với 2 độ lệch chuẩn 68% 95% µ µ - s µ + sµ - 2s µ + 2s f(x) x Diện tích nằm giữa đường cong và trục hoành 99.7% của phân phối’ nằm trong vùng trung bình cộng với 3 độ lệch chuẩn 68% 95% 99.7% µ µ - s µ + sµ - 2s µ + 2sµ - 3s µ + 3s f(x) x Diện tích nằm giữa đường cong và trục hoành Example (see note page) Cho X là đại lượng ngẫu nhiên biểu thị kết quả đạt được qua kỳ thi quốc gia MBA. Giả sử X tuân theo quy luật phân bố chuẩn với trung bình là 600 và độ lệch chuẩn (sigma) là 65. Vậy xác xuất để X nằm trong khoảng 2 sigma = 2(65) = 130 points của 600 is 95%. Nói một cách khác, 95% của kết quả sẽ nằm trong khoảng 470 và 730. Tương tự, 99.7% của kết quả sẽ nằm trong khoảng 405 và 795. 95% 99.7% 600600 -2(65) 600 + 2(65) 600 -3(65) 600 + 3(65) f(x) x 730470 795405 Diện tích nằm giữa đường cong và trục hoành 95% 99.7% 600600 -2(65) 600 + 2(65) 600 -3(65) 600 + 3(65) f(x) x 730470 795405 % nhỏ hơn 600 Diện tích nằm giữa đường cong và trục hoành 95% 99.7% 600600 -2(65) 600 + 2(65) 600 -3(65) 600 + 3(65) f(x) x 730470 795405 % nhoí hån 730 Diện tích nằm giữa đường cong và trục hoành Think for a moment!!  Heaven or on the Earth?  How about skewness và kurtosis?  The analysis using the Phân phối chuẩn is based on the assumptions of (i) No skewness (skewness = 0) (ii) No kurtosis (kurtosis = 3, excess kurtosis = 0)  Note: But, using the Phân phối chuẩn is still valid in the sampling Phân phối.  From Lectures 3 và onward  “Regardless of the Phân phối in the population, the sampling Phân phối of the sample thống kê is NORMAL” (Central Limit Theorem) Phân phối chuẩn tắc 1. biến ngẫu nhiên có phân phối chuẩn tắc là một biến chuẩn với:  trung bình = 0 và độ lệch chuẩn (sigma) = 1. xem Hình trên slide tiếp. biến này thường được ký hiệu là Z. Thường một biến chuẩn được ký hiệu là X. Việc biến đổi thành Z có thể trả lời được nhiều câu hỏi trong kinh tế và quản trị. f(z) z 0-1 +1-3 -2 +2 +3 Hình 2. Đường cong chuẩn tắc: trung bình = 0 và độ lệch chuẩn (sigma) = 1 Chú ý “Z” khác “X”. f(z) z 0-1 +1-3 -2 +2 +3 Hình 2. Đường cong chuẩn tắc: trung bình = 0 và độ lệch chuẩn (sigma) = 1 Phần trăm của tỷ số nằm ngoài khoảng -2 & +2? Chú ý “Z” khác “X”. diện tích nằm dưới đường cong chuẩn tắc giữa z = 0 & z = z0 ở đây z0 => 0. Also see the table in a few slides. Example See the next slide. At the intersection of the row for 2.5 và the column under 0.04, meaning Z = 2.54, you find a value of 0.4945. This means that the area under the standard normal curve between z = 0 & z = 2.54 is 0.4945 (49.45% of total area under curve). Table (in text) z .00 .01 .02 .03 .04 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 .4772 .4821 .4861 .4893 .4918 .4938 .4953 .4965 .4974 .4981 .4778 .4783 .4788 .4793 .4826 .4830 .4834 .4838 .4864 .4868 .4871 .4875 .4896 .4898 .4901 .4904 .4920 .4922 .4925 .4927 .4940 .4941 .4943 .4945 .4955 .4956 .4957 .4959 .4966 .4967 .4968 .4969 .4975 .4976 .4977 .4977 .4982 .4982 .4983 .4984 for row value of 2.5 & column under 0.04, meaning Z = 2.54, value = 0.4945 Table (in text) z .00 .01 .02 .03 .04 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 .4772 .4821 .4861 .4893 .4918 .4938 .4953 .4965 .4974 .4981 .4778 .4783 .4788 .4793 .4826 .4830 .4834 .4838 .4864 .4868 .4871 .4875 .4896 .4898 .4901 .4904 .4920 .4922 .4925 .4927 .4940 .4941 .4943 .4945 .4955 .4956 .4957 .4959 .4966 .4967 .4968 .4969 .4975 .4976 .4977 .4977 .4982 .4982 .4983 .4984 giá trị hàng của 2.5 & và cột 0.04, có nghĩa là Z = 2.54, giá trị = 0.4945 49.45 là diện tích nằm giữa z=0 và z=2.54 và trục hoành f(z) z 0-1 +1-3 -2 +2 +3 49.45% là diện tích với z=0 và z=2.54 +2.54 3. Vùng nằm giữa z = 0 & z = -2.54 (chú ý - 2.54) cũng là 0.4945 (49.45% của diện tích).  P(0 < Z < 2.54) = P(-2.54 < Z < 0) = .4945 Biến đổi thành phân phối chuẩn tắc Z 1. Chuyển mọi phân phối chuẩn thành chuẩn tắc theo công thức: Z = (X - xtb) / độ lệch chuẩn of X Ví dụ: mean=600, sigma=65 để Z = 1. (665 - 600) / 65 = 1 Example  Suppose that you have an X variable with a trung bình of 125 & độ lệch chuẩn of 12. If one of X's values is 125 (its mean), then the corresponding value for a Z variable is computed as follows:  Z = (X - µ) / 12 = (125 - 125) / 12 = 0 This means that a value for the X variable of 125 is 0 độ lệch chuẩn units from its trung bình of 125 (which makes sense.) Example Suppose you have data on an variable (call it X) that is normally distributed with a trung bình µ = 4 & a độ lệch chuẩn = 2. Your assignment is to find how likely it is that X can be a value between 0 và 6. This can be stated as "find the probability that X can be between 0 và 6." This can also be stated as "find P(0 < X < 6)." 0-2 z values1 640 x values (Z’s sigma = 1) (X’s sigma = 2) Z = (X - µ) / sigma Area A1 = 0.4772 Area A2 = 0.3413 0-2 z values1 640 x values Z = (X - m) / s Chú ý: P(0 < X < 6) = P(-2 < Z < 1) 0-2 z1 640 x NOTE: 81.85% tất cả giá trị Z = (X - m) / s Here’s how to use the table of Z values to find the hai areas I showed you earlier. Repeating: it is true that P(0 < X < 6) = P(-2 < Z < 1) P(-2 < Z < 1) is area between z = -2 và z = 1; this area is sum of area between  z = -2 & z =0 (area A1)  & area between  z = 0 & z = 1 (area A2) 0-2 z values1 640 x values (Z’s sigma = 1) (X’s sigma = 2) Area A1 Area A2 Z = (X - m) / s z .00 .01 .02 .03 .04 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 .4772 .4821 .4861 .4893 .4918 .4938 .4953 .4965 .4974 .4981 .4778 .4783 .4788 .4793 .4826 .4830 .4834 .4838 .4864 .4868 .4871 .4875 .4896 .4898 .4901 .4904 .4920 .4922 .4925 .4927 .4940 .4941 .4943 .4945 .4955 .4956 .4957 .4959 .4966 .4967 .4968 .4969 .4975 .4976 .4977 .4977 .4982 .4982 .4983 .4984 for row value of 2.0 & column under 0.00, meaning Z = 2.00, value = 0.4772. For Z = -2.00, value also = 0.4772. Table (in text) Tìm diện tích nằm giữa z = -2 & z =0 (area A1) Dấu âm 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 .00 .01 .02 .03 .04 .0000 .0398 .0793 .1179 .1554 .1915 .2258 .2580 .2881 .3159 .3413 .0040 .0080 .0120 .0160 .0438 .0478 .0517 .0557 .0832 .0871 .0910 .0948 .1217 .1255 .1293 .1331 .1591 .1628 .1664 .1700 .1950 .1985 .2019 .2054 .2291 .2324 .2357 .2389 .2612 .2642 .2673 .2704 .2910 .2939 .2967 .2996 .3186 .3212 .3238 .3264 .3438 .3461 .3485 .3508 Table (in text) for row value of 1.0 & column under 0.00, meaning Z = 1.00, value = 0.3413. area between z = 0 & z = 1 (area A2) 0-2 z values1 640 x values (Z’s sigma = 1) (X’s sigma = 2) DTich A1 = 0.4772 DTich A2 = 0.3413 Z = (X - m) / s • P(-2 < Z < 1) = DTich A1 + DTich A2 = 0.4772 + 0.3413 = 0.8185; • có nghĩa là xác suất để X nằm giữa 0 và 6 là 81.85%

Các file đính kèm theo tài liệu này:

  • pdfchuong_0_on_tap_sac_xuat_thong_ke_2_772.pdf