Các đặc trưng đo lường độ tập trung và độ phân tán

CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ TẬP TRUNGTRUNG BÌNH (MEAN) MỐT (MODE) TRUNG VỊ (MEDIAN) Phân bố bằng nhauHai biến ngẫu nhiên X và Y có phân bố bằng nhau nếu chúng có các hàm phân bố giống nhau: Hai biến ngẫu nhiên có các hàm sinh mômen bằng nhau có phân bố bằng nhau. Điều này cung cấp một phương pháp kiểm tra tính bằng nhau của một số hàm nhất định của các biến phân bố đồng nhất độc lập (dependent identical-distributed variable). Để có phân bố bằng nhau, các biến ngẫu nhiên không cần phải được định nghĩa trên cùng một không gian xác suất. Khái niệm phân bố tương đương có quan hệ với khái niệm dưới đây về khoảng cách giữa các phân bố xác suất, đây là căn bản của thử nghiệm Kolmogorov-Smirnov.

pdf26 trang | Chia sẻ: aloso | Lượt xem: 4735 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Các đặc trưng đo lường độ tập trung và độ phân tán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ TẬP TRUNG & ĐỘ PHÂN TÁN CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ TẬP TRUNG TRUNG BÌNH (MEAN) MỐT (MODE) TRUNG VỊ (MEDIAN) (KỲ VỌNG - EXPECTED VALUE) TRUNG BÌNH CỘNG ĐƠN GIẢN n X X n i i∑ = = 1 CÓ TRỌNG SỐ ∑ ∑ = = = k i i k i ii f fX X 1 1 ∑ ∑ = = = k i i k i ii f fX X 1 1 TÍNH CHẤT: 1. Nếu f1 = f2 = … = fk thì: k X f fX X k i i k i i k i ii ∑ ∑ ∑ = = = == 1 1 1 2. ∑ ∑ ∑ = = = == k i iik i i k i ii dX f fX X 1 1 1 với ∑ = = k i i i i f fd 1 3. 0)( 1 =−∑ = n i i XX MODE (M0) M0 là Xi ứng với fi lớn nhất • Trường hợp có khoảng cách nhóm đều nhau: )()( 100100 100 0(min)00 +− − −+− − += MMMM MM MM ffff ff hXM • Trường hợp khoảng cách nhóm không đều nhau: • dùng mật độ phân phối thay cho tần số MẬT ĐỘ PHÂN PHỐI = TẦN SỐ KHOẢNG CÁCH NHÓM 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 9 0 1 2 3 4 5 6 No Mode TRUNG VỊ (Me) 2/)1( += ne XM • Trường hợp nhóm có khoảng cách: e e ee M M MMe f Sn hXM 1 (min) 2 − − += 0 1 2 3 4 5 6 7 8 9 10 Mean = 3 0 1 2 3 4 5 6 7 8 9 10 Mean = 4 3 5 15 5 54321 == ++++ 4 5 20 5 104321 == ++++ 0 1 2 3 4 5 6 7 8 9 10 Median = 3 0 1 2 3 4 5 6 7 8 9 10 Median = 3 Tứ phân vị (Quartiles) 25% 25% 25% 25% Q1 Q2 Q3 Tứ phân vị thứ nhất: Q1 = (n+1)/4 Tứ phân vị thứ hai: Q2 = (n+1)/2 (Trung vị) Tứ phân vị thứ ba: Q3 = 3(n+1)/4 Minimum 1st Median 3rd Maximum Quartile Quartile Minimum 1st Median 3rd Maximum Quartile Quartile 25% 25% 25% 25% Biểu đồ hộp (Box-and-Whisker Plot) CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ PHÂN TÁN 1. KHOẢNG BIẾN THIÊN (Range) R = Xmax-Xmin  Khơng xét đến sự phân bố của dữ liệu  Nhạy cảm với các giá trị bất thường (outliers) 7 8 9 10 11 12 Range = 12 - 7 = 5 7 8 9 10 11 12 Range = 12 - 7 = 5 Nhược điểm của Khoảng biến thiên 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Range = 5 - 1 = 4 Range = 120 - 1 = 119 Khoảng trải giữa (Interquartile Range) Interquartile range = 3rd quartile – 1st quartile = Q3 – Q1 Interquartile Range Median (Q2) X maximumXminimum Q1 Q3 25% 25% 25% 25% 12 30 45 57 70 Interquartile range 57 – 30 = 27 2. ĐỘ LỆCH TUYỆT ĐỐI TRUNG BÌNH (Mean Absolute Deviation - MAD) n XX d n i i∑ = − = 1 ∑ ∑ = = − = k i i k i ii f fXX d 1 1 3. PHƯƠNG SAI (Variance) N X N i i∑ = − = 1 2 2 )( µ σ 1 )( 1 2 2 − − = ∑ = n XX S n i i 1 )( 1 1 2 2 − − = ∑ ∑ = = k i i i k i i f fXX S 4. ĐỘ LỆCH TIÊU CHUẨN (Standard Deviation - SD) 2σσ = 2SS = 5. HỆ SỐ BIẾN THIÊN (Coefficient of Variation - CV) %100×= X SV (%) Mean = 15.5 S = 3.33811 12 13 14 15 16 17 18 19 20 21 11 12 13 14 15 16 17 18 19 20 21 Data B Data A Mean = 15.5 S = 0.926 11 12 13 14 15 16 17 18 19 20 21 Mean = 15.5 S = 4.567 Data C Same center, different variation 23 26 29 32 35 38 41 68,3% 95,5% 99,7% Mean = MedianMean < Median Median < Mean Right-SkewedLeft-Skewed Symmetric Right-SkewedLeft-Skewed Symmetric Q1 Q2Q3 Q1Q2Q3 Q1 Q2 Q3 If the data distribution is approximately bell-shaped, then the interval:  contains about 68% of the values in the population or the sample The Empirical Rule 1σµ ± µ 68% 1σµ±  contains about 95% of the values in the population or the sample  contains about 99.7% of the values in the population or the sample 2σµ ± 3σµ ± 3σµ± 99.7%95% 2σµ±  Regardless of how the data are distributed, at least (1 - 1/k2) x 100% of the values will fall within k standard deviations of the mean (for k > 1) Examples: (1 - 1/12) x 100% = 0% ……..... k=1 (µ ± 1σ) (1 - 1/22) x 100% = 75% …........ k=2 (µ ± 2σ) (1 - 1/32) x 100% = 89% ………. k=3 (µ ± 3σ) Chebyshev Rule withinAt least

Các file đính kèm theo tài liệu này:

  • pdfCác đặc trưng đo lường độ tập trung & độ phân tán.pdf
Tài liệu liên quan