Các đặc trưng đo lường độ tập trung và độ phân tán
CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ TẬP TRUNGTRUNG BÌNH (MEAN)
MỐT (MODE)
TRUNG VỊ (MEDIAN)
Phân bố bằng nhauHai biến ngẫu nhiên X và Y có phân bố bằng nhau nếu chúng có các hàm phân bố giống nhau:
Hai biến ngẫu nhiên có các hàm sinh mômen bằng nhau có phân bố bằng nhau. Điều này cung cấp một phương pháp kiểm tra tính bằng nhau của một số hàm nhất định của các biến phân bố đồng nhất độc lập (dependent identical-distributed variable).
Để có phân bố bằng nhau, các biến ngẫu nhiên không cần phải được định nghĩa trên cùng một không gian xác suất.
Khái niệm phân bố tương đương có quan hệ với khái niệm dưới đây về khoảng cách giữa các phân bố xác suất,
đây là căn bản của thử nghiệm Kolmogorov-Smirnov.
26 trang |
Chia sẻ: aloso | Lượt xem: 4875 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Các đặc trưng đo lường độ tập trung và độ phân tán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CÁC ĐẶC TRƯNG ĐO LƯỜNG
ĐỘ TẬP TRUNG & ĐỘ PHÂN TÁN
CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ TẬP TRUNG
TRUNG BÌNH (MEAN)
MỐT (MODE)
TRUNG VỊ (MEDIAN)
(KỲ VỌNG - EXPECTED VALUE)
TRUNG BÌNH CỘNG
ĐƠN GIẢN
n
X
X
n
i
i∑
=
=
1
CÓ TRỌNG SỐ
∑
∑
=
=
= k
i
i
k
i
ii
f
fX
X
1
1
∑
∑
=
=
= k
i
i
k
i
ii
f
fX
X
1
1
TÍNH CHẤT:
1. Nếu f1 = f2 = … = fk thì: k
X
f
fX
X
k
i
i
k
i
i
k
i
ii ∑
∑
∑
=
=
=
==
1
1
1
2. ∑
∑
∑
=
=
=
==
k
i
iik
i
i
k
i
ii
dX
f
fX
X
1
1
1 với
∑
=
= k
i
i
i
i
f
fd
1
3. 0)(
1
=−∑
=
n
i
i XX
MODE (M0)
M0 là Xi ứng với fi lớn nhất
• Trường hợp có khoảng cách nhóm đều nhau:
)()(
100100
100
0(min)00
+−
−
−+−
−
+=
MMMM
MM
MM ffff
ff
hXM
• Trường hợp khoảng cách nhóm không đều nhau:
• dùng mật độ phân phối thay cho tần số
MẬT ĐỘ
PHÂN PHỐI =
TẦN SỐ
KHOẢNG CÁCH NHÓM
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode = 9
0 1 2 3 4 5 6
No Mode
TRUNG VỊ (Me)
2/)1( += ne XM
• Trường hợp nhóm có khoảng cách:
e
e
ee
M
M
MMe f
Sn
hXM
1
(min)
2 −
−
+=
0 1 2 3 4 5 6 7 8 9 10
Mean = 3
0 1 2 3 4 5 6 7 8 9 10
Mean = 4
3
5
15
5
54321
==
++++ 4
5
20
5
104321
==
++++
0 1 2 3 4 5 6 7 8 9 10
Median = 3
0 1 2 3 4 5 6 7 8 9 10
Median = 3
Tứ phân vị (Quartiles)
25% 25% 25% 25%
Q1 Q2 Q3
Tứ phân vị thứ nhất: Q1 = (n+1)/4
Tứ phân vị thứ hai: Q2 = (n+1)/2 (Trung vị)
Tứ phân vị thứ ba: Q3 = 3(n+1)/4
Minimum 1st Median 3rd Maximum
Quartile Quartile
Minimum 1st Median 3rd Maximum
Quartile Quartile
25% 25% 25% 25%
Biểu đồ hộp (Box-and-Whisker Plot)
CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ PHÂN TÁN
1. KHOẢNG BIẾN THIÊN (Range)
R = Xmax-Xmin
Khơng xét đến sự phân bố của dữ liệu
Nhạy cảm với các giá trị bất thường (outliers)
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
Nhược điểm của Khoảng biến thiên
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 5 - 1 = 4
Range = 120 - 1 = 119
Khoảng trải giữa (Interquartile Range)
Interquartile range = 3rd quartile – 1st quartile
= Q3 – Q1
Interquartile Range
Median
(Q2)
X
maximumXminimum Q1 Q3
25% 25% 25% 25%
12 30 45 57 70
Interquartile range
57 – 30 = 27
2. ĐỘ LỆCH TUYỆT ĐỐI TRUNG BÌNH
(Mean Absolute Deviation - MAD)
n
XX
d
n
i
i∑
=
−
=
1
∑
∑
=
=
−
= k
i
i
k
i
ii
f
fXX
d
1
1
3. PHƯƠNG SAI (Variance)
N
X
N
i
i∑
=
−
=
1
2
2
)( µ
σ
1
)(
1
2
2
−
−
=
∑
=
n
XX
S
n
i
i
1
)(
1
1
2
2
−
−
=
∑
∑
=
=
k
i
i
i
k
i
i
f
fXX
S
4. ĐỘ LỆCH TIÊU CHUẨN
(Standard Deviation - SD)
2σσ = 2SS =
5. HỆ SỐ BIẾN THIÊN
(Coefficient of Variation - CV)
%100×=
X
SV
(%)
Mean = 15.5
S = 3.33811 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B
Data A
Mean = 15.5
S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
S = 4.567
Data C
Same center,
different variation
23 26 29 32 35 38 41
68,3%
95,5%
99,7%
Mean = MedianMean < Median Median < Mean
Right-SkewedLeft-Skewed Symmetric
Right-SkewedLeft-Skewed Symmetric
Q1 Q2Q3 Q1Q2Q3 Q1 Q2 Q3
If the data distribution is approximately
bell-shaped, then the interval:
contains about 68% of the values in
the population or the sample
The Empirical Rule
1σµ ±
µ
68%
1σµ±
contains about 95% of the values in
the population or the sample
contains about 99.7% of the values
in the population or the sample
2σµ ±
3σµ ±
3σµ±
99.7%95%
2σµ±
Regardless of how the data are distributed,
at least (1 - 1/k2) x 100% of the values will
fall within k standard deviations of the mean
(for k > 1)
Examples:
(1 - 1/12) x 100% = 0% ……..... k=1 (µ ± 1σ)
(1 - 1/22) x 100% = 75% …........ k=2 (µ ± 2σ)
(1 - 1/32) x 100% = 89% ………. k=3 (µ ± 3σ)
Chebyshev Rule
withinAt least
Các file đính kèm theo tài liệu này:
- Các đặc trưng đo lường độ tập trung & độ phân tán.pdf