Bài giảng Tổng hợp và trình bày số liệu
• Biểu đồ đa giác: Là một dạng đặc biệt của biểu đồ cột liên tục khi điểm giữa của các cột này
được nối với nhau theo nguyên tắc diện tích các cột bằng diện tích đa giác.
• Biểu đồ đường thẳng: Chỉ ra sự biến thiên của một loại số liệu nào đó theo thời gian. Có thể
ghép nhiều biểu đồ đường thẳng trên cùng một trục số để tiện so sánh.
• Biểu đồ chấm: Chỉ ra chiều hướng và mức độ của sự tương quan giữa 2 biến định lượng.
• Bản đồ: Phân bố của một bệnh, một hiện tượng sức khoẻ nào đó theo địa dư.
Bạn đang xem trước 20 trang tài liệu Bài giảng Tổng hợp và trình bày số liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1
TỔNG HỢP VÀ TRÌNH BÀY SỐ LiỆU
Hoàng Thị Hải Vân
Bộ môn Thống kê Tin học Y học
Viện Đào tạo YHDP&YTCC
ĐT: 0912693335
Email: hoangthihaivan@hmu.edu.vn
www.ipmph.edu.vn
Mục tiêu
1. Phân biệt được các khái niệm tần số, tỷ lệ, tỷ
số, tỷ suất, giá trị trung bình, trung vị, mốt, độ
lệch chuẩn và hệ số biến thiên
2. Tổ chức và tổng hợp được các loại số liệu cho
các biến định tính và định lượng.
3. Liệt kê được các loại bảng, biểu đồ thị và các
chức năng của chúng
4. Lựa chọn cách tổng hợp và biểu thị thích hợp
với 1 bộ số liệu cụ thể.
2
www.ipmph.edu.vn
Quần thể đích
QuÇn thÓ
nghiªn cøu
MÉu
Tham sè quÇn thÓ
(µ, σ, P...)MÉu x¸c suÊt
- NgÉu nhiªn ®¬n
- NgÉu nhiªn hÖ thèng
- MÉu ph©n tÇng
- MÉu chïm
- MÉu nhiÒu bËc
MÉu kh«ng x¸c suÊt
- MÉu kinh nghiÖm
- MÉu thuËn tiÖn
- MÉu chØ tiªu
- MÉu cã môc ®Ých.
Chän
mÉu
¦íc l−îng
• ®iÓm
• kho¶ng
KiÓm ®Þnh
gi¶ thuyÕt
Suy luËn
th«ng kª
(ChØ ¸p
dông cho
mÉu x¸c
suÊt víi
cì mÉu ®ñ
lín)
KÕt luËn ngo¹i suy
- Khung chän mÉu
- Ьn vÞ quan s¸t
- Ьn vÞ mÉu
- C¸c chØ sè
C¸c test
thèng kª
Gi¸ trÞ p
Lùa chän
M« t¶ c¸c tham sè mÉu
(trình bày kết quả nghiên cứu)
Tham sè mÉu
( , s, p...)XBiÕn sè
www.ipmph.edu.vn
Số liệu
Định tính Định lượng
3
www.ipmph.edu.vn
TỔNG HỢP SỐ LIỆU VỚI CÁC BIẾN
ĐỊNH TÍNH
www.ipmph.edu.vn
Tổng hợp số liệu với các biến định tính
• Tần suất
• Tỷ lệ
• Tỷ số
• Tỷ suất
4
www.ipmph.edu.vn
1. Tần suất (frequency)
• Biểu thị số lần xuất hiện của 1 quan sát nào đó
• Ví dụ: Phân bố trình độ học vấn của 30 bà mẹ có
con dưới 5 tuổi tại 1 xã (số liệu giả định).
22Tæng céng
6Nïng
12Tµy
4Kinh
TÇn sè§Õm sè lÇn xuÊt hiÖn
Gi¸ trÞ
biÕnGiá trị biến số Số lần xuất hiện (Tần suất)
Tiểu học (cấp I) 12
Trung học cơ sở (Cấp II) 8
Phổ thông trung học (Cấp III) 6
Cao đẳng/Đại học 4
Tổng số 30
www.ipmph.edu.vn
2. Tỷ số (ratio):
• Là phân số mà mẫu số
không bao hàm tử số
• Tử số và mẫu số có thể khác nhau về
đơn vị đo lường
•Hệ số k có thể là 1, 10, 100, 1000...
Ví dụ: tỷ số giới tính khi sinh
a
--- x k
b
5
www.ipmph.edu.vn
• Ví dụ về tỷ số giới tính khi sinh của Việt
Nam
Nguồn: Bộ Kế hoạch đầu tư, Tổng cục Thống kê (2011).
Tổng điều tra dân số và nhà ở Việt Nam 2009.
www.ipmph.edu.vn
3. Tỷ lệ (proportion)
• Là 1 phân số mà mẫu số bao hàm
tử số, do vậy cả mẫu và tử đều
phải cùng đơn vị
a
------- x k
a + b
• Hệ số k có thể là 1, 10, 100, 1000...
• Khi k = 100, ta có tỷ lệ phần trăm (percentage)
• Ví dụ:
số sinh viên nam
Tỷ lệ sinh viên nam = -----------------------
tổng số sinh viên
6
www.ipmph.edu.vn
• Ví dụ về tỷ lệ phần trăm: Tỷ lệ phần trăm trình
độ văn hóa của các bà mẹ có con dưới 5 tuổi
(số liệu giả định)
Trình độ văn hóa Tần suất Tỷ lệ %
Tiểu học (cấp I) 120 40.0
Trung học cơ sở (Cấp II) 80 26.7
Phổ thông trung học (Cấp III) 60 20.0
Cao đẳng/Đại học 40 13.3
Tổng số 300 100,0
www.ipmph.edu.vn
4. Tỷ suất (rate):
• Là một dạng của tỷ số hay tỷ lệ tuy nhiên có
kèm theo yếu tố thời gian
• Công thức:
số biến cố xẩy ra trong 1 khoảng thời gian
------------------------------------------------------------ x k
dân số trung bình trong khoảng thời gian đó
• Hệ số k có thể là 1, 10, 100, 1000...
• Ví dụ:
số người bị sốt rét tại huyện A năm 2000
------------------------------------------------------------- x 100
dân số trung bình của huyện A trong năm đó
7
www.ipmph.edu.vn
TỔNG HỢP SỐ LIỆU VỚI BIẾN
ĐỊNH LƯỢNG
www.ipmph.edu.vn
Tổng hợp số liệu với biến định lượng
• Đo lường độ tập trung
– Trung bình
– Trung vị
– Mốt
• Đo lường độ phân tán
– Khoảng số liệu
– Hệ số biến thiên
8
www.ipmph.edu.vn
• Trung bình số học hay còn gọi là giá trị trung
bình được tính bằng tổng số các giá trị quan
sát của một tập hợp chia cho số giá trị quan sát
của tập hợp đó.
• Giá trị trung bình chỉ tính được với các số dạng
liệu số (biến định lượng)
n
X
n
XXXX
n
i
i
n
∑
=
=
+++
=
121 ...
Trung bình số học (Arthmetic mean)
www.ipmph.edu.vn
• Ví dụ: tính trung bình cân nặng của 20 sinh viên
Sinh viên số Cân nặng Sinh viên số Cân nặng
1 60.0 11 70.0
2 62.5 12 70.0
3 62.5 13 72.5
4 65.0 14 72.5
5 65.0 15 72.5
6 67.5 16 75.0
7 67.5 17 75.0
8 67.5 18 77.5
9 67.5 19 77.5
10 70.0 20 80.0
Cân nặng trung bình của cỡ mẫu nghiên cứu trên là:
= 1397.5 / 20 = 69.8 kg
9
www.ipmph.edu.vn
• Là giá trị giữa của 1 bộ số liệu khi chúng được
sắp xếp theo thứ tự tăng dần hoặc giảm dần.
• Chia sự phân bố của số liệu thành hai phần bằng
nhau
• Trong trường hợp bộ số liệu có số quan sát là số
lẻ, giá trị trung vị là giá trị của quan sát thứ (n+1)/2
• Trong trường hợp bộ số liệu có số quan sát là số
chẵn, giá trị trung vị được tính bằng giá trị trung
bình cộng của hai giá trị quan sát ở giữa bộ số
liệu là quan sát thứ n/2 và (n/2+1)
Trung vị (Median)
www.ipmph.edu.vn
• Ví dụ: ta có bộ số liệu: 47, 41, 44, 43, 42, 40, 72
kg.
• để tính trung vị, trước hết sắp xếp số liệu theo
thứ tự: 40, 41, 42, 43, 44, 47, 72 kg.
• trung vị sẽ là giá trị của quan sát thứ (n+1)/2,
tức là (7+1)/2 =4, và giá trị thứ 4 = 43 kg là trung
vị.
• Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72
thì trung vị là giá trị trung bình cộng của giá trị
thứ 4 và thứ 5 = (43+44)/2 = 43,5
10
www.ipmph.edu.vn
Đặc điểm giá trị trung vị:
• Trung vị thường được áp dụng khi một số số
liệu quá lớn hay quá nhỏ so với những số liệu
còn lại (phân bố lệch)
• Trung vị không bị ảnh hưởng bởi các giá trị quá
lớn hoặc quá nhỏ trong bộ số liệu vì trung vị là
giá trị ở giữa của bộ số liệu
www.ipmph.edu.vn
• Là giá trị quan sát được nhiều lần nhất trong bộ số
liệu
• Mốt ít có giá trị trong đo lường độ tập trung của bộ số
liệu khi ở dạng định lượng, nhưng có giá trị với bộ số
liệu phân nhóm, hoặc biến định tính
• Ở ví dụ 1 ta có giá trị mốt bằng 67.0 kg, có nghĩa là
tập hợp sinh viên của của nhóm nghiên cứu này phổ
biến có cân nặng là 67kg
• Ở ví dụ 2 ta có giá trị mốt bằng 64.0 kg, có nghĩa là
tập hợp sinh viên của nhóm nghiên cứu này phổ biến
có cân nặng là 64.0kg
Mốt (Mode)
11
www.ipmph.edu.vn
• Trong một bộ số liệu có thể không có Mốt
khi tất cả các giá trị xuất hiện với cùng một
tần số.
• Một bộ số liệu có thể có một mốt, hai mốt
hoặc nhiều mốt.
www.ipmph.edu.vn
Phân biệt giá trị trung bình, trung vị
và mốt
Mốt
Trung vị
Trung bình
12
www.ipmph.edu.vn
• Giá trị trung bình chứa đựng nhiều thông tin hơn vì giá trị
của mỗi quan sát đều nằm trong tính toán giá trị trung
bình.
• Khi bộ số liệu phân bố lệch (không chuẩn) thì giá trị trung
bình có thể bị ảnh hưởng bởi các giá trị quá lớn hoặc quá
nhỏ, trong khi giá trị trung vị và mốt thì không bị ảnh
hưởng.
• Khi số liệu phân bố chuẩn, giá trị trung bình, trung vị và
mốt đều bằng nhau và nằm ở trung tâm của phân bố.
• Khi phân bố có các giá trị cực thấp (nghiêng trái) và cực
cao (nghiêng phải) thì các giá trị này nằm ở các vị trí khác
nhau
www.ipmph.edu.vn
TỔNG HỢP SỐ LiỆU
VỚI BiẾN ĐỊNH LƯỢNG
2. Đo lường độ phân tán
(Measure of dispersion)
13
www.ipmph.edu.vn
• Khoảng số liệu (range):
• Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất
trong một bộ số liệu.
• Khoảng số liệu (R) = Xmax – Xmin
• Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44,
47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.
1
)(
1
2
2
−
−
=
∑
=
n
XXi
s
n
i
Phương sai (variance)
Là tổng bình phương các khoảng
cách giữa giá trị chia cho số các
quan sát trừ đi 1.
Độ lệch chuẩn (standard deviation) 2ss =
Khoảng số liệu (range)
www.ipmph.edu.vn
Ví dụ
6
10
0
30
Σ
12104
Bình phương khoảng chênh lệch
giữa giá trị quan sát so với giá trị
trung bình
12-10-2Khoảng chênh lệch so với giá trị trung bình
78564Tỷ lệ phụ nữ làm kinh tế giỏi (Xi)
0100999897
)( XXi −
5,2
4
10
1
)(
1
2
2
==
−
−
=
∑
=
n
XXi
s
n
i
X
2)( XXi −
58,15,2 ==⇒ s
14
www.ipmph.edu.vn
• Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị
trung bình
• Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm
(%) và biểu thị mức độ biến thiên của độ lệch chuẩn so
với giá trị trung bình
• Giúp cho việc so sánh mức độ phân tán của nhiều bộ
số liệu với nhau:
• Ví dụ:
• CV của cân nặng nam =12/60 = 20%
• CV của cân nặng nữ = 8/54 = 15%
• Vậy bộ số liệu của cân nặng nam phân tán hơn
X
sCV =
Hệ số biến thiên (coeficient of
variation)
www.ipmph.edu.vn
Ưu điểm của phân tích số liệu định
lượng
2500 gr
300 trẻ 200 trẻ
A
2500 gr
300 trẻ 200 trẻ
B
BA XX >>PA = PB = 60%
15
www.ipmph.edu.vn
PA = PB = 40%
2500 gr
300 trẻ 200 trẻ
A
2500 gr
300 trẻ 200 trẻ
B
BA XX ≈
sB >> sA
Ưu điểm của phân tích số liệu định
lượng
www.ipmph.edu.vn
Trình bày số liệu
bằng bảng
16
www.ipmph.edu.vn
Một số bảng thường dùng
• Để biểu thị tần số các quan sát theo các nhóm,
loại khác nhau của 1 biến hoặc nhiều biến
Keát quaû ñieàu trò Thuoác A Thuoác B Toång
Khoûi beänh 12 26 38
Coù caûi thieän 8 15 23
Khoâng thay ñoåi 30 9 39
Toång 50 50 100
www.ipmph.edu.vn
Có thể biểu thị cả các tỷ lệ hoặc giá trị trung bình,
Trung bình
Ñöôøng huyeát sau
ÑT
Ñöôøng huyeát
tröôùc ÑT
Trung bìnhThuoác BThuoác AKQ ñieàu trò
sX ± sX ± sX ±
sX ± sX ± sX ±
sX ± sX ± sX ±
Một số bảng thường dùng
17
www.ipmph.edu.vn
Khi bảng chứa các chữ, ký hiệu thì được goi là bảng
ma trận (matrix)
Nhãm
tuæi
¡n sam
lÇn ®Çu
Lo¹i thøc ¨n Sè lÇn ¨n/ngµy
Nhãm bµ
mÑ trÎ
(20-30)
Thay ®æi
4-7 th¸ng
TB: 6
th¸ng
• Bét
• Bét víi ®Ëu ®ç
Bét víi khoai
t©y vµ rau
• 1-2 lÇn/ngµy
• Tuú vµo mÑ cã nhµ hay cã
ng−êi tr«ng trÎ
Tuú thuéc vµo khi nµo trÎ
thÝch ¨n
Nhãm bµ
mÑ qua
tuæi sinh
®Î (> 45
tuæi)
Thay ®æi:
5-11 th¸ng
TB: 8.5
th¸ng
Bét
N−íc hoa qu¶
• 1-2 lÇn/ngµy
• Tuú thuéc vµo bµ mÑ cã
nhµ hay ng−êi tr«ng trÎ
Tuú thuéc vµo khi nµo trÎ
thÝch ¨n
Một số bảng thường dùng
www.ipmph.edu.vn
Tr×nh ®é v¨n
ho¸
TÇn sè
tuyÖt ®èi
TÇn sè
céng dån
TÇn suÊt
t−¬ng ®èi
TÇn suÊt
céng dån
CÊp I 320 320 48.0 48.0
CÊp II 155 475 23.0 71.0
CÊp III 168 643 25.0 96.0
§¹i häc vµ sau
§H
24 667 4.0 100.0
Tæng céng 667 100.0
• Chỉ biểu thị giá trị của 1 biến số
• Chỉ có 1 cột (hoặc dòng) tổng cộng
• Cho phép mô tả chi tiết về 1 biến số nhưng không thể
hiện được sự liên quan giữa các biến khác nhau
Bảng 1 chiều
18
www.ipmph.edu.vn
Con
MÑ
SDD
B×nh
th−êng
Qu¸ c©n Tæng céng
Mï ch÷ 9 35 1 45
V¨n ho¸ cÊp 1 10 80 5 95
V¨n ho¸>cÊp 1 3 51 6 60
Tæng céng 22 166 12 200
• Biểu thị giá trị của 2 hay nhiều biến số trong 1 bảng
• Có cả cột và dòng tổng cộng
• Ngoài tần số, trong bảng có thể biểu thị cả tỷ lệ theo cột
và dòng
• Cho phép thể hiện được sự liên quan giữa các biến khác
nhau, mà chủ yếu là quan hệ nhân quả.
Bảng 2 chiều
www.ipmph.edu.vn
Con
MÑ
SDD
B×nh
th−êng
Qu¸
c©n
Tæng céng
Mï ch÷
V¨n ho¸ cÊp 1
V¨n ho¸>cÊp 1
Tæng céng
Là bảng chỉ có tên dòng, tên cột mà chưa có số
liệu trong bảng
Thường được phát triển trong giai đoạn lập đề cương
nghiên cứu để biết được ý đồ phân tích số liệu và tránh
bỏ sót biến số
• Cũng có thể là đơn đặt hàng mà người nghiên cứu
muốn người phân tích số liệu điền số liệu vào
Bảng giả (bảng trống)
19
www.ipmph.edu.vn
Trình bày số liệu bằng
biểu đồ và đồ thị
www.ipmph.edu.vn
Tiêu chuẩn của 1 biểu đồ tốt
• Phải có đầy đủ tên biểu đồ, sơ đồ, tên và đơn
vị đo lường trên các trục số, các chú thích
cần thiết
• Thích hợp với loại số liệu muốn trình bày
• Rõ ràng, dễ xem, dễ hiểu và có khả năng tự
giải thích cao nhất
20
www.ipmph.edu.vn
Bài tập: chọn loại biểu đồ thích hợp
§Tỉnh Giới
Nam Nữ÷
Hà Nội 15 37
Thanh Hóa 25 41
Hà Tây 40 28
Hưng Yên 28 11
Bắc Ninh 45 38
Hà Nam 36 42
Tổng cộng 189 197
Ví dụ: Số người được tập huấn về giới
www.ipmph.edu.vn
Khi chuyển sang dạng biểu đồ
21
www.ipmph.edu.vn
§é suy dinh d−ìng Tû lÖ phÇn tr¨m
§é I 25
§éII 18
§é III 7
Phân bố tình trạng suy dinh dưỡng của
trẻ em dưới 5 tuổi
www.ipmph.edu.vn
Phân bố tình trạng CHA theo
nhóm tuổi
22
www.ipmph.edu.vn
Ví dụ khác
• So sánh tỷ lệ khỏi, bong hàn, sâu kế phát, biến
chứng giữa 2 phương pháp hàn răng khác
nhau.
• So sánh số bệnh nhân được chẩn đoán là
thương hàn nằm điều trị tại Khoa Lây bệnh viện
Thanh Nhàn theo giới và theo tháng trong năm
1995.
• Biểu thị mối tương quan giữa huyết áp tâm
trương và lượng Cholesterol trong máu trong số
người già trên 60 tuổi tại cộng đồng A
www.ipmph.edu.vn
Số ca mắc bệnh tiêu chảy theo khu vực
năm 1996
Biểu đồ cột rời
23
www.ipmph.edu.vn
Tỷ lệ mắc bệnh tiêu chảy theo khu vực
năm 1996
Biểu đồ cột rời
www.ipmph.edu.vn
Trung bình và độ lệch chuẩn về điểm kiến
thức của phụ nữ trong 6 xã
Biểu đồ cột rời
24
www.ipmph.edu.vn
Số ca mắc thương hàn được báo cáo trong
2 năm 1995 và 1996
Biểu đồ cột rời
www.ipmph.edu.vn
Tình trạng dinh dưỡng của trẻ em dưới 5
tuổi tại xã H
Biểu đồ cột tròn
25
www.ipmph.edu.vn
Biểu đồ hình cột chồng
Tình trạng dinh dưỡng của trẻ em dưới 5
tuổi tại 3 xã A, B và C
www.ipmph.edu.vn
Tình trạng dinh dưỡng của trẻ em dưới 5
tuổi tại 3 xã A, B và C
Biểu đồ cột rời
26
www.ipmph.edu.vn
Biểu đồ cột rời
Tình trạng dinh dưỡng của trẻ em dưới 5
tuổi tại 3 xã A, B và C
www.ipmph.edu.vn
Phân bố nguồn nước sử dụng theo xã
Phần trăm dân dùng nguồn nước
Nước
suối
Nước
giếng
Nước
mưa
Nước
ao hồ
Nguồn
khác
Xã Nhotou 21 5 2 0 91
Xã Sing 4 100 0 0 0
Xã Long 44 1 1 0 39
Xã Sobbao 100 0 0 0 0
Xã Xienghone 44 99 0 0 89
Xã Phonthong 13 93 21 8 21
Xã Mounlapamok 89 18 59 21 12
Xã Dakchung 78 30 0 0 24
Xã Phouvong 100 0 98 0 0
Chung các xã 48 48 22 4 35
27
www.ipmph.edu.vn
¨
www.ipmph.edu.vn
Số ca mắc thương hàn trong năm 1996
theo các vùng (thang số học)
Biểu đồ đường gấp khúc
28
www.ipmph.edu.vn
Số ca mắc thương hàn trong năm 1996
theo các vùng (thang logarit)
www.ipmph.edu.vn
Số liệu giả định
Biểu đồ cột liên tục
29
www.ipmph.edu.vn
Số liệu giả định
Biểu đồ đa giác
www.ipmph.edu.vn
Bản đồ
30
www.ipmph.edu.vn
Biểu đồ chấm
www.ipmph.edu.vn
• Biểu đồ cột rời: So sánh các tần số, tỷ lệ giữa
các nhóm của một biến định tính, hoặc giá trị
trung bình của các biến định lượng.
• Biểu đồ hình tròn: So sánh các tỷ lệ khác nhau
giữa các loại trong một nhóm của một biến định
tính. Tổng các tỷ lệ này phải bằng 100%.
• Biểu đồ cột chồng: Khi so sánh nhiều nhóm mà
mỗi nhóm có thể vẽ được biểu đồ hình tròn.
• Biểu đồ cột liên tục: Thích hợp với các biến định
lượng khi được phân ra các nhóm khi đó nó trở
thành một biến thứ hạng.
Chức năng của từng loại biểu đồ
31
www.ipmph.edu.vn
• Biểu đồ đa giác: Là một dạng đặc biệt của biểu
đồ cột liên tục khi điểm giữa của các cột này
được nối với nhau theo nguyên tắc diện tích các
cột bằng diện tích đa giác.
• Biểu đồ đường thẳng: Chỉ ra sự biến thiên của
một loại số liệu nào đó theo thời gian. Có thể
ghép nhiều biểu đồ đường thẳng trên cùng một
trục số để tiện so sánh.
• Biểu đồ chấm: Chỉ ra chiều hướng và mức độ
của sự tương quan giữa 2 biến định lượng.
• Bản đồ: Phân bố của một bệnh, một hiện tượng
sức khoẻ nào đó theo địa dư.
Chức năng của từng loại biểu đồ
Các file đính kèm theo tài liệu này:
- tong_hop_va_trinh_bay_so_lieu_hthv_2523.pdf