Bài giảng Tổng hợp và trình bày số liệu

• Biểu đồ đa giác: Là một dạng đặc biệt của biểu đồ cột liên tục khi điểm giữa của các cột này được nối với nhau theo nguyên tắc diện tích các cột bằng diện tích đa giác. • Biểu đồ đường thẳng: Chỉ ra sự biến thiên của một loại số liệu nào đó theo thời gian. Có thể ghép nhiều biểu đồ đường thẳng trên cùng một trục số để tiện so sánh. • Biểu đồ chấm: Chỉ ra chiều hướng và mức độ của sự tương quan giữa 2 biến định lượng. • Bản đồ: Phân bố của một bệnh, một hiện tượng sức khoẻ nào đó theo địa dư.

pdf31 trang | Chia sẻ: truongthinh92 | Ngày: 01/08/2016 | Lượt xem: 632 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài giảng Tổng hợp và trình bày số liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1 TỔNG HỢP VÀ TRÌNH BÀY SỐ LiỆU Hoàng Thị Hải Vân Bộ môn Thống kê Tin học Y học Viện Đào tạo YHDP&YTCC ĐT: 0912693335 Email: hoangthihaivan@hmu.edu.vn www.ipmph.edu.vn Mục tiêu 1. Phân biệt được các khái niệm tần số, tỷ lệ, tỷ số, tỷ suất, giá trị trung bình, trung vị, mốt, độ lệch chuẩn và hệ số biến thiên 2. Tổ chức và tổng hợp được các loại số liệu cho các biến định tính và định lượng. 3. Liệt kê được các loại bảng, biểu đồ thị và các chức năng của chúng 4. Lựa chọn cách tổng hợp và biểu thị thích hợp với 1 bộ số liệu cụ thể. 2 www.ipmph.edu.vn Quần thể đích QuÇn thÓ nghiªn cøu MÉu Tham sè quÇn thÓ (µ, σ, P...)MÉu x¸c suÊt - NgÉu nhiªn ®¬n - NgÉu nhiªn hÖ thèng - MÉu ph©n tÇng - MÉu chïm - MÉu nhiÒu bËc MÉu kh«ng x¸c suÊt - MÉu kinh nghiÖm - MÉu thuËn tiÖn - MÉu chØ tiªu - MÉu cã môc ®Ých. Chän mÉu ¦íc l−îng • ®iÓm • kho¶ng KiÓm ®Þnh gi¶ thuyÕt Suy luËn th«ng kª (ChØ ¸p dông cho mÉu x¸c suÊt víi cì mÉu ®ñ lín) KÕt luËn ngo¹i suy - Khung chän mÉu - Ьn vÞ quan s¸t - Ьn vÞ mÉu - C¸c chØ sè C¸c test thèng kª Gi¸ trÞ p Lùa chän M« t¶ c¸c tham sè mÉu (trình bày kết quả nghiên cứu) Tham sè mÉu ( , s, p...)XBiÕn sè www.ipmph.edu.vn Số liệu Định tính Định lượng 3 www.ipmph.edu.vn TỔNG HỢP SỐ LIỆU VỚI CÁC BIẾN ĐỊNH TÍNH www.ipmph.edu.vn Tổng hợp số liệu với các biến định tính • Tần suất • Tỷ lệ • Tỷ số • Tỷ suất 4 www.ipmph.edu.vn 1. Tần suất (frequency) • Biểu thị số lần xuất hiện của 1 quan sát nào đó • Ví dụ: Phân bố trình độ học vấn của 30 bà mẹ có con dưới 5 tuổi tại 1 xã (số liệu giả định). 22Tæng céng 6Nïng 12Tµy 4Kinh TÇn sè§Õm sè lÇn xuÊt hiÖn Gi¸ trÞ biÕnGiá trị biến số Số lần xuất hiện (Tần suất) Tiểu học (cấp I) 12 Trung học cơ sở (Cấp II) 8 Phổ thông trung học (Cấp III) 6 Cao đẳng/Đại học 4 Tổng số 30 www.ipmph.edu.vn 2. Tỷ số (ratio): • Là phân số mà mẫu số không bao hàm tử số • Tử số và mẫu số có thể khác nhau về đơn vị đo lường •Hệ số k có thể là 1, 10, 100, 1000... Ví dụ: tỷ số giới tính khi sinh a --- x k b 5 www.ipmph.edu.vn • Ví dụ về tỷ số giới tính khi sinh của Việt Nam Nguồn: Bộ Kế hoạch đầu tư, Tổng cục Thống kê (2011). Tổng điều tra dân số và nhà ở Việt Nam 2009. www.ipmph.edu.vn 3. Tỷ lệ (proportion) • Là 1 phân số mà mẫu số bao hàm tử số, do vậy cả mẫu và tử đều phải cùng đơn vị a ------- x k a + b • Hệ số k có thể là 1, 10, 100, 1000... • Khi k = 100, ta có tỷ lệ phần trăm (percentage) • Ví dụ: số sinh viên nam Tỷ lệ sinh viên nam = ----------------------- tổng số sinh viên 6 www.ipmph.edu.vn • Ví dụ về tỷ lệ phần trăm: Tỷ lệ phần trăm trình độ văn hóa của các bà mẹ có con dưới 5 tuổi (số liệu giả định) Trình độ văn hóa Tần suất Tỷ lệ % Tiểu học (cấp I) 120 40.0 Trung học cơ sở (Cấp II) 80 26.7 Phổ thông trung học (Cấp III) 60 20.0 Cao đẳng/Đại học 40 13.3 Tổng số 300 100,0 www.ipmph.edu.vn 4. Tỷ suất (rate): • Là một dạng của tỷ số hay tỷ lệ tuy nhiên có kèm theo yếu tố thời gian • Công thức: số biến cố xẩy ra trong 1 khoảng thời gian ------------------------------------------------------------ x k dân số trung bình trong khoảng thời gian đó • Hệ số k có thể là 1, 10, 100, 1000... • Ví dụ: số người bị sốt rét tại huyện A năm 2000 ------------------------------------------------------------- x 100 dân số trung bình của huyện A trong năm đó 7 www.ipmph.edu.vn TỔNG HỢP SỐ LIỆU VỚI BIẾN ĐỊNH LƯỢNG www.ipmph.edu.vn Tổng hợp số liệu với biến định lượng • Đo lường độ tập trung – Trung bình – Trung vị – Mốt • Đo lường độ phân tán – Khoảng số liệu – Hệ số biến thiên 8 www.ipmph.edu.vn • Trung bình số học hay còn gọi là giá trị trung bình được tính bằng tổng số các giá trị quan sát của một tập hợp chia cho số giá trị quan sát của tập hợp đó. • Giá trị trung bình chỉ tính được với các số dạng liệu số (biến định lượng) n X n XXXX n i i n ∑ = = +++ = 121 ... Trung bình số học (Arthmetic mean) www.ipmph.edu.vn • Ví dụ: tính trung bình cân nặng của 20 sinh viên Sinh viên số Cân nặng Sinh viên số Cân nặng 1 60.0 11 70.0 2 62.5 12 70.0 3 62.5 13 72.5 4 65.0 14 72.5 5 65.0 15 72.5 6 67.5 16 75.0 7 67.5 17 75.0 8 67.5 18 77.5 9 67.5 19 77.5 10 70.0 20 80.0 Cân nặng trung bình của cỡ mẫu nghiên cứu trên là: = 1397.5 / 20 = 69.8 kg 9 www.ipmph.edu.vn • Là giá trị giữa của 1 bộ số liệu khi chúng được sắp xếp theo thứ tự tăng dần hoặc giảm dần. • Chia sự phân bố của số liệu thành hai phần bằng nhau • Trong trường hợp bộ số liệu có số quan sát là số lẻ, giá trị trung vị là giá trị của quan sát thứ (n+1)/2 • Trong trường hợp bộ số liệu có số quan sát là số chẵn, giá trị trung vị được tính bằng giá trị trung bình cộng của hai giá trị quan sát ở giữa bộ số liệu là quan sát thứ n/2 và (n/2+1) Trung vị (Median) www.ipmph.edu.vn • Ví dụ: ta có bộ số liệu: 47, 41, 44, 43, 42, 40, 72 kg. • để tính trung vị, trước hết sắp xếp số liệu theo thứ tự: 40, 41, 42, 43, 44, 47, 72 kg. • trung vị sẽ là giá trị của quan sát thứ (n+1)/2, tức là (7+1)/2 =4, và giá trị thứ 4 = 43 kg là trung vị. • Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 = (43+44)/2 = 43,5 10 www.ipmph.edu.vn Đặc điểm giá trị trung vị: • Trung vị thường được áp dụng khi một số số liệu quá lớn hay quá nhỏ so với những số liệu còn lại (phân bố lệch) • Trung vị không bị ảnh hưởng bởi các giá trị quá lớn hoặc quá nhỏ trong bộ số liệu vì trung vị là giá trị ở giữa của bộ số liệu www.ipmph.edu.vn • Là giá trị quan sát được nhiều lần nhất trong bộ số liệu • Mốt ít có giá trị trong đo lường độ tập trung của bộ số liệu khi ở dạng định lượng, nhưng có giá trị với bộ số liệu phân nhóm, hoặc biến định tính • Ở ví dụ 1 ta có giá trị mốt bằng 67.0 kg, có nghĩa là tập hợp sinh viên của của nhóm nghiên cứu này phổ biến có cân nặng là 67kg • Ở ví dụ 2 ta có giá trị mốt bằng 64.0 kg, có nghĩa là tập hợp sinh viên của nhóm nghiên cứu này phổ biến có cân nặng là 64.0kg Mốt (Mode) 11 www.ipmph.edu.vn • Trong một bộ số liệu có thể không có Mốt khi tất cả các giá trị xuất hiện với cùng một tần số. • Một bộ số liệu có thể có một mốt, hai mốt hoặc nhiều mốt. www.ipmph.edu.vn Phân biệt giá trị trung bình, trung vị và mốt Mốt Trung vị Trung bình 12 www.ipmph.edu.vn • Giá trị trung bình chứa đựng nhiều thông tin hơn vì giá trị của mỗi quan sát đều nằm trong tính toán giá trị trung bình. • Khi bộ số liệu phân bố lệch (không chuẩn) thì giá trị trung bình có thể bị ảnh hưởng bởi các giá trị quá lớn hoặc quá nhỏ, trong khi giá trị trung vị và mốt thì không bị ảnh hưởng. • Khi số liệu phân bố chuẩn, giá trị trung bình, trung vị và mốt đều bằng nhau và nằm ở trung tâm của phân bố. • Khi phân bố có các giá trị cực thấp (nghiêng trái) và cực cao (nghiêng phải) thì các giá trị này nằm ở các vị trí khác nhau www.ipmph.edu.vn TỔNG HỢP SỐ LiỆU VỚI BiẾN ĐỊNH LƯỢNG 2. Đo lường độ phân tán (Measure of dispersion) 13 www.ipmph.edu.vn • Khoảng số liệu (range): • Là hiệu giữa hai giá trị đo lường cao nhất và thấp nhất trong một bộ số liệu. • Khoảng số liệu (R) = Xmax – Xmin • Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44, 47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg. 1 )( 1 2 2 − − = ∑ = n XXi s n i Phương sai (variance) Là tổng bình phương các khoảng cách giữa giá trị chia cho số các quan sát trừ đi 1. Độ lệch chuẩn (standard deviation) 2ss = Khoảng số liệu (range) www.ipmph.edu.vn Ví dụ 6 10 0 30 Σ 12104 Bình phương khoảng chênh lệch giữa giá trị quan sát so với giá trị trung bình 12-10-2Khoảng chênh lệch so với giá trị trung bình 78564Tỷ lệ phụ nữ làm kinh tế giỏi (Xi) 0100999897 )( XXi − 5,2 4 10 1 )( 1 2 2 == − − = ∑ = n XXi s n i X 2)( XXi − 58,15,2 ==⇒ s 14 www.ipmph.edu.vn • Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung bình • Hệ số biến thiên được biểu thị bằng tỷ lệ phần trăm (%) và biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị trung bình • Giúp cho việc so sánh mức độ phân tán của nhiều bộ số liệu với nhau: • Ví dụ: • CV của cân nặng nam =12/60 = 20% • CV của cân nặng nữ = 8/54 = 15% • Vậy bộ số liệu của cân nặng nam phân tán hơn X sCV = Hệ số biến thiên (coeficient of variation) www.ipmph.edu.vn Ưu điểm của phân tích số liệu định lượng 2500 gr 300 trẻ 200 trẻ A 2500 gr 300 trẻ 200 trẻ B BA XX >>PA = PB = 60% 15 www.ipmph.edu.vn PA = PB = 40% 2500 gr 300 trẻ 200 trẻ A 2500 gr 300 trẻ 200 trẻ B BA XX ≈ sB >> sA Ưu điểm của phân tích số liệu định lượng www.ipmph.edu.vn Trình bày số liệu bằng bảng 16 www.ipmph.edu.vn Một số bảng thường dùng • Để biểu thị tần số các quan sát theo các nhóm, loại khác nhau của 1 biến hoặc nhiều biến Keát quaû ñieàu trò Thuoác A Thuoác B Toång Khoûi beänh 12 26 38 Coù caûi thieän 8 15 23 Khoâng thay ñoåi 30 9 39 Toång 50 50 100 www.ipmph.edu.vn Có thể biểu thị cả các tỷ lệ hoặc giá trị trung bình, Trung bình Ñöôøng huyeát sau ÑT Ñöôøng huyeát tröôùc ÑT Trung bìnhThuoác BThuoác AKQ ñieàu trò sX ± sX ± sX ± sX ± sX ± sX ± sX ± sX ± sX ± Một số bảng thường dùng 17 www.ipmph.edu.vn Khi bảng chứa các chữ, ký hiệu thì được goi là bảng ma trận (matrix) Nhãm tuæi ¡n sam lÇn ®Çu Lo¹i thøc ¨n Sè lÇn ¨n/ngµy Nhãm bµ mÑ trÎ (20-30) Thay ®æi 4-7 th¸ng TB: 6 th¸ng • Bét • Bét víi ®Ëu ®ç  Bét víi khoai t©y vµ rau • 1-2 lÇn/ngµy • Tuú vµo mÑ cã nhµ hay cã ng−êi tr«ng trÎ  Tuú thuéc vµo khi nµo trÎ thÝch ¨n Nhãm bµ mÑ qua tuæi sinh ®Î (> 45 tuæi) Thay ®æi: 5-11 th¸ng TB: 8.5 th¸ng  Bét  N−íc hoa qu¶ • 1-2 lÇn/ngµy • Tuú thuéc vµo bµ mÑ cã nhµ hay ng−êi tr«ng trÎ  Tuú thuéc vµo khi nµo trÎ thÝch ¨n Một số bảng thường dùng www.ipmph.edu.vn Tr×nh ®é v¨n ho¸ TÇn sè tuyÖt ®èi TÇn sè céng dån TÇn suÊt t−¬ng ®èi TÇn suÊt céng dån CÊp I 320 320 48.0 48.0 CÊp II 155 475 23.0 71.0 CÊp III 168 643 25.0 96.0 §¹i häc vµ sau §H 24 667 4.0 100.0 Tæng céng 667 100.0 • Chỉ biểu thị giá trị của 1 biến số • Chỉ có 1 cột (hoặc dòng) tổng cộng • Cho phép mô tả chi tiết về 1 biến số nhưng không thể hiện được sự liên quan giữa các biến khác nhau Bảng 1 chiều 18 www.ipmph.edu.vn Con MÑ SDD B×nh th−êng Qu¸ c©n Tæng céng Mï ch÷ 9 35 1 45 V¨n ho¸ cÊp 1 10 80 5 95 V¨n ho¸>cÊp 1 3 51 6 60 Tæng céng 22 166 12 200 • Biểu thị giá trị của 2 hay nhiều biến số trong 1 bảng • Có cả cột và dòng tổng cộng • Ngoài tần số, trong bảng có thể biểu thị cả tỷ lệ theo cột và dòng • Cho phép thể hiện được sự liên quan giữa các biến khác nhau, mà chủ yếu là quan hệ nhân quả. Bảng 2 chiều www.ipmph.edu.vn Con MÑ SDD B×nh th−êng Qu¸ c©n Tæng céng Mï ch÷ V¨n ho¸ cÊp 1 V¨n ho¸>cÊp 1 Tæng céng Là bảng chỉ có tên dòng, tên cột mà chưa có số liệu trong bảng  Thường được phát triển trong giai đoạn lập đề cương nghiên cứu để biết được ý đồ phân tích số liệu và tránh bỏ sót biến số • Cũng có thể là đơn đặt hàng mà người nghiên cứu muốn người phân tích số liệu điền số liệu vào Bảng giả (bảng trống) 19 www.ipmph.edu.vn Trình bày số liệu bằng biểu đồ và đồ thị www.ipmph.edu.vn Tiêu chuẩn của 1 biểu đồ tốt • Phải có đầy đủ tên biểu đồ, sơ đồ, tên và đơn vị đo lường trên các trục số, các chú thích cần thiết • Thích hợp với loại số liệu muốn trình bày • Rõ ràng, dễ xem, dễ hiểu và có khả năng tự giải thích cao nhất 20 www.ipmph.edu.vn Bài tập: chọn loại biểu đồ thích hợp §Tỉnh Giới Nam Nữ÷ Hà Nội 15 37 Thanh Hóa 25 41 Hà Tây 40 28 Hưng Yên 28 11 Bắc Ninh 45 38 Hà Nam 36 42 Tổng cộng 189 197 Ví dụ: Số người được tập huấn về giới www.ipmph.edu.vn Khi chuyển sang dạng biểu đồ 21 www.ipmph.edu.vn §é suy dinh d−ìng Tû lÖ phÇn tr¨m §é I 25 §éII 18 §é III 7 Phân bố tình trạng suy dinh dưỡng của trẻ em dưới 5 tuổi www.ipmph.edu.vn Phân bố tình trạng CHA theo nhóm tuổi 22 www.ipmph.edu.vn Ví dụ khác • So sánh tỷ lệ khỏi, bong hàn, sâu kế phát, biến chứng giữa 2 phương pháp hàn răng khác nhau. • So sánh số bệnh nhân được chẩn đoán là thương hàn nằm điều trị tại Khoa Lây bệnh viện Thanh Nhàn theo giới và theo tháng trong năm 1995. • Biểu thị mối tương quan giữa huyết áp tâm trương và lượng Cholesterol trong máu trong số người già trên 60 tuổi tại cộng đồng A www.ipmph.edu.vn Số ca mắc bệnh tiêu chảy theo khu vực năm 1996 Biểu đồ cột rời 23 www.ipmph.edu.vn Tỷ lệ mắc bệnh tiêu chảy theo khu vực năm 1996 Biểu đồ cột rời www.ipmph.edu.vn Trung bình và độ lệch chuẩn về điểm kiến thức của phụ nữ trong 6 xã Biểu đồ cột rời 24 www.ipmph.edu.vn Số ca mắc thương hàn được báo cáo trong 2 năm 1995 và 1996 Biểu đồ cột rời www.ipmph.edu.vn Tình trạng dinh dưỡng của trẻ em dưới 5 tuổi tại xã H Biểu đồ cột tròn 25 www.ipmph.edu.vn Biểu đồ hình cột chồng Tình trạng dinh dưỡng của trẻ em dưới 5 tuổi tại 3 xã A, B và C www.ipmph.edu.vn Tình trạng dinh dưỡng của trẻ em dưới 5 tuổi tại 3 xã A, B và C Biểu đồ cột rời 26 www.ipmph.edu.vn Biểu đồ cột rời Tình trạng dinh dưỡng của trẻ em dưới 5 tuổi tại 3 xã A, B và C www.ipmph.edu.vn Phân bố nguồn nước sử dụng theo xã Phần trăm dân dùng nguồn nước Nước suối Nước giếng Nước mưa Nước ao hồ Nguồn khác Xã Nhotou 21 5 2 0 91 Xã Sing 4 100 0 0 0 Xã Long 44 1 1 0 39 Xã Sobbao 100 0 0 0 0 Xã Xienghone 44 99 0 0 89 Xã Phonthong 13 93 21 8 21 Xã Mounlapamok 89 18 59 21 12 Xã Dakchung 78 30 0 0 24 Xã Phouvong 100 0 98 0 0 Chung các xã 48 48 22 4 35 27 www.ipmph.edu.vn ¨ www.ipmph.edu.vn Số ca mắc thương hàn trong năm 1996 theo các vùng (thang số học) Biểu đồ đường gấp khúc 28 www.ipmph.edu.vn Số ca mắc thương hàn trong năm 1996 theo các vùng (thang logarit) www.ipmph.edu.vn Số liệu giả định Biểu đồ cột liên tục 29 www.ipmph.edu.vn Số liệu giả định Biểu đồ đa giác www.ipmph.edu.vn Bản đồ 30 www.ipmph.edu.vn Biểu đồ chấm www.ipmph.edu.vn • Biểu đồ cột rời: So sánh các tần số, tỷ lệ giữa các nhóm của một biến định tính, hoặc giá trị trung bình của các biến định lượng. • Biểu đồ hình tròn: So sánh các tỷ lệ khác nhau giữa các loại trong một nhóm của một biến định tính. Tổng các tỷ lệ này phải bằng 100%. • Biểu đồ cột chồng: Khi so sánh nhiều nhóm mà mỗi nhóm có thể vẽ được biểu đồ hình tròn. • Biểu đồ cột liên tục: Thích hợp với các biến định lượng khi được phân ra các nhóm khi đó nó trở thành một biến thứ hạng. Chức năng của từng loại biểu đồ 31 www.ipmph.edu.vn • Biểu đồ đa giác: Là một dạng đặc biệt của biểu đồ cột liên tục khi điểm giữa của các cột này được nối với nhau theo nguyên tắc diện tích các cột bằng diện tích đa giác. • Biểu đồ đường thẳng: Chỉ ra sự biến thiên của một loại số liệu nào đó theo thời gian. Có thể ghép nhiều biểu đồ đường thẳng trên cùng một trục số để tiện so sánh. • Biểu đồ chấm: Chỉ ra chiều hướng và mức độ của sự tương quan giữa 2 biến định lượng. • Bản đồ: Phân bố của một bệnh, một hiện tượng sức khoẻ nào đó theo địa dư. Chức năng của từng loại biểu đồ

Các file đính kèm theo tài liệu này:

  • pdftong_hop_va_trinh_bay_so_lieu_hthv_2523.pdf
Tài liệu liên quan