Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu

Một số yếu tố khác Khống chế tỷ lệ không trả lời Khống chế tỷ lệ mất đối tượng Hệ số thiết kế khi chọn mẫu cụm Các phân tích nâng cao

pdf30 trang | Chia sẻ: truongthinh92 | Lượt xem: 6421 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1/12/2015 1 PHƯƠNG PHÁP CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU PGS. TS. Hoàng Văn Minh Đại học Y Hà nội NỘI DUNG 1. Một số khái niệm cơ bản 2. Phương pháp chọn mẫu 3. Phương pháp tính toán cỡ mẫu 1/12/2015 2 Quần thể và mẫu Quần thể Mẫu Là 1 phần của quần thể, bao gồm những cá thể mà chúng ta sẽ nghiên cứu Bao gồm toàn bộ các cá thể mà chúng ta đang quan tâm Chọn mẫu và ngoại suy Quần thể Mẫu Chọn mẫu Ngoại suy Nghiên cứu 1/12/2015 3 Mẫu Quần thể Sai số (Errors) Sai số hệ thống (Sai chệch) Sai số ngẫu nhiên (May rủi) Ngoại suy Chọn mẫu Cỡ mẫu Xác định đối tượng nghiên cứu Xác định phương pháp chọn mẫu Tính toán cỡ mẫu Tuyển chọn đối tượng nghiên cứu theo phương pháp chọn mẫu và cỡ mẫu đã được xác định 1/12/2015 4 Quẩn thể nghiên cứu Đối tượng nghiên cứu Là đối tượng đích của nghiên cứu Có các đặc tính chúng ta đang quan tâm (được nêu trong mục tiêu nghiên cứu) Xác định đối tượng nghiên cứu Đối tượng nghiên cứu Nguồn số liệu Xác định đối tượng nghiên cứu Nguồn số liệu có thể là người cung cấp số liệu, cơ sở dữ liệu, báo cáo, bệnh án chứa các số liệu 1/12/2015 5 Đối tượng nghiên cứu Tiêu chuẩn lựa chọn Tiêu chuẩn loại trừ (Đã có đủ tiêu chuẩn lựa chọn) o Đặc điểm cá nhân: Phụ nữ dưới 65 tuổi o Đặc điểm lâm sàng: Được chẩn đoán mắc tăng huyết áp theo tiêu chuẩn JNC7 o Đặc điểm địa dư (hành chính): Sống tại Hà nội, điều trị tại Viện tim mạch o Đặc điểm thời gian: Thời gian điều trị từ 1/1/2014-31/12/2014 o Khó khăn trong việc cung cấp thông tin: Không có khả năng giao tiếp, không hợp tác o Có thể bị mất theo dõi: Có thể chuyển sang nơi khác sinh sống, nhà xa Chọn mẫu • Là quy trình chọn cá thể đại diện cho quần thể để tham gia vào nghiên cứu • Điều kiện – Mẫu phải đại diện cho quần thể – Cỡ mẫu đủ lớn 1/12/2015 6 Chọn mẫu Xác suất Không xác suất Chọn mẫu không xác suất • Khái niệm: Xác suất các cá thể được lựa chọn vào mẫu là không giống nhau • Phương pháp: – Chọn mẫu thuận tiện: Tình nguyện tham gia – Chọn mẫu chỉ tiêu: ½ nam + ½ nữ – Chọn mẫu bóng tuyết: Giới thiệu người tiếp theo tham gia nghiên cứu • Ưu điểm: Đơn giản, nhanh, không tốn kém • Nhược điểm: Gây ra sai chệch lựa chọn • Ứng dụng: Thường chỉ sử dụng trong nghiên cứu thử, nghiên cứu trường hợp hoặc nghiên cứu định tính 1/12/2015 7 Chọn mẫu xác suất • Khái niệm: Xác suất các cá thể được lựa chọn vào mẫu là không giống nhau • Phương pháp: 1. Chọn mẫu ngẫu nhiên đơn (Simple random sampling) 2. Chọn mẫu ngẫu nhiên hệ thống (Systematic random sampling) 3. Chọn mẫu phân tầng (Stratifed sampling) 4. Chọn mẫu theo cụm (chùm) (Cluster sampling) 5. Chọn mẫu nhiều giai đoạn (Multi-stage sampling) Xác suất lựa chọn = Cỡ mẫu Tổng số cá thể của quần thể Chọn mẫu ngẫu nhiên đơn 1/12/2015 8 Chän mÉu ngÉu nhiªn ®¬n QuÇn thÓ =N MÉu =n p s P   X Chọn mẫu ngẫu nhiên đơn • Ưu điểm: – Đơn giản, dễ làm – Có tính ngẫu nhiên và đại diện cao. – Dễ phân tích số liệu – Là cơ sở của các kỹ thuật chọn mẫu khác. • Hạn chế: – Tốn kém trong quá trình thu thập số liệu (trong các điều tra cộng đồng) – Cần danh sách cá thể trong quần thể 1/12/2015 9 Chọn mẫu ngẫu nhiên hệ thống • Xác định khung mẫu và đánh số đơn vị mẫu • Xác định khoảng cách mẫu: k= N/n • Xác định đơn vị mẫu đầu tiên (i) nằm giữa 1 và k bằng PP ngẫu nhiên đơn. • Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu đầu tiên, tiếp tục cho đến khi đủ số mẫu: i + 1k; i + 2k; i + 3k... Chän mÉu ngÉu nhiªn hÖ thèng Sè ngÉu nhiªn ®îc chän gi÷a 1 vµ k i i + k i + 2k i + 3k i + (n-1)k k k k k k k 1/12/2015 10 Chọn mẫu ngẫu nhiên hệ thống • Ưu điểm: – Nhanh và dễ áp dụng – Ít tốn kém – Đơn giản trong điều kiện thực địa • Hạn chế: – Đơn vị mẫu không xếp ngẫu nhiên hoặc trùng với k, thiếu đại diện. Chọn mẫu phân tầng • Chia quần thể các tầng(strata). Các cá thể trong mỗi tầng tương đồng về đặc tính nào đó • Chọn mẫu ngẫu nhiên đơn hay chọn mẫu hệ thống ở mỗi tầng • Cỡ mẫu mỗi tầng có thể – Bằng nhau (chọn mẫu phân tầng không tỷ lệ với kích cỡ quần thể) – Không bằng nhau: Tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân tầng tỷ lệ với kích cỡ quần thể ) 1/12/2015 11 Chän mÉu ph©n tÇng TÊt c¶ bÖnh viÖn B/V lín B/V võa B/V nhá n1 n2 n3 Tầng 1 Tầng 2 N1= 2000 N2 = 6000 n1=400 n2=400 1/12/2015 12 Tầng 1 Tầng 2 N1= 2000 N2 = 6000 n1=200 n2=600 Chọn mẫu phân tầng • Ưu điểm: – Đảm bảo tính đại diện của mỗi nhóm trong tổng mẫu – Dễ thu thập số liệu • Hạn chế: – Thiếu chính xác khi số lượng đơn vị mẫu ở mỗi tầng quá ít 1/12/2015 13 Chọn mẫu theo cụm (chùm) • Xác định cụm (Dựa trên nơi sinh sống, đơn vị hành chính). • Lập danh sách cụm • Chọn cụm ngẫu nghiên từ danh sách. • Chọn cá thể: – Lấy tất cả các cá thể (nếu không có danh sách) của các chùm (chùm 1 bậc) – Lập danh sách, chọn cá thể bằng PP ngẫu nhiên đơn hoặc hệ thống (chùm 2 bậc). Chän mÉu chïm n1 n2 n3 1/12/2015 14 Chọn mẫu theo cụm (chùm) • Ưu điểm – Có thể áp dụng trong điều tra có phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu. – Khung mẫu đơn giản (danh sách các cụm), dễ lập. – Điều tra dễ & nhanh=> Có hiệu quả kinh tế (kinh phí, thời gian) • Hạn chế: – Tính đại diện thấp (hệ số thiết kế) – Phân tích số liệu phức tạp Chọn mẫu nhiều giai đoạn • Là dạng phức tạp của chọn mẫu cụm (Chọn mẫu cụm là chọn mẫu 2 giai đoạn) • Ví dụ: Chọn tỉnh=> huyện=> xã=>làng 1/12/2015 15 Chọn mẫu tầng Chọn mẫu cụm Phân biệt Có đại diện của tất cả các tầng trong mẫu Chỉ 1 số cụm được lựa chọn vào mẫu 1/12/2015 16 hoangvanminh@hmu.edu.vn Cỡ mẫu chính xác 1/12/2015 17 Cỡ mẫu Kinh phí Cỡ mẫu = ---------------- Chi phí 1 mẫu Cỡ mẫu 1. Loại biến số được phân tích (định lượng, định tính) 2. Mục tiêu phân tích (xác định tỷ lệ hay kiểm định sự khác biệt...) 3. Mức ý nghĩa thống kê (=5%, 1%) 4. Độ mạnh (mức độ ngoại suy) (1-=80%,90%) 5. Mức độ sai số giữa các tham số mẫu và tham số quần thể 6. Kết quả từ NC trước đây, NC thử, ước tính, mong muốn... 7. Một số yếu tố khác 1/12/2015 18 Biến số Định lượng Định tính Đường máu Có bệnh-không có bệnh Mục tiêu phân tích Xác định So sánh Xác định tỷ lệ cao huyết áp ở bệnh nhân ĐTĐ So sánh tỷ lệ khỏi bệnh của 2 ph. pháp điều trị 1/12/2015 19 Kiểm định giả thuyết Giả thuyết Ho: Không có sự khác biệt Giả thuyết Ha: Có sự khác biệt Sai lầm Thực tế  Quyết định H0 đúng H0 sai Chấp nhận H0  Sai lầm II () Loại bỏ H0 Sai lầm I ()  1/12/2015 20 Mức ý nghĩa thống kê Loại bỏ sai lầm loại I  = 0.05 p = probability= Xác suất để giả thuyết Ho đúng P<0.05 = Xác suất để giả thuyết Ho đúng là < 5% = Ho xảy ra chỉ là may rủi = Bác bỏ Ho = Xác suất để giả thuyết Ha đúng là > 95% = Ha xảy ra là chắc chắn = Chấp nhận Ha P>0.05 = ??? Độ mạnh Loại bỏ sai lầm loại II 1-  = 80% Thường dùng trong tính toán cỡ mẫu 1/12/2015 21 Mức ý nghĩa thống kê () z (1-/2) .01 (99) 2.576 .02 (98) 2.326 .05 (95) 1.960 .10 (90) 1.645 Độ mạnh (1-) z (1-) .80 0.842 .85 1.036 .90 1.282 .95 1.645 Sai số (mức chính xác) Mức sai số giữa kết quả tính toán từ mẫu so với kết quả thực của quần thể • Tuyệt đối (hiệu số):  hoặc d • Tương đối (thương số): 1/12/2015 22 Cỡ mẫu xác định 1 tỷ lệ Xác định tỷ lệ mắc bệnh X trong số người đến khám sức khỏe. Biết rằng 1 NC trước đây báo cáo tỷ lệ 10%. Mức ý nghĩa thống kê =5% 1/12/2015 23 Cỡ mẫu xác định 1 tỷ lệ n: Cỡ mẫu tối thiểu z (1-/2)= 1,96 P: Tỷ lệ mong đợi : Độ chính xác tương đối Cỡ mẫu so sánh 2 tỷ lệ Một phương pháp điều trị hiện tại cho tỉ lệ đáp ứng là 30%. Giả thuyết rằng phương pháp điều trị mới sẽ có tỉ lệ đáp ứng là 40%. Xác định cỡ mẫu cho nghiên cứu này nếu mức ý nghĩa thống kê là 95% và độ mạnh là 80% 1/12/2015 24 Cỡ mẫu so sánh 2 tỷ lệ n: cỡ mẫu tối thiểu P1: Tỷ lệ đáp ứng với phương pháp cũ P2: Tỷ lệ đáp ứng với phương pháp mới P: =(P1+P2)/2 z (1-/2)= 1,96 z (1-)= 0,842 Cỡ mẫu so sánh 2 số trung bình Xác định cỡ mẫu cho nghiên cứu đánh giá tác dụng giảm huyết áp của 2 loại thuốc. Giả sử sự khác biệt ước đoán là 10mmHg, độ lệch chuẩn là 10mmHg. Chọn mức ý nghĩa thống kê là 95% và độ mạnh là 80% 1/12/2015 25 Cỡ mẫu so sánh 2 số trung bình Độ lệnh chuẩn σ =10 0- a =10 z (1-/2)= 1,96 z (1-)= 0,842 Một số yếu tố khác Khống chế tỷ lệ không trả lời Khống chế tỷ lệ mất đối tượng Hệ số thiết kế khi chọn mẫu cụm Các phân tích nâng cao 1/12/2015 26 Cỡ mẫu khác nhau giữa 2 nhóm • N’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh • k: tỷ số giữa 2 nhóm (thường KHÔNG QUÁ 2) Cỡ mẫu khác nhau giữa 2 nhóm • N’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh=1200 • k: tỷ số giữa 2 nhóm=2 1/12/2015 27 Cỡ mẫu khống chế không trả lời • N’’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh • q: tỷ số không trả lời Cỡ mẫu khống chế không trả lời • N’’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh=52 • q: tỷ số không trả lời=10% 1/12/2015 28 Cỡ mẫu nghiên cứu tính giá trị Thực tế (Chuẩn vàng) Có bệnh Không bệnh Test Dương tính a (Dương tính thật) b (Dương tính giả) Âm tính c (Âm tính giả) d (Âm tính thật) Độ nhạy= a/(a+c) Độ đặc hiệu = d/(b+d) 1/12/2015 29 Cỡ mẫu nghiên cứu tính độ nhạy N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SN: Độ nhạy mong đợi Z: 1,96 (=5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh Cỡ mẫu nghiên cứu tính độ nhạy N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SN: Độ nhạy mong đợi=95% Z: 1,96 (=5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh 1/12/2015 30 Cỡ mẫu nghiên cứu tính giá trị N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SP: Độ đặc hiệu mong đợi Z: 1,96 (=5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh Cỡ mẫu nghiên cứu tính độ đặc hiệu N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SP: Độ đặc hiệu mong đợi=80% Z: 1,96 (=5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh

Các file đính kèm theo tài liệu này:

  • pdfchon_mau_va_co_mau_hvm_8849.pdf