Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu
Một số yếu tố khác Khống chế tỷ lệ không trả lời Khống chế tỷ lệ mất đối tượng Hệ số thiết kế khi chọn mẫu cụm Các phân tích nâng cao
Bạn đang xem trước 20 trang tài liệu Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1/12/2015
1
PHƯƠNG PHÁP CHỌN MẪU
VÀ TÍNH TOÁN CỠ MẪU
PGS. TS. Hoàng Văn Minh
Đại học Y Hà nội
NỘI DUNG
1. Một số khái niệm cơ bản
2. Phương pháp chọn mẫu
3. Phương pháp tính toán cỡ mẫu
1/12/2015
2
Quần thể và mẫu
Quần thể
Mẫu
Là 1 phần của quần thể, bao gồm những cá thể
mà chúng ta sẽ nghiên cứu
Bao gồm
toàn bộ
các cá thể
mà chúng
ta đang
quan tâm
Chọn mẫu và ngoại suy
Quần thể
Mẫu
Chọn mẫu Ngoại suy
Nghiên cứu
1/12/2015
3
Mẫu Quần thể
Sai số
(Errors)
Sai số hệ thống
(Sai chệch)
Sai số ngẫu nhiên
(May rủi)
Ngoại suy
Chọn mẫu Cỡ mẫu
Xác định đối tượng nghiên cứu
Xác định phương pháp chọn mẫu
Tính toán cỡ mẫu
Tuyển chọn đối tượng nghiên cứu
theo phương pháp chọn mẫu và
cỡ mẫu đã được xác định
1/12/2015
4
Quẩn thể
nghiên
cứu
Đối tượng
nghiên
cứu
Là đối tượng đích của nghiên cứu
Có các đặc tính chúng ta đang quan tâm
(được nêu trong mục tiêu nghiên cứu)
Xác định đối tượng nghiên cứu
Đối tượng
nghiên cứu
Nguồn số
liệu
Xác định đối tượng nghiên cứu
Nguồn số liệu có thể là người cung cấp số liệu, cơ
sở dữ liệu, báo cáo, bệnh án chứa các số liệu
1/12/2015
5
Đối tượng nghiên cứu
Tiêu chuẩn lựa chọn Tiêu chuẩn loại trừ
(Đã có đủ tiêu chuẩn lựa chọn)
o Đặc điểm cá nhân: Phụ
nữ dưới 65 tuổi
o Đặc điểm lâm sàng:
Được chẩn đoán mắc
tăng huyết áp theo tiêu
chuẩn JNC7
o Đặc điểm địa dư (hành
chính): Sống tại Hà nội,
điều trị tại Viện tim mạch
o Đặc điểm thời gian: Thời
gian điều trị từ
1/1/2014-31/12/2014
o Khó khăn trong việc cung
cấp thông tin: Không có
khả năng giao tiếp,
không hợp tác
o Có thể bị mất theo dõi:
Có thể chuyển sang nơi
khác sinh sống, nhà xa
Chọn mẫu
• Là quy trình chọn cá thể đại diện
cho quần thể để tham gia vào
nghiên cứu
• Điều kiện
– Mẫu phải đại diện cho quần thể
– Cỡ mẫu đủ lớn
1/12/2015
6
Chọn mẫu
Xác suất Không xác suất
Chọn mẫu không xác suất
• Khái niệm: Xác suất các cá thể được lựa
chọn vào mẫu là không giống nhau
• Phương pháp:
– Chọn mẫu thuận tiện: Tình nguyện tham gia
– Chọn mẫu chỉ tiêu: ½ nam + ½ nữ
– Chọn mẫu bóng tuyết: Giới thiệu người tiếp
theo tham gia nghiên cứu
• Ưu điểm: Đơn giản, nhanh, không tốn kém
• Nhược điểm: Gây ra sai chệch lựa chọn
• Ứng dụng: Thường chỉ sử dụng trong nghiên
cứu thử, nghiên cứu trường hợp hoặc nghiên
cứu định tính
1/12/2015
7
Chọn mẫu xác suất
• Khái niệm: Xác suất các cá thể được lựa
chọn vào mẫu là không giống nhau
• Phương pháp:
1. Chọn mẫu ngẫu nhiên đơn (Simple random
sampling)
2. Chọn mẫu ngẫu nhiên hệ thống (Systematic
random sampling)
3. Chọn mẫu phân tầng (Stratifed sampling)
4. Chọn mẫu theo cụm (chùm) (Cluster
sampling)
5. Chọn mẫu nhiều giai đoạn (Multi-stage
sampling)
Xác suất lựa chọn =
Cỡ mẫu
Tổng số cá thể của quần thể
Chọn mẫu ngẫu nhiên đơn
1/12/2015
8
Chän mÉu ngÉu nhiªn ®¬n
QuÇn thÓ =N
MÉu =n
p
s
P
X
Chọn mẫu ngẫu nhiên đơn
• Ưu điểm:
– Đơn giản, dễ làm
– Có tính ngẫu nhiên và đại diện cao.
– Dễ phân tích số liệu
– Là cơ sở của các kỹ thuật chọn mẫu khác.
• Hạn chế:
– Tốn kém trong quá trình thu thập số liệu
(trong các điều tra cộng đồng)
– Cần danh sách cá thể trong quần thể
1/12/2015
9
Chọn mẫu ngẫu nhiên hệ thống
• Xác định khung mẫu và đánh số đơn vị mẫu
• Xác định khoảng cách mẫu: k= N/n
• Xác định đơn vị mẫu đầu tiên (i) nằm giữa 1
và k bằng PP ngẫu nhiên đơn.
• Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu
đầu tiên, tiếp tục cho đến khi đủ số mẫu:
i + 1k; i + 2k; i + 3k...
Chän mÉu ngÉu nhiªn hÖ thèng
Sè ngÉu nhiªn ®îc
chän gi÷a 1 vµ k
i i + k i + 2k i + 3k i + (n-1)k
k k k k k k
1/12/2015
10
Chọn mẫu ngẫu nhiên hệ thống
• Ưu điểm:
– Nhanh và dễ áp dụng
– Ít tốn kém
– Đơn giản trong điều kiện thực địa
• Hạn chế:
– Đơn vị mẫu không xếp ngẫu nhiên hoặc trùng
với k, thiếu đại diện.
Chọn mẫu phân tầng
• Chia quần thể các tầng(strata). Các cá
thể trong mỗi tầng tương đồng về đặc
tính nào đó
• Chọn mẫu ngẫu nhiên đơn hay chọn
mẫu hệ thống ở mỗi tầng
• Cỡ mẫu mỗi tầng có thể
– Bằng nhau (chọn mẫu phân tầng không tỷ
lệ với kích cỡ quần thể)
– Không bằng nhau: Tỷ lệ với số cá thể của
mỗi tầng (chọn mẫu phân tầng tỷ lệ với
kích cỡ quần thể )
1/12/2015
11
Chän mÉu ph©n tÇng
TÊt c¶
bÖnh viÖn
B/V lín B/V võa B/V nhá
n1 n2 n3
Tầng 1 Tầng 2
N1= 2000 N2 = 6000
n1=400 n2=400
1/12/2015
12
Tầng 1 Tầng 2
N1= 2000 N2 = 6000
n1=200 n2=600
Chọn mẫu phân tầng
• Ưu điểm:
– Đảm bảo tính đại diện của mỗi nhóm
trong tổng mẫu
– Dễ thu thập số liệu
• Hạn chế:
– Thiếu chính xác khi số lượng đơn vị
mẫu ở mỗi tầng quá ít
1/12/2015
13
Chọn mẫu theo cụm (chùm)
• Xác định cụm (Dựa trên nơi sinh sống,
đơn vị hành chính).
• Lập danh sách cụm
• Chọn cụm ngẫu nghiên từ danh sách.
• Chọn cá thể:
– Lấy tất cả các cá thể (nếu không có danh
sách) của các chùm (chùm 1 bậc)
– Lập danh sách, chọn cá thể bằng PP ngẫu
nhiên đơn hoặc hệ thống (chùm 2 bậc).
Chän mÉu chïm
n1
n2
n3
1/12/2015
14
Chọn mẫu theo cụm (chùm)
• Ưu điểm
– Có thể áp dụng trong điều tra có phạm vi
rộng, phân tán, không có được danh sách các
đơn vị nghiên cứu.
– Khung mẫu đơn giản (danh sách các cụm), dễ
lập.
– Điều tra dễ & nhanh=> Có hiệu quả kinh tế
(kinh phí, thời gian)
• Hạn chế:
– Tính đại diện thấp (hệ số thiết kế)
– Phân tích số liệu phức tạp
Chọn mẫu nhiều giai đoạn
• Là dạng phức tạp của chọn mẫu cụm
(Chọn mẫu cụm là chọn mẫu 2 giai
đoạn)
• Ví dụ: Chọn tỉnh=> huyện=> xã=>làng
1/12/2015
15
Chọn mẫu
tầng
Chọn mẫu
cụm
Phân biệt
Có đại diện của
tất cả các tầng
trong mẫu
Chỉ 1 số cụm
được lựa chọn
vào mẫu
1/12/2015
16
hoangvanminh@hmu.edu.vn
Cỡ mẫu
chính xác
1/12/2015
17
Cỡ mẫu
Kinh phí
Cỡ mẫu = ----------------
Chi phí 1 mẫu
Cỡ mẫu
1. Loại biến số được phân tích (định lượng, định tính)
2. Mục tiêu phân tích (xác định tỷ lệ hay kiểm định sự
khác biệt...)
3. Mức ý nghĩa thống kê (=5%, 1%)
4. Độ mạnh (mức độ ngoại suy) (1-=80%,90%)
5. Mức độ sai số giữa các tham số mẫu và tham số
quần thể
6. Kết quả từ NC trước đây, NC thử, ước tính, mong
muốn...
7. Một số yếu tố khác
1/12/2015
18
Biến số
Định lượng Định tính
Đường máu Có bệnh-không có bệnh
Mục tiêu
phân tích
Xác định So sánh
Xác định tỷ lệ cao huyết
áp ở bệnh nhân ĐTĐ
So sánh tỷ lệ khỏi bệnh
của 2 ph. pháp điều trị
1/12/2015
19
Kiểm định giả thuyết
Giả thuyết Ho: Không có sự khác biệt
Giả thuyết Ha: Có sự khác biệt
Sai lầm
Thực tế
Quyết định
H0 đúng H0 sai
Chấp nhận H0
Sai lầm II ()
Loại bỏ H0
Sai lầm I ()
1/12/2015
20
Mức ý nghĩa thống kê
Loại bỏ sai lầm loại I
= 0.05
p = probability= Xác suất để giả thuyết Ho đúng
P<0.05 = Xác suất để giả thuyết Ho đúng là < 5%
= Ho xảy ra chỉ là may rủi
= Bác bỏ Ho
= Xác suất để giả thuyết Ha đúng là > 95%
= Ha xảy ra là chắc chắn
= Chấp nhận Ha
P>0.05 = ???
Độ mạnh
Loại bỏ sai lầm loại II
1- = 80%
Thường dùng trong tính toán cỡ mẫu
1/12/2015
21
Mức ý nghĩa
thống kê ()
z (1-/2)
.01 (99) 2.576
.02 (98) 2.326
.05 (95) 1.960
.10 (90) 1.645
Độ mạnh
(1-)
z (1-)
.80 0.842
.85 1.036
.90 1.282
.95 1.645
Sai số (mức chính xác)
Mức sai số giữa kết quả tính toán từ
mẫu so với kết quả thực của quần thể
• Tuyệt đối (hiệu số): hoặc d
• Tương đối (thương số):
1/12/2015
22
Cỡ mẫu xác định 1 tỷ lệ
Xác định tỷ lệ mắc bệnh X trong số người đến
khám sức khỏe. Biết rằng 1 NC trước đây báo cáo
tỷ lệ 10%. Mức ý nghĩa thống kê =5%
1/12/2015
23
Cỡ mẫu xác định 1 tỷ lệ
n: Cỡ mẫu tối thiểu
z (1-/2)= 1,96
P: Tỷ lệ mong đợi
: Độ chính xác tương đối
Cỡ mẫu so sánh 2 tỷ lệ
Một phương pháp điều trị hiện tại cho tỉ lệ đáp
ứng là 30%. Giả thuyết rằng phương pháp điều
trị mới sẽ có tỉ lệ đáp ứng là 40%. Xác định cỡ
mẫu cho nghiên cứu này nếu mức ý nghĩa
thống kê là 95% và độ mạnh là 80%
1/12/2015
24
Cỡ mẫu so sánh 2 tỷ lệ
n: cỡ mẫu tối thiểu
P1: Tỷ lệ đáp ứng với phương pháp cũ
P2: Tỷ lệ đáp ứng với phương pháp mới
P: =(P1+P2)/2
z (1-/2)= 1,96
z (1-)= 0,842
Cỡ mẫu so sánh 2 số trung bình
Xác định cỡ mẫu cho nghiên cứu đánh
giá tác dụng giảm huyết áp của 2 loại
thuốc. Giả sử sự khác biệt ước đoán là
10mmHg, độ lệch chuẩn là 10mmHg.
Chọn mức ý nghĩa thống kê là 95% và
độ mạnh là 80%
1/12/2015
25
Cỡ mẫu so sánh 2 số trung bình
Độ lệnh chuẩn σ =10
0- a =10
z (1-/2)= 1,96
z (1-)= 0,842
Một số yếu tố khác
Khống chế tỷ lệ không trả lời
Khống chế tỷ lệ mất đối tượng
Hệ số thiết kế khi chọn mẫu cụm
Các phân tích nâng cao
1/12/2015
26
Cỡ mẫu khác nhau giữa 2 nhóm
• N’: Cỡ mẫu điều chỉnh
• N: Cỡ mẫu chưa điều chỉnh
• k: tỷ số giữa 2 nhóm (thường KHÔNG QUÁ 2)
Cỡ mẫu khác nhau giữa 2 nhóm
• N’: Cỡ mẫu điều chỉnh
• N: Cỡ mẫu chưa điều chỉnh=1200
• k: tỷ số giữa 2 nhóm=2
1/12/2015
27
Cỡ mẫu khống chế không trả lời
• N’’: Cỡ mẫu điều chỉnh
• N: Cỡ mẫu chưa điều chỉnh
• q: tỷ số không trả lời
Cỡ mẫu khống chế không trả lời
• N’’: Cỡ mẫu điều chỉnh
• N: Cỡ mẫu chưa điều chỉnh=52
• q: tỷ số không trả lời=10%
1/12/2015
28
Cỡ mẫu nghiên cứu tính giá trị
Thực tế (Chuẩn vàng)
Có bệnh Không bệnh
Test Dương tính a
(Dương tính thật)
b
(Dương tính giả)
Âm tính c
(Âm tính giả)
d
(Âm tính thật)
Độ nhạy= a/(a+c)
Độ đặc hiệu = d/(b+d)
1/12/2015
29
Cỡ mẫu nghiên cứu tính độ nhạy
N: Cỡ mẫu
TP: Số dương tính thật
FN: Số âm tính giả
SN: Độ nhạy mong đợi
Z: 1,96 (=5%)
W: Sai số (5%)
P: Tỷ lệ mắc bệnh
Cỡ mẫu nghiên cứu tính độ nhạy
N: Cỡ mẫu
TP: Số dương tính thật
FN: Số âm tính giả
SN: Độ nhạy mong đợi=95%
Z: 1,96 (=5%)
W: Sai số (5%)
P: Tỷ lệ mắc bệnh
1/12/2015
30
Cỡ mẫu nghiên cứu tính giá trị
N: Cỡ mẫu
TP: Số dương tính thật
FN: Số âm tính giả
SP: Độ đặc hiệu mong đợi
Z: 1,96 (=5%)
W: Sai số (5%)
P: Tỷ lệ mắc bệnh
Cỡ mẫu nghiên cứu tính độ đặc hiệu
N: Cỡ mẫu
TP: Số dương tính thật
FN: Số âm tính giả
SP: Độ đặc hiệu mong đợi=80%
Z: 1,96 (=5%)
W: Sai số (5%)
P: Tỷ lệ mắc bệnh
Các file đính kèm theo tài liệu này:
- chon_mau_va_co_mau_hvm_8849.pdf