Bài giảng và bải tập Chọn mẫu và tính toán cỡ mẫu
Bài tập 8.2.1
3 huyện miền núi A, B, C có số hộ gia đình là 2000, 3000 và 5000. Một đoàn đánh giá nhanh của Bộ NN &
PTNN cho thấy tỷ lệ hộ gia đình sử dụng nước sạch hợp vệ sinh là 10% ở 1 xã huyện A, 15% ở 1 xã huyện
B và 20% ở 1 xã huyện C. Sở Y tế nghi ngờ kết quả này và muốn làm một nghiên cứu để xác định tỷ lệ thực
sự hộ gia đình sử dụng nước sạch ở 3 huyện là bao nhiêu. Họ có một tí tiền tiếp cận hộ gia đình để khảo
sát, muốn chọn mẫu và muốn kết quả thống kê trên mẫu chỉ xê dịch 2 % so với toàn bộ quần thể 10000 hộ
ở 3 huyện, độ tin cậy 95% cho các kết quả thống kê.
Kết quả: 1158
Bạn đang xem trước 20 trang tài liệu Bài giảng và bải tập Chọn mẫu và tính toán cỡ mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHỌN MẪU VÀ
TÍNH TOÁN CỠ MẪU
Chọn mẫu?
n Nếu tất cả các cả thể của một quần thể đều
giống nhau, chúng ta có một quần thể thuần
nhất (homogenous). Khi đó, đặc tính của mỗi cá
thể cũng chính là của quần thể. Không có sự
khác nhau/ giao động tính chất giữa các cá thể.
Chọn mẫu?
n Khi các cá thể trong một quần thể khác nhau, chúng ta có
một quần thể hỗn tạp/ không thuần nhất (heterogeneous).
Khi đó đặc tính của một cá thể bất kỳ không mang tính đại
diện cho cả quần thể. Có sự khác nhau/ giao động giữa
các cá thể.
n Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát
được tất cả các cá thể, người ta phải chọn một số lượng
cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các
cá thể của quần thể để quan sát.
Chọn mẫu?
Quần thể
Mẫu
Sử dụng dữ liệu/ thông tin của một số ít
tiếp cận được để nói về số đông mà
không thể tiếp cận hết
Chọn mẫu
Là cái
chúng ta
muốn biết
Là cái mà
chúng ta
quan sát
Suy ra
Chọn mẫu?
n Mẫu của một quần thể phải suy ra được những thông
tin hữu ích về quần thể đó. Do vậy, mẫu phải đảm bảo
có được những biến thiên cơ bản giữa các cá thể như
ở quần thể.
n Một quần thể càng không đồng nhất
¨ Thì xác suất một mẫu khó có thể mô tả quần càng lớn à
Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính
của quần thể.
n Và
¨ Thì số lượng cá thể của mẫu phải càng lớn để có thể mô
tả quần thể tốt à Một mẫu phải có số lượng cá thể đủ lớn
để cho thể suy đặc tính của mẫu thành của quần thể
Chọn mẫu?
n Chọn mẫu là một quy trình lựa chọn cá thể từ quần
thể cho quan sát, để có thể coi kết quả quan sát mẫu
thành kết quả quan sát quần thể, ở một mức độ chấp
nhận mà xác định được.
¨ Mẫu là đại diện của một quần thể. Mức độ đại diện phải
được xác định/ đo lường được.
n Có hai cách chọn mẫu:
¨ Chọn mẫu không ngẫu nhiên
¨ Chọn mẫu ngẫu nhiên
Các khái niệm cơ bản
n Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác
định không gian và thời gian
n Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc
tính, trong một khoảng không gian và thời gian xác định.
n Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá
thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm.
n Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần
thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một
quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm
n Danh sách/ khung mẫu: Là danh sách các cá thể của một
quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu
n Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng
xác định/ không xác định cá thể của quần thể vào một tập hợp
mẫu.
n Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu
thành kết quả của quần thể
Phân loại các phương pháp
chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên
đơn Theo cụm
Hệ thống Phân tầng
Không ngẫu
nhiên
Chỉ tiêu Chủ đích
Thuận tiện Ném bóng
tuyết
Chọn mẫu ngẫu nhiên
n Chọn mẫu ngẫu nhiên đơn
n Đảm bảo mỗi cá thể của quần thể được
lựa chọn với xác suất như nhau vào mẫu
n Ghép cặp mỗi cá thể với một số ngẫu
nhiên, các cá thể được lựa chọn theo sự
ngẫu nhiên của con số.
Xác suất lựa chọn =
Cỡ mẫu
Tổng số cá thể của quần thể
Chọn mẫu ngẫu nhiên đơn
Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào
n Ưu điểm
n Không cần nhiều thông tin về quần thể
n Tính gía trị cao, xác định được sai số
thống kê
n Dễ dàng phân tích dữ liệu
n Hạn chế
n Tốn kém
n Yêu cầu danh sách cá thể trong quần thể
n Không cần chuyên môn của nghiên cứu
viên
n Nguy cơ sai số ngẫu nhiên
n Chọn mẫu hệ thống
n Cá thể đầu tiên được lựa chọn ngẫu nhiên
trong quần thể, các cá thể tiếp theo được
lựa chọn theo một khoảng cách xác định
so với cá thể trước đó. Khoảng cách xác
định được gọi là khoảng cách mẫu =
Tổng số cá thể của quần thể/ cỡ mẫu
Chọn mẫu hệ thống
Khoảng cách giữa các cá thể bằng nhau
à Mang tính quy luật
n Ưu điểm
n Chi phí hợp lý, hay được sử dụng
n Tính gía trị cao, xác định được sai số
thống kế
n Các cá thể dễ tiếp cận
n Hạn chế
n Sai số chu kỳ do bản thân danh sách cá
thể cũng có thể có tính chu kỳ
n Yêu cầu danh sách cá thể của quần thể
n Chọn mẫu phân tầng
Chia quần thể theo một đặc tính cụ thể thành các
nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh
viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học
viên tiến sĩ, học viên thạc sĩ và học viên đại học).
Các cá thể trong mỗi tầng đồng nhất, nhưng
không đồng nhất giữa các tầng.
Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay
chọn mẫu hệ thống ở mỗi tầng (strata). Số mẫu
mỗi tầng tham gia vào tổng mẫu có thể bằng
nhau (chọn mẫu phân tầng không cân xứng) hay
tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân
tầng cân xứng)
Tầng 1 Tầng 2
N= 2000 N = 6000
Chọn mẫu phân tầng không cân xứng
1000 1000
Tầng 1 Tầng 2
N= 2000 N = 6000
Chọn mẫu phân tầng cân xứng
1000 3000
n Ưu điểm
n Đảm bảo mỗi nhóm đều có tính đại diện
trong tổng mẫu
n Mỗi nhóm đều được thống kê và so sánh
n Giảm sai số hệ thống
n Hạn chế
n Yêu cầu thông tin chính xác về tỷ lệ giữa
các tầng
n Chi phí để có được danh sách mỗi tầng
n Chọn mẫu theo cụm/ chùm
n Cụm đây là cụm địa lý nơi các các thể
sinh sống. Đầu tiên là chọn cụm, sau đó
mới chọn cá thể trong cụm.
n Phương pháp hay được sử dụng khi
không có danh sách cá thể của quần thể
n Các loại chọn mẫu theo cụm/ chùm
n Chọn mẫu theo cụm 2 bước:
n Chọn cụm – chọn cá thể trong cụm
n Chọn mẫu theo cụm nhiều bước:
n Ví dụ: chọn 7 vùng sinh thái ở Việt
Nam, chọn 1 tỉnh ở mỗi vùng sinh
thái, chọn 1 huyện ở 1 tỉnh, chọn 1 xã
ở 1 huyện, 1 thôn/ bản ở 1 xã, chọn
200 hộ gia đình ở 1 thôn/ bản theo cỡ
mẫu.
n Ưu điểm
n Chí phí thấp/ hãy sử dụng
n Không yêu cầu danh sách cá thể của cả quần
thể, chỉ yêu cầu danh sách cụm, tiểu cụm, tiểu
tiểu cụm, và danh sách cá thể của đơn vị cụm
cuối cùng
n Xác định được đặc điểm của cả cụm và quần thể
n Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả
một quốc gia.
n Hạn chế
n Sai số lớn hơn so với các phương pháp ngẫu
nhiên khác
Phân loại các phương pháp
chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên
đơn Theo cụm
Hệ thống Phân tầng
Không ngẫu
nhiên
Chỉ tiêu Chủ đích
Thuận tiện Ném bóng
tuyết
Chọn mẫu không ngẫu nhiên
n Chọn mẫu thuận tiện
n Cá thể được lựa chọn vào mẫu một cách
“thuận tiện”, sẵn có và dễ tiếp cận.
n Tại sao dùng: nhanh và chi phí thấp
n Phải giải trình và đánh giá giá trị nếu
chọn mẫu thuận tiện.
n Ưu điểm
n Chi phí rất thấp
n Hay được sử dụng
n Không cần danh sách cá thể trong quần
thể
n Hạn chế
n Độ biến thiên và sai số không đo lường
và kiểm soát được.
n Khó giải trình việc suy luận kết quả thống
kê trên mẫu ra của quần thể.
n Chọn mẫu có chủ đích (Judgment or
Purposive Sampling)
n Chọn cá thể có một số đặc tính mong
muốn vào mẫu với chủ đích của nghiên
cứu viên.
n Ưu điểm
n Chi phí vừa phải
n Hay được sử dụng
n Mẫu lựa chọn đảm bảo được mục tiêu
n Hạn chế
n Sai số!
n Khó giải trình việc suy luận kết quả thống
kê trên mẫu ra của quần thể.
n Chọn mẫu theo chỉ tiêu
n Mẫu đảm bảo đặc tính của quần thể, đại
diện ở một mức độ mà nghiên cứu viên
mong muốn
n Ưu điểm
n Chi phí vừa phải
n Rất hay sử dụng
n Không yêu cầu danh sách cá thể trong
quần thể
n Có phần nào tính chất của chọn mẫu
phân tầng
n Hạn chế
n Không đo lường và giải trình được biến
thiên và sai số
n Chọn mẫu “Ném bóng
tuyết“ (Snowball sampling)
n Chọn mẫu bắt đầu từ một cá thể, được
chọn một cách ngẫu nhiên hay không
ngẫu nhiên. Các cá thể tiếp theo được
chọn từ cá thể ban đầu hay trước đó,
giống như trò chơi ném bóng tuyết, ai
trúng thì được lựa chọn.
n Ưu điểm
n Chi phí thấp
n Hữu ích trong một số trường hợp cụ thể
n Dùng để xác định những quần thể hiếm
n Hạn chế
n Sai số do cá thể lựa chọn không hoàn
toàn độc lập
n Khó giải trình việc suy diễn kết quả thống
kê trên mẫu ra của quần thể.
Tính toán cỡ mẫu
n Thông tin/ dữ liệu cần thiết
¨ Loại nghiên cứu
¨ Các thuật toán thống kê sử dụng
¨ Đắc tính của cá thể - Thể hiện qua biến số (khác biệt cơ
bản giữa biến liên tục – biến phân hạng). Kết quả các
nghiên cứu trước được đưa vào làm cơ sở tính toán
¨ Độ tin cậy (95%, 90%)
¨ Gía trị p chấp nhận kết quả kiểm định (0,05/ 0,001)
¨ Mức độ biến thiên của kết quả mẫu so với kết quả thực
của quần thể (độ chính xác tương đối)
¨ Sức mạnh của mẫu nói lên mức độ kết quả mẫu đại
diện cho kết quả của quần thể
Tính toán cỡ mẫu
n Tính toán cỡ mẫu đơn giản:
¨ Dựa vào công thức cơ bản,
¨ Không tính đến thiết kế nghiên cứu,
¨ Không tính đến các thuật toán thống kê sử
dụng trong thiết kế
¨ Tính toán đơn giản, bằng máy calculator
thông thường
¨ Thường không chính xác, chỉ có tính chất giải
trình đủ đề mục chọn mẫu và tính cỡ mẫu
trong đề cương hay báo cáo nghiên cứu.
Tính toán cỡ mẫu
n Tính toán cỡ mẫu nâng cao:
¨ Dựa vào một số phần mềm tính toán cỡ mẫu tốt
(Ví dụ: Sampling Size for Health Studies của
WHO)
¨ Đã đề cập một số thiết kế nghiên cứu cơ bản +
thuật toán thống kê hay sử dụng cho thiết kế đó +
biến số/ dữ liệu liên qua
¨ Có công thức tính cỡ mẫu cho giải trình, phải
chụp màn hình, lưu ở dạng jpg
¨ Chính xác hơn tính toán cỡ mẫu đơn giản
¨ Chưa toàn diện so với tính toán cỡ mẫu chuyên
nghiệp
Giao diện chọn các thiết kế nghiên cứu trong phần
mền tính cỡ mẫu nâng cao
Giao diện tính toán cỡ mẫu
Ô tính ra
cỡ mẫu
Nhập giá trị
mong muốn
cho mẫu
Công thức máy
tính tính cỡ mẫu
cho thiết kế
Tính toán cỡ mẫu chuyên nghiệp
n Dựa vào phần mềm tính toán cỡ mẫu chuyên nghiệp,
trong gói SAS, hoặc chuyên nghiệp với n-query. Phần
mềm rất đắt (cỡ 1 triệu USD cho SAS, 1050 USD cho
nquery). Học viên có nhu cầu học thêm ứng dụng của
phần mềm nquery có thể liên hệ với giáo viên
n Nghiên cứu viên nhập thiết kế nghiên cứu, thuật toán
thống kê sử dụng và các dữ liệu liên quan đến biến số
vào phần mềm để tính ra cỡ mẫu. Nghiên cứu viên có
thể phân tích độ nhạy mối liên quan giữa Sức mạnh mẫu
và cỡ mẫu. Nghiên cứu viên phải có kiển thức chuyên
sâu về thiết kế nghiên cứu và các thuật toán thống kê để
có thể sử dụng được phần mềm cũng như phiên giải kết
quả.
Loại
thiết kế
Bước 1: Nhập
dữ liệu về thiết
kế nghiên cứu,
tác động và
thuật toán thống
kê phân tích
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Loại dữ
liệu đầu ra
Số nhóm
mẫu
Loại phân
tích thống
kê
Cụ thể hóa
nhập liệu
thuật toán
thống kê
Nhập giá trị cụ thể của biến số
và mong muốn đặc tính mẫu
Bước 2: Xác
định giá trị cụ
thể của biến số
và mong muốn
đặc tính mẫu
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Các ô tính ra
cỡ mẫu
Nhập giá trị cụ thể của biến số
và mong muốn đặc tính mẫu
Bước 3: Xác
định sức mạnh
mẫu từ các cỡ
mẫu và ngược
lại
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Các ô kết
quả
Bước 4: Phân
tích độ nhạy của
mối quan hệ
Sức mạnh mẫu
– Cỡ mẫu
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Biểu đồ của
phân tích độ
nhạy
Tính toán cỡ mẫu cơ bản
3 công thức cơ bản (phần in đậm là công thức gốc):
- Từ trung bình n = (ZS/E) 2= (Z(d-c)/E) 2
= N(ZS/E) 2/(N-1) =(ZS/E) 2
- Từ tỷ lệ n = Z2 p(1-p)/ E2 = Z2 Np(1-p)/ E2 (N-1)+ Z2 pq
- Từ phân vị n = pc(100-pc) Z2/ E2
- Z cho mức độ tin cậy 95% = 1.96, 99% = 2.58
- Công thức trên có thể mở rộng ra
- Quần thể có số lượng mẫu xác định và không xác định bằng
cách nhân hoặc không với hệ số N/(N-1),
- Tỷ lệ dự báo xác định và không xác định bằng cách nhân và
không với hệ số p*(1-p)
- Quần thể xác biến thiên hay không biến thiên bằng cách nhân
và không nhân với bình phương độ lệch chuẩn, bình phương
1/6 (hiệu giá trị lớn nhất – giá trị thấp nhất)
n Công ty A quyết định tuyển sinh viên mới tốt
nghiệp. Giám đốc cần quyết định mức lương cạnh
tranh. Từ kinh nghiệm của các công ty khác cho
thấy, lương sinh viên mới ra trường giao động từ
3,8 – 4,2 triệu, mức trung bình là 3,9 triệu. Độ lệch
chuẩn ở vào mức 0,3 triệu.
n Công ty muốn làm một nghiên cứu nhỏ, lựa chọn
một số sinh viên làm mẫu, và muốn suy kết quả
mức lương trung bình của nhóm sinh viên trong
mẫu suy ra mức lương trung bình của tất cả sinh
viên mới tốt nghiệp. Độ tin cậy: 95%, và giá trị xê
địch trong khoảng +/- 50 nghìn.
n Hãy tính cỡ mẫu cho nghiên cứu của công ty?
n N = (1,96 x 0,3/ (2 x 0,05)) 2 = 34,57
Ví dụ 1
Ví dụ 2
n VTV chuẩn bị phát sóng một chương trình giáo dục sức
khỏe buổi sáng.
n Kinh nghiệp từ VOV sức khỏe cho thấy, chương trình
giáo dục sức khỏe chỉ thu hút được 2 trên 10 người xem
truyền hình tại thời điểm buổi sáng.
n VTV muốn làm một nghiên cứu nhỏ để xác định được tỷ
lệ người xem chương trình của họ nếu phát sóng. Họ
muốn chọn một số người xem truyền hình để phỏng vấn.
Họ mong muốn kết quả thống kê trên mẫu phản ánh
được kết quả thực sự ở mức xê dịch +/- 5% và với độ tin
cậy 99%.
n Cỡ mẫu mà VTV cần để khảo sát là bao nhiêu?
n N = 2,58 2 x 0,2 x (1-0,2) / (2 x 0,05) 2 = 106,5
Ví dụ 3
n Xác định cỡ mẫu cần thiết để điều tra phụ nữ tại
một xã X biết về việc khám thai đủ 3 lần trước
sinh là cần thiết. Khoảng tin cậy là 95% với sai
số 5%.
n Một nghiên cứu tiến hành cách đây 2 năm cho
thấy 40% phụ nữ được hỏi nói biết khám thai đủ
3 lần trước sinh là cần thiết.
n N = 0,4 x (1-0,4) x (1,96/ (2 x 0,05))2 = 92,19
Chọn mẫu từ quần thể
BN1 BN11 BN21 BN31 BN41 BN51 BN61 BN71 BN81 BN91
BN2 BN12 BN22 BN32 BN42 BN52 BN62 BN72 BN82 BN92
BN3 BN13 BN23 BN33 BN43 BN53 BN63 BN73 BN83 BN93
BN4 BN14 BN24 BN34 BN44 BN54 BN64 BN74 BN84 BN94
BN5 BN15 BN25 BN35 BN45 BN55 BN65 BN75 BN85 BN95
BN6 BN16 BN26 BN36 BN46 BN56 BN66 BN76 BN86 BN96
BN7 BN17 BN27 BN37 BN47 BN57 BN67 BN77 BN87 BN97
BN8 BN18 BN28 BN38 BN48 BN58 BN68 BN78 BN88 BN98
BN9 BN19 BN29 BN39 BN49 BN59 BN69 BN79 BN89 BN99
BN10 BN20 BN30 BN40 BN50 BN60 BN70 BN90 BN90 BN100
Có 100 bệnh nhân từ BN1 đến BN100
Bài tập chọn mẫu từ quần thể
n Hãy chọn 30 bệnh nhân một cách ngẫu nhiên từ 100 bệnh
nhân bằng 3 cách
¨ Cách 1: Cắt 100 mạnh giấy, ghi tên 100 bệnh nhân, cho
vào 1 cái rọ, rồi nhắm mắt, thò tay vào rọ, lấy ra 30 tờ
¨ Cách 2: In danh sách 100 bệnh nhân ra, mở bảng số ngẫu
nhiên, cho BN1 một số ngẫu nhiên bất kỳ trong bảng, 99
bệnh nhân tiếp theo cũng nhận được một số ngẫu nhiên
tiếp theo từ số ngẫu nhiên của BN1
¨ Cách 3: Dùng hàm rand() trong Excel cho mỗi bệnh nhân
một số ngẫu nhiên, tráo bệnh nhân bằng sort, lựa chọn 30
bệnh nhân từ trên xuống dưới
n Hãy chọn 30 bệnh nhân hệ thống từ 100 bệnh nhân
Tính toán cỡ mẫu nâng cao
- Học viên mang theo máy tính để thực
hành
- Học viên copy phần mềm “Sample Size
Determination in Health Studies”
Bài tập 1.1.1
Trung tâm y tế dự phòng huyện X muốn
xác định tỷ lệ hiện nhiễm của bệnh lao
trong nhóm trẻ em dưới 5 tuổi trên địa
bàn. Mẫu nghiên cứu cần bao nhiêu trẻ
khi kết quả của mẫu chỉ biến thiên dưới
10% so với giá trị thật của quần thể, với
95% độ tin cậy. Ngoài ra, tỷ lệ hiện nhiễm
được biết không vượt quá 10%.
Kết quả: 139
Bài tập 1.1.2
Viện vệ sinh dịch tễ trung ương muốn xác
định tỷ lệ trẻ em trong toàn quốc được
tiêm phòng đúng theo quy định. Mẫu
nghiên cứu cần bao nhiêu trẻ nếu muốn
kết quả của mẫu nghiên cứu xê dịch 5%
so với kết quả thực của quần thể, với độ
tin cậy là 95%
Kết quả: 385
Bài tập 1.3.1
Tỷ lệ thành công của một can thiệp tim mạch
ngoại khoa X được báo cáo trong y văn là 70%.
Một phương pháp mới Y được đề xuất mang lại
hiệu quả tương tự. Một cơ sở điều trị không có
năng lực ngoại khoa muốn áp dụng phương
pháp điều trị mới Y. Trước đó họ cần phải
nghiên cứu bao nhiêu bệnh nhân để kiểm định
giả thuyết phương pháp mới cũng có tỷ lệ
thành công là 70% với p = 0,05. Nghiên cứu
muốn có một sức mạnh 90% rằng giá trị xê dịch
+/- 5%.
Kết quả: 912
Bài tập 2.1.2
Một nghiên cứu với 50 công nhân đang tham
gia một dự án thủy lợi cho thấy 40% số họ bị
nhiễm sán máng. Một nghiên cứu tương tự
cũng với 50 công nhân nhưng không làm cho
dự án thủy lợi nào, tỷ lệ nhiễm sán máng chỉ là
32%. Một nhóm dịch tễ học muốn tiến hành một
nghiên cứu lớn hơn để có được kết quả khác
biệt giữa hai nhóm ở mức p=0,05, với mức tin
cậy 95% thì họ phải lựa chọn bao nhiêu công
nhân ở mỗi nhóm cho nghiên cứu.
Kết quả: 704
Bài tập 2.2.2
Ở một nghiên cứu, một nhóm dịch tễ học so sánh
50 bệnh nhân mắc một bệnh thần kinh với 50 bệnh
nhân không mắc bệnh làm nhóm chứng. 30 người
thuộc nhóm bệnh nhân (60%) và 25 người thuộc
nhóm chứng (50%) đi biển, đánh bắt cá. Giả định
tỷ lệ người làm nghề đi biển, đánh bắt cá trong
quần thể tương đương, và nhóm dịch tễ học muốn
làm một nghiên cứu lớn hơn ở cả hai nhóm bệnh
và chứng, để tính ra được sự khác biệt giữa hai
nhóm với mức tin cậy 90% và p = 0,05, thì mẫu họ
phải chọn ở mỗi nhóm là bao nhiêu?
Kết quả: 519
Bài tập 3.1.1
Tại thị trấn X, bệnh tả đang là một vấn đề sức khỏe
cộng đồng. Khoảng 30% người dân tin rằng họ
đang phải sử dụng nguồn nước ô nhiễm lây bệnh.
Một số nghiên cứu trong y văn cho thấy nguồn
nước ô nhiễm có nguy cơ làm người dân nhiễm
bệnh cao gấp 2 lần và với mức tin cậy 95%, xê
dịch trong 25%. Nhóm nghiên cứu đến thị trấn X
phải chọn bao nhiêu mẫu bệnh nhân và nhóm
chứng để xác định xem nguồn nước nơi đây có
phải là nguyên nhân dẫn đến sự lây lan của bệnh
tả hay không?
Kết quả: 408
Bài tập 4.1.1
Một nhóm nghiên cứu dịch tễ học lên kế hoạch
nghiên cứu xác định xác suất bệnh phổi X có liên
quan đến chất Y ô nhiễm trong không khí. Mẫu
nghiên cứu ở hai nhóm có và không tiếp xúc với
chất Y là bao nhiêu? nếu nghiên cứu muốn xác
định nguy cơ tương đối tới 50% giá trị thực của
quần thể và với độ tin cậy 95%. Từ trong y văn,
bệnh phổi X đang phối biến ở mức 20% trong
nhóm người không phới nhiễm với chất Y.
Kết quả: 44
Bài tập 4.2.1
Hai phương pháp điều trị một bệnh ung thư được đánh giá
trong một nghiên cứu thuần tập thử nghiệm lâm sàng. Người
bệnh được lựa chọn ngẫu nhiên cho mỗi phương pháp điều
trị và được theo dõi tình trạng tái phát bệnh trong 5 năm.
Phương pháp điều trị A là một phương pháp mới giảm một
nửa nguy cơ tái phát trong 5 năm đầu. 35% người bệnh
được điều trị bằng phương pháp điều trị B tái phát trong 5
năm đầu. Mẫu bệnh nhân mỗi nhóm điều trị A và B là bao
nhiêu nếu nhóm nghiên cứu muốn có mức tin cậy 90% để có
thể loại trừ giả thuyết Ho (Nguy cơ tương đôi =1). Nếu
không thì kiểm định được chấp nhận ở độ tin cậy p=0,05.
Kết quả: 131
Bài tập 6.1.1
Mẫu bệnh nhân là bao nhiêu nếu nhóm
nghiên cứu muốn xác định tỷ lệ mắc mới
của một bệnh xê dịch trong khoảng 10%
giá trị thực của quần thể, mức tin cậy
95%.
Kết quả: 385
Bài tập 6.2.2
Trên cơ sở số liệu 5 năm của BV X, theo dõi
một số lượng nhỏ bệnh nhân mắc bệnh X, tỷ lệ
mắc mới bệnh này được báo cáo là 40%.
Nhóm dịch tế học cần nghiên cứu trên bao
nhiêu bệnh nhân để kiểm định xem tỷ lệ mắc
mới bệnh X trên cộng đồng có đúng là 40% với
p=0,05 hay không? Nghiên cứu được mong
muốn có một sức mạnh 80% xác định tỷ lệ mới
thực hàng năm là 50%.
Kết quả: 146
Bài tập 6.3.2
Để biết về tác động lâu dài của tiếng ồn tới sức khỏe,
nhóm nghiên cứu A lên kế hoạch theo dõi dọc, so sánh
hai nhóm công nhân làm việc trong môi trường có tiếng
ồn và ít tiếng ồn. Y văn có nếu tỷ lệ suy giảm thính lực
hàng năm của công nhân làm trong môi trường ồn ào là
25%. Mẫu nghiên cứu phải là bao nhiêu ở mỗi nhóm để
kiểm định loại bỏ Ho (giữa hai nhóm không có sự khác
biệt). Gỉa thuyết Ha là tỷ lệ giảm thính lực hàng năm ở
công nhân làm việc trong môi trường ít tiếng ồn là 10%.
Độ mạnh của kiểm định là 80%, p=0,05
Kết quả: 23
Bài tập 7.2.2
Y văn có một bài ghi nam giới cao huyết áp có cân
nặng trung bình là 70kg. Tuy nhiên, người ta cho rằng,
nam giới ở Việt Nam cao huyết áp không nặng như vậy
và muốn làm một nghiên cứu để kiểm tra điều đó. Cỡ
mẫu phải là bao nhiêu nếu muốn kiểm định với giá trị
p=0,05 và sức mạnh của mẫu là 90%, giá trị cân nặng
chấp nhận sai lệch ở mức 5 kg, sự biến thiên/độ lệch
chuẩn là 20 kg.
Kết quả: 169
Bài tập 8.1.1
Y văn có nói tỷ lệ trẻ em nhiễm giun đũa ở các nước
phát triển là 30%. Trung tâm y tế huyện A có 4000 trẻ
dưới 5 tuổi, muốn làm một nghiên cứu, chọn một số trẻ
để kiểm tra phân. Họ muốn kết quả nghiên cứu trên
mẫu nghiên cứu của họ chỉ chênh lệch 5% so với cả
quần thể 4000, ở mức tin cậy 95%. Số trẻ mà Trung
tâm chọn từ 4000 cháu phải là bao nhiêu?
Kết quả: 977
Bài tập 8.2.1
3 huyện miền núi A, B, C có số hộ gia đình là 2000,
3000 và 5000. Một đoàn đánh giá nhanh của Bộ NN &
PTNN cho thấy tỷ lệ hộ gia đình sử dụng nước sạch
hợp vệ sinh là 10% ở 1 xã huyện A, 15% ở 1 xã huyện
B và 20% ở 1 xã huyện C. Sở Y tế nghi ngờ kết quả
này và muốn làm một nghiên cứu để xác định tỷ lệ thực
sự hộ gia đình sử dụng nước sạch ở 3 huyện là bao
nhiêu. Họ có một tí tiền tiếp cận hộ gia đình để khảo
sát, muốn chọn mẫu và muốn kết quả thống kê trên
mẫu chỉ xê dịch 2 % so với toàn bộ quần thể 10000 hộ
ở 3 huyện, độ tin cậy 95% cho các kết quả thống kê.
Kết quả: 1158
Các file đính kèm theo tài liệu này:
- bai_7_bai_giang_va_bai_tap_chon_mau_va_tinh_toan_co_mau_30_1_1_1569.pdf