Tài liệu giảng dạy môn kỹ thuật máy tính phần mềm epidata

TÀI LIỆU GIẢNG DẠY MÔN KỸ THUẬT MÁY TÍNH BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 6 1. Phần mềm Epidata là gì? 6 2. Đặc điểm của phần mềm Epidata . 6 3. Tiến trình thu thập và xử lý số liệu . 7 4. Chu trình của số liệu . 8 5. Kiểu dữ liệu 10 BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 16 1. Cài đặt Epidata . 16 1.1 Tải tệp chương trình cài đặt . 16 1.2 Cài đặt chương trình 20 2. Khởi động chương trình . 25 3. Thiết lập tùy chọn chương trình 29 4. Tệp liên đới . 37 BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 40 1. Khai báo bộ câu hỏi 40 2. Hạn chế lỗi số liệu 52 2.1 Lỗi số liệu 52 2.2 Phát hiện lỗi dữ liệu . 53 2.3 Kiểm tra lỗi dữ liệu . 54 3. Thiết lập ràng buộc số liệu với phần mềm Epidata 55 4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE 64 BÀI 4: NHẬP DỮ LIỆU . 71 1. Nhập số liệu 71 2. Xem dữ liệu 77 3. Xem cấu trúc tệp REC 77

pdf104 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 6943 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tài liệu giảng dạy môn kỹ thuật máy tính phần mềm epidata, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
thông tin: là lỗi khi có hai hoặc nhiều câu trả lời mang thông tin trái ngược nhau và vi phạm tính nhất quán của thông tin. Ví dụ thông tin một người có giới tính là nữ và bị ung thư tuyến tiền liệt. ƒ Lỗi giới hạn giá trị: lỗi này xảy ra khi các thông tin nằm ngoài khoảng giới hạn đúng cho phép. Ví dụ trường hợp bà mẹ 30 tuổi, còn đứa con 28 tuổi. 2.2 Phát hiện lỗi dữ liệu Khi tạo ra các bộ số liệu, người ta luôn phải thực hiện công việc phát hiện lỗi số liệu và sửa lỗi trước khi sử dụng ở các công đoạn tiếp theo. Có bốn cách để phát hiện số liệu lỗi: ƒ Kiểm tra thủ công: có thể chọn ra một số phiếu đã được điền thông tin từ các cuộc phỏng vấn và thực hiện phỏng vấn lại đối tượng đã cung cấp thông tin đó. Cách này thường được sử dụng trong thực tế thông qua giám sát và thu thập số liệu. ƒ Kiểm tra trong quá trình nhập dữ liệu (kiểm tra sự tương tác): người sử dụng có thể sử dụng các chức năng hỗ trợ của phần mềm để kiểm tra và sửa lỗi số liệu ngay trong khi nhập số liệu. Cách này rất hiệu quả với các lỗi nhầm ký tự, ràng buộc thông tin, giới hạn giá trị và lỗi phỏng vấn. ƒ Kiểm tra lỗi số liệu sau khi nhập số liệu: số liệu sau khi được nhập cần được kiểm tra lỗi một lần nữa trước khi chuyển sang công đoạn tiếp theo. Việc kiểm tra số liệu sau nhập được thực hiện nhờ hỗ trợ của phần mềm. ƒ So sánh dữ liệu: số liệu có thể được nhập hai lần để tạo ra hai bộ số liệu. Khi kết thúc nhập liệu, số liệu của hai lần nhập được đem ra so sánh với nhau để đảm bảo tính nhất quán của quá trình nhập liệu. Cách kiểm tra này nhằm phát hiện lỗi chuyển vị và lỗi nhầm phím. [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 54 2.3 Kiểm tra lỗi dữ liệu Khi xây dựng cơ sở dữ liệu, việc chọn kiểu dữ liệu nào trong các kiểu số liệu (Numeric, Text hay Boolean …) cho một trường số liệu cũng góp phần làm giảm số liệu lỗi. Ví dụ trường số thứ tự có dạng 1, 2, 3, ….10, 11, ... , khi được khai báo là kiểu Numeric sẽ hạn chế được số liệu lỗi do nhập nhầm phím ký tự số 0 và phím chữ o. Ngoài ra, những người phát triển công cụ nhập số liệu cũng có thể thiết lập các ràng buộc số liệu nhằm hạn chế số liệu lỗi trong khi nhập số liệu. Các ràng buộc có thế được thiết lập cho các trường số liệu gồm: ƒ Must – enter Variables (trường bắt buộc phải nhập giá trị): một trường được thiết lập thuộc tính Must – enter thì khi có nghĩa là giá trị của nó phải được nhập (không được để trống), nếu số liệu không được nhập vào phần mềm sẽ không chuyển sang trường khác để tiếp tục nhập. ƒ Legal values (số liệu được chỉ định trước): một biến được xác định trước danh mục các giá trị số liệu thì số liệu được nhập vào cho nó chỉ có thể là một trong các giá trị thuộc danh mục đó. ƒ Range checks (kiểm tra miền dữ liệu – giới hạn dữ liệu): một biến được chỉ định miền giới hạn số liệu thì giá trị số liệu nhập vào phải nằm trong miền giới hạn đó. Ví dụ khi miền số liệu được chỉ định là từ 1 đến 10 thì không cho nhập giá trị 0, 11, 12, .v.v. ƒ Repeat Variables (trường lặp): trường được chỉ định là lặp giá trị thì giá trị số liệu của bản ghi ở lần nhập cuối cùng cho trường sẽ được nhớ và mặc định cho trường khi nhập bản ghi ở lần tiếp theo. ƒ Conditional jumps (nhảy có điều kiện) : trường được thiết lập điều kiện nhảy khi số liệu nhập vào thỏa mãn điều kiện nhảy, một bước nhảy bỏ qua nhập số liệu của một số trường nào đó sẽ được thực hiện. Ví dụ trường hợp câu SG7 trong bộ câu hỏi của nghiên cứu cúm gia cầm. Nếu giá trị nhập cho câu hỏi này là “2- không” (không đi đâu ra khỏi địa bàn trong một tháng) thì nhảy đến câu SG7c, bỏ qua câu SG7b. Thiết lập điều kiện nhảy sẽ đáp ứng được yêu cầu này. ƒ Programmed checks (kiểm tra bằng mã chương trình): số liệu có thể được kiểm tra lỗi nhờ những đoạn mã được lập trình khi phát triển công cụ nhập số liệu. Phần mềm Epidata cũng hỗ trợ cấu trúc lệnh lập trình đơn giản, cho phép [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 55 người sử dụng viết những đoạn mã chương trình để thực hiện các kiểm tra số liệu. Thiết lập các ràng buộc số liệu cho biến nhằm hạn chế số liệu lỗi ngay trong khi nhập số liệu còn được gọi là kiểm tra tương tác và là một cách làm hiệu quả trong việc hạn chế số liệu lỗi. 3. Thiết lập ràng buộc số liệu với phần mềm Epidata Epidata có chức năng checks cho phép thực hiện kiểm tra phát hiện số liệu lỗi trong khi nhập liệu. Các bước thiết lập ràng buộc số liệu bao gồm mở tệp REC, đặt ràng buộc, ghi lại, đóng cửa sổ checks. Mở tệp REC Các bước mở tệp REC thực hiện như sau: Bước 1: chọn 3.Checks trên thanh công cụ tiến trình sáu bước. Sau đó hộp thoại “Select data file for checks” sẽ xuất hiện yêu cầu người sử dụng chọn tệp. Hình 42: Hộp thoại “Select data file for checks” Bước 2: trên hộp thoại “Select data file for checks”, chọn thư mục chứa tệp REC ở mục Look in, chọn tệp REC sao cho tên tệp xuất hiện trong mục File name và chọn Open. Tệp REC được mở sẵn sàng để thiết lập ràng buộc số liệu có hình ảnh như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 56 Hình 43: Tệp REC được mở ở chế độ check Thiết ràng buộc số liệu Trên cửa sổ chương trình có một hộp thoại nhỏ. Hộp thoại này là công cụ cho phép thiết lập các thuộc tính và ràng buộc số liệu cho trường (biến), là thành phần mà người sử dụng cần phải nắm được cách làm việc với nó. [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 57 Hình 44: Hộp thoại thiết lập ràng buộc số liệu Để có thể thiết lập các ràng buộc số liệu sử dụng hộp thoại trên, người sử dụng cần hiểu được ý nghĩa của các thành phần trên hộp thoại. Ý nghĩa các thành phần trên hộp thoại đối với việc thiết lập các ràng buộc số liệu như sau: Cho phép chọn trường để thiết lập ràng buộc số liệu. Cho phép chỉ ra danh mục các giá trị số liệu hoặc miền số liệu. Ví dụ : đặt Range, Legal là 1- 9 thì các giá trị nhập vào chỉ nằm từ 1 đến 9. Cho phép thiết lập lệnh nhảy. Ví dụ: Với trường sg7e trên Mẫu biểu nhập thông tin nghiên cứu cúm gia cầm viết là: N> sg8 – nghĩa là nếu giá trị nhập vào là N thì bỏ qua trường sg7ed và nhảy đến sg8. N>WRITE – nghĩa là nếu giá trị nhập vào là N sẽ thực hiện ghi bản ghi. Cho phép thiết lập thuộc tính bắt buộc nhập giá trị Yes – Bắt buộc phải nhập giá trị No - Không bắt buộc Cho phép thiết lập thuộc tính lặp giá trị Yes – Tự động điền giá trị cho trường là giá tương ứng của bản ghi vừa nhập trước đó. No - Không tự động điền giá trị Cho phép khai báo chú thích cho các giá trị số liệu. Để đảm bảo các ràng buộc số liệu được thiết lập đúng theo thiết kế của bộ câu hỏi, người sử dụng cần kiểm tra rà soát trên từng câu hỏi để xác định được các ràng buộc số liệu cho từng trường số liệu tương ứng. Chẳng hạn, với bộ câu hỏi nghiên cứu cúm gia cầm, các ràng buộc số liệu có thể xác định cho các trường như trong bảng sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 58 c Must enter: Yes (phải nhập giá trị) i1 Ngay phong van: Must enter: Yes (phải nhập giá trị) Repeat: Yes (lặp lại giá trị nhập lần trước đó) i2 Ho ten nguoi duoc phong van: Must enter: Yes (phải nhập giá trị) i3 Ten chu ho: Must enter: Yes (phải nhập giá trị) sg1 Gioi (khong hoi, quan sat roi ghi lai) : Must enter: Yes (phải nhập giá trị) Range/Legal: 1,2 (giá trị nhập vào là 1 hoặc 2) sg2 Anh/chi bao nhieu tuoi? Must enter: Yes (phải nhập giá trị) sg3 Tinh trang hon nhan cua anh/chi? 1. Doc than 2. Co gia dinh 3. Li di/Li than Must enter: Yes (phải nhập giá trị) Range/Legal: 1-4 (giá trị nằm trong các giá trị 1 đến 4) Value label: marriedstatus (tạo nhãn dữ liệu có tên là marriedstatus để chứa ý nghĩa của các giá trị) [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 59 4. Goa sg4 Noi o hien tai cua anh/chi? 1. Nong thon 2. Thanh thi Must enter: Yes (phải nhập giá trị) Range/Legal: 1,2 (giá trị nhập vào là 1 hoặc 2) sg5 Trinh do hoc van cao nhat ma anh/chi dat duoc? 1. Khong di hoc/mu chu/ 2. Biet doc, biet viet/ 3. Cap I 4. Cap II 5. Cap III 6. Trung cap 7. Cao dang/Dai ho 8. Tren Dai hoc Must enter: Yes (phải nhập giá trị) Range/Legal: 1-8 (giá trị nằm trong các giá trị 1 đến 8) Value label: education (tạo nhãn dữ liệu có tên là education để chứa ý nghĩa của các giá trị) sg6 Nghe nghiep hien tai cua anh/chi: 1. Ve huu 2.that nghiep 3. Sinh vien dai hoc 4. Noi tro 5. Co mot nghe nao do 6. Nhan vien van phong 7. Nhan vien ban hang/dich vu 8. Lam nong nghiep Must enter: Yes (phải nhập giá trị) Range/Legal: 1-12 (giá trị nằm trong các giá trị 1 đến 12) Value label: occupation (tạo nhãn dữ liệu có tên là occupation để chứa ý nghĩa của các giá trị) [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 60 9. Tho thu cong 10. Ky thuat vien/dieu khien may moc 11. Nguoi quan ly 12. Khac sg7 Anh/chi co di dau ra khoi dia ban xa noi dang sinh song trong vong mot thang 1. Co 2. Khong Must enter: Yes (phải nhập giá trị) Range/Legal: 1,2 (giá trị nhập vào phải là 1 hoặc 2) Jumps: 2>sg7c (nhảy đến biến sg7c bỏ qua không nhập biến sg7b, nếu giá trị nhập vào là 2) sg7d Muc do thuong xuyen anh/chi di lai giua cac xa nhu the nao? 1. Hang ngay 2. Hai, ba lan mot tuan 3. Mot tuan mot lan 4. It hon 3 lan hai tuan 5. Hang thang 6. Vai thang mot lan 7. Mot, hai lan mot nam 8. It hon mot lan nam/khong lan nao Must enter: Yes (phải nhập giá trị) Range/Legal: 1-8 (giá trị nằm trong các giá trị 1 đến 8) Value label: moving (tạo nhãn dữ liệu có tên là moving để chứa ý nghĩa của các giá trị) sg7e Anh/chi co thuong di lai giua cac tinh, thanh pho, hay nuoc ngoai khong? 1. Co 2. Khong Must enter: Yes (phải nhập giá trị) Jumps: N>sg8 (nhảy đến biến sg8 bỏ qua không nhập biến sg7ed, nếu giá trị nhập vào là N) [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 61 sg9 Anh/chi co hut thuoc la, thuoc lao khong? 1. Chua bao gio hut 2. Da tung hut 3. Hien dang hut Must enter: Yes (phải nhập giá trị) Range/Legal: 1-3 (giá trị nằm trong các giá trị 1 đến 3) Value label: smoking (tạo nhãn dữ liệu có tên là smoking để chứa ý nghĩa của các giá trị) Sau khi các ràng buộc của các trường dữ liệu (biến dữ liệu) được xác định, việc tiếp theo là sử dụng Epidata thiết lập các ràng buộc cho các trường số liệu. Việc sử dụng Epidata để thiết lập ràng buộc số liệu rất đơn giản, các ví dụ sau đây sẽ minh họa cách thiết lập các ràng buộc số liệu. Ví dụ 1: thiết lập ràng buộc cho biến i1 – ngày phỏng vấn Trên hộp thoại tham số ràng buộc, mục chọn tên biến, kích nút , chọn biến i1, tiếp theo chọn Must enter là Yes và Repeat là Yes và chọn Save. Ví dụ 2: đặt tham số cho biến sg3 – tình trạng hôn nhân Chọn biến sg3, chọn giá trị cho Yes ở ô Must enter nhập giá trị 1-4 vào ô Range, Legal, chọn Save. Hình ảnh hộp thoại tham số sau khi chọn như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 62 Trường SG3 có bốn giá trị số liệu 1, 2, 3, 4 được chấp nhận. Để có thể giúp cho người nhập liệu có thể xem được chú thích về ý nghĩa của các giá trị này, chú thích giá trị số liệu (gọi là nhãn số) cần được thiết lập cho trường này. Để thực hiện công việc này, người sử dụng phải chọn nút trên hộp thoại, viết dòng chú thích theo quy luật của Epidta vào hộp thoại Edit value labels và chọn accept and close để kết thúc. Hình 45: Hộp thoại Edit value labels Đoạn mã khai báo nhãn số liệu cho sg3 được viết như trong hình sau: Khai báo nhãn giá trị dữ liệu vào đây [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 63 Hình 46: Đoạn mã thiết lập nhãn số liệu Ví dụ 3: thiết lập ràng buộc dữ liệu cho biến sg7 – anh/chị có đi đâu ra khỏi địa bàn xã trong vòng một tháng không? Chọn biến sg7, đặt Must enter là Yes, Range/Legal là “1,2” và jumps là 2>sg7c và chọn Save. Hình ảnh của hộp thoại sau khi lệnh nhảy được thiết lập như sau : Chú ý : nếu giá trị của Jumps được viết là 1>V1, 2>V2, 3>Write có nghĩa là chương trình sẽ nhảy đến V1 nếu giá trị nhập vào là 1, V2 nếu giá trị nhập vào là 2 và ghi và kết thúc nhập bản ghi nếu giá trị nhập vào là 3. Đóng cửa sổ checks [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 64 Sau khi đã thiết lập được các ràng buộc số liệu, để đóng cửa sổ checks, chọn close trên hộp thoại tham số. 4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE Liên kết các tệp dữ liệu là kỹ thuật gép các tệp dữ liệu có quan hệ (chứa các thông tin liên quan) nhằm đảm bảo ràng buộc của dữ liệu liên quan. Một trường thông tin được sử dụng làm căn cứ cho các bản ghi được ghép chính xác với nhau được gọi là trường khóa. Chẳng hạn, một cá nhân (một người cụ thể) luôn thuộc vào một hộ gia đình nào đó. Vì vậy, trường mã số hộ gia đình phải được khai báo ở cả hai tệp số liệu thông tin hộ gia đình và thông tin cá nhân để chỉ ra mỗi cá nhân trong tệp số liệu cá nhân đều thuộc vào một hộ gia đình nào đó trong tệp số liệu thông tin hộ gia đình. Một hộ gia đình luôn có một hoặc nhiều cá nhân. Vì vậy, tương ứng với một bản ghi thông tin hộ gia đình sẽ có một hoặc nhiều bản ghi thông tin cá nhân. Một mã số hộ gia đình trong tệp số liệu hộ gia đình là duy nhất, nhưng lại không duy nhất trong tệp số liệu cá nhân. Trường mã số hộ gia đình được khai báo trong tệp số liệu hộ gia đình được gọi là trường khóa chính và cũng chính trường này trong tệp số liệu cá nhân được gọi là khóa ngoài. Nếu như ta thiết kế hai Mẫu biểu nhập liệu riêng biệt để nhập thông tin hộ gia đình và thông tin cá nhân thì sẽ phải nhập số liệu mã hộ gia đình vào cả hai tệp số liệu. Chính vì thế, mã số hộ gia đình ở tệp dữ liệu cá nhân có thể bị nhập sai và khi liên kết hai tệp dữ liệu sẽ có những hộ gia đình thừa hoặc thiếu thành viên. Việc liên kết các tệp dữ liệu sử dụng lệnh RELATE sẽ tạo ra Mẫu biểu nhập liệu cho phép nhập đồng thời thông tin hộ gia đình, thông tin cá nhân và tự động lấy giá trị mã số hộ gia đình ở tệp dữ liệu hộ gia đình điền vào tệp dữ liệu cá nhân ở các bản ghi ở tệp thông tin cá nhân tương ứng. Liên kết tệp dữ liệu sử dụng lệnh RELATE đảm bảo ràng buộc về liên kết số liệu. Ví dụ sau đây là một hướng dẫn cụ thể cho thực hành với liên kết tệp số liệu với lệnh RELATE. Ta có hai tệp REC với cấu trúc như sau : /___________________________________________________________________/ Cấu trúc tệp dữ liệu hộ gia đình HOUSE.REC với trường khóa chính là HouseID No. Name Variable label Field type Width Checks -------------------------------------------------------------------------------- 1 houseid Ma so ho gia Number 5 dinh [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 65 2 address Dia chi Text 32 3 city Thanh pho Text 22 4 bedrooms So giuong ngu Number 2 5 water Su dung nuoc Boolean 1 may khong: -------------------------------------------------------------------------------- Cấu trúc tệp dữ liệu cá nhân PERSON.REC với trường khóa ngoài là HouseID No. Name Variable label Field type Width Checks -------------------------------------------------------------------------------- 1 personid Ma so ca nhan ID number 5 2 houseid Ma so ho gia Number 5 dinh 3 name Ten ca nhan Text 33 4 age Tuoi Number 3 5 sex Gioi Boolean 1 -------------------------------------------------------------------------------- /___________________________________________________________________/ Để thực hiện liên kết hai tệp trên với lệnh RELATE, ta thực hiện các bước như sau: Bước 1: mở tệp HOUSE.REC ở chế độ thiết lập ràng buộc số liệu, hình ảnh như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 66 Hình 47: Tệp House.rec được mở trong cửa sổ checks Bước 2: đặt thuộc tính giá trị duy nhất Key Unique cho trường houseid. Để có thể thực hiện RELATE, cần phải chỉ định houseid là trường khóa duy nhất bằng lệnh KEY UNIQUE. Người sử dụng, trước tiên phải chọn trường houseid, chọn edit, viết mã lệnh và chọn accept and close để hoàn tất. Hình sau minh họa cho cách viết lệnh KEYUNIQUE. [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 67 Hình 48: Viết lệnh KEY UNIQUE Trong hình trên, lệnh KEY UNIQUE 1 chỉ định trường houseid là trường khóa duy nhất có số thứ tự là 1. Bước 3: chọn trường water là trường cuối cùng trên Mẫu biểu và thiết lập lệnh RELATE. Để đảm bảo rằng khi trường cuối cùng của tệp thông tin hộ gia đình được nhập thì sau đó, Epidata sẽ chuyển sang Mẫu biểu nhập dữ liệu cá nhân, người sử dụng phải chọn trường cuối cùng trên Mẫu biểu nhập dữ liệu hộ gia đình. Người sử dụng phải chọn trường warter, chọn edit để mở cửa sổ viết lệnh, kích accept and close để hoàn tất. [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 68 Hình 49: Hình ảnh cửa sổ chương trình sau khi trường water được chọn Hình 48: Đoạn mã lệnh liên kết hai tệp House.REC và Person.REC Trong đoạn mã lệnh ở hình trên, lệnh AFTER ENTRY ra lệnh cho thực hiện dòng RELATE houseid PERSON Epidata sau khi trường water được nhập. Dòng lệnh RELATE houseid PERSON chỉ ra rằng liên kết tệp House.rec với tệp Person.rec sử dụng trường houseid làm trường khóa. Với một lệnh AFTER ENTRY, luôn có một lệnh END đi kèm để báo hiệu cho Epidata về điểm kết thúc của đoạn mã lệnh được viết sau lệnh AFTER ENTRY. Một lệnh nằm sau lệnh END nói trên sẽ không được thực hiện vào thời điểm các lệnh nằm trong cặp lệnh AFTER ENTRY và END được [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 69 thực hiện. Khi nhập dữ liệu cho hai tệp liên kết, màn hình nhập dữ liệu có dạng như sau: Hình 50: Tệp House.rec đang được chọn để nhập số liệu Hình 51: Tệp Person.rec đang được chọn để nhập số liệu [Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 70 Khi thực hiện liên kết các tệp dữ liệu, điều quan trọng mà người sử dụng cần nắm được là phải xác định được trường khóa và khai báo trong các tệp cần liên kết. Thiết lập ràng buộc số liệu là những kỹ thuật rất quan trọng trong mục tiêu tạo ra một cơ sở dữ liệu ít lỗi nhất có thể. Câu hỏi lượng giá 1.Nêu các bước khai báo bộ câu hỏi và cú pháp khai báo trường dữ liệu. 2. Nêu các nhóm lỗi dữ liệu và các phương pháp kiểm tra lỗi dữ liệu. 3. Kể tên các ràng buộc dữ liệu có thể thiết lập với phần mềm Epidata và các bước cần thực hiện để thiết lập các ràng buộc dữ liệu với phần mềm Epidata. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 71 BÀI 4: NHẬP DỮ LIỆU Nhập dữ liệu là khâu đưa thông tin trên phiếu điều tra vào lưu trữ trong tệp REC nhờ hỗ trợ của phần mềm Epidata. Bài học này cung cấp cho người học những kỹ thuật cần thiết về nhập số liệu với phần mềm Epidata. 1. Nhập số liệu Việc nhập số liệu là đánh máy thông tin lấy từ bộ câu hỏi (phiếu phỏng vấn) vào các mục tương ứng trên Mẫu biểu nhập liệu. Các thao tác với phần mềm mà nhập liệu viên cần nắm được là mở Mẫu biểu nhập liệu, thêm bản ghi, xóa bản ghi, tìm sửa số liệu và đóng Mẫu biểu nhập liệu. Mở Mẫu biểu nhập liệu Khi khởi động chức năng nhập liệu, Epidata sẽ yêu cầu chọn tệp REC để sinh Mẫu biểu nhập liệu tương ứng. Để khởi động chức năng nhập liệu chọn nút 4.Enter Data trên thanh công cụ. Khi hộp thoại Open xuất hiện, việc tiếp theo là chọn tệp REC và chọn Open để bắt đầu nhập liệu. Hình 52 : Chọn tệp REC trên hộp thoại Open [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 72 Hình 53: Hình ảnh Mẫu biểu nhập liệu sẵn sàng cho nhập liệu Nhập số liệu Nhập liệu viên đọc các thông tin lần lượt của từng câu hỏi trên bộ câu hỏi và nhập vào các câu hỏi (ô hoặc mục) tương ứng trên Mẫu biểu nhập liệu. Khi câu hỏi cuối cùng được nhập đủ thông tin, Epidata đưa ra hộp thoại yêu cầu xác nhận ghi lại thông tin vừa nhập. Nếu đồng ý ghi thông tin thì chọn nút Yes và chọn No nếu muốn bỏ qua không ghi bản ghi này. Thêm bản ghi Có ba cách để thêm bản ghi: ƒ Dùng phím nóng: trên Mẫu biểu nhập liệu nhấn tổ hợp phím Ctrl+N. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 73 ƒ Dùng thực đơn: chọn Goto và chọn New Record trên thanh thực đơn ƒ Sử dụng nút lệnh thêm bản ghi: trên thanh công cụ chuyển bản ghi ( ), chọn nút . Khi thực hiện một trong ba thao tác trên, Epidata sẽ đưa ra yêu cầu xác nhận ghi lại bản ghi đã nhập và tạo bản ghi mới. Xóa bản ghi Tại một bản ghi hiện tại trên Mẫu biểu nhập liệu, người nhập có thể sử dụng một trong ba cách sau để xóa bản ghi đó: ƒ Dùng phím nóng: trên Mẫu biểu nhập liệu nhấn tổ hợp phím Shift+Del. ƒ Dùng thực đơn: chọn Goto và chọn Delete Record trên thanh thực đơn ƒ Sử dụng nút lệnh thêm bản ghi: trên thanh công cụ quản lý danh sách bản ghi ( ), chọn nút . Chú ý: Bản ghi bị xóa chưa được xóa hẳn khỏi tệp REC mà chỉ được đánh dấu xóa, bản ghi sẽ bị xóa hản khi người sử dụng lệnh đóng gói số liệu. Tìm và sửa bản ghi Trong khi nhập liệu, người nhập liệu cũng có thể tìm đến một bản ghi nào đó và sửa các thông tin. Để tìm và sửa bản ghi, có thể sử dụng một trong hai cách sau: ƒ Sử dụng thanh công cụ chuyển bản ghi để chuyển từ bản ghi này sang bản ghi khác. Thanh công cụ chuyển bản ghi có các nút lệnh - chuyển về bản ghi đầu tiên, - chuyển về bản ghi trước bản ghi hiện tại, - chuyển đến bản ghi tiếp theo bản ghi hiện tại, - chuyển đến bản ghi cuối cùng. ƒ Sử dụng hộp thoại tìm kiếm. Trong hai cách trên, sử dụng hộp thoại tìm kiếm mềm dẻo hơn, vì cách này cho phép thiết lập các điều kiện tìm kiếm và thực hiện theo các điều kiện đó. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 74 Hình 55: Hộp thoại tìm bản ghi Để tìm kiếm bản ghi cần biết ý nghĩa của các thành phần trên hộp thoại. Bảng sau sẽ giải thích về các thành phần này. Phần này là nơi để nhập vào điều kiện tìm kiếm, cột field dùng để nhập tên các biến và cột Criteria dùng để nhập các giá trị cho điều kiện tìm kiếm. Ví dụ tìm người có tên là “lan” và có tuổi là 20, ta nhập tên biến i2 và sg2 vào cột field, nhập chuỗi “*lan” và giá trị 23 vào cột criteria tương ứng với tên biến và chọn OK. Cho biết mẫu các chuỗi tìm kiếm: abcd (=abcd) – điều kiện tìm kiếm là bằng chuỗi giá điều kiện tìm kiếm, > (<) - lớn hơn (nhỏ hơn) giá trị tìm kiếm, *abcd – chuỗi chứa ký tự abcd ở cuối chuỗi, abcd* - chuỗi chứa ký tự abcd ở đầu chuỗi, *abcd* - chuỗi chứa abcd. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 75 ƒ Case sensitive: tìm những trường hợp tốt nhất ƒ Whole words only: cho phép viết điều kiện tìm kiếm chứa dấu * thay cho một nhóm ký tự bất kỳ. ƒ Ignore deleted records: bỏ qua các bản ghi bị đánh dấu xóa. ƒ Forward to last record: tìm từ bản ghi hiện tại cho đến bản ghi cuối cùng ƒ Backwards to first record: tìm ngược lại cho đến bản ghi đầu tiên kể từ bản ghi hiện tại ƒ All records: tìm trên tất cả các bản ghi Xóa các giá trị điều kiện tìm kiếm đã nhập Ví dụ 1: để tìm người có mã số 0101003, thiết lập tham số như sau: Ví dụ 2: để tìm người có tên là lan và tuổi là 23, thiết lập tham số như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 76 Đóng Mẫu biểu nhập liệu Để đóng Mẫu biểu nhập liệu, chọn file và chọn Close Mẫu biểu trên thanh thực đơn. Hình 56: Đóng Mẫu biểu nhập liệu [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 77 2. Xem dữ liệu Chức năng xem dữ liệu liệt kê dữ liệu tệp REC ở dạng bảng, tên cột của bảng là tên trường và mỗi dòng là một bản ghi. Để xem dữ liệu chọn 5. Document, chọn View data và sau đó chọn tệp REC ở hộp thoại Open và chọn Open. Hình 57: Xem dữ liệu 3. Xem cấu trúc tệp REC Như chúng ta đã biết, tệp dữ liệu REC được cấu trúc bởi các trường số liệu. Trường số liệu có các thuộc tính kiểu, nhãn, kích thước và các thuộc tính khác. Xem cấu trúc tệp dữ liệu giúp cho người sử dụng hiểu được ý nghĩa của các biến dữ liệu và kiểm tra cấu cấu trúc dữ liệu khi cần. Để xem cấu trúc dữ liệu chọn 5. Document và chọn File structure, sau đó trong hộp thoại Open chọn tệp cần REC và chọn Open. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 78 Hình 58: Mô tả cấu trúc tệp dữ liệu nghiên cứu cúm gia cầm Chú ý: chọn trên thanh công cụ để ghi cấu trúc ra tệp lài liệu và chọn để in ra máy in. 4. Liệt kê số liệu Chức năng này cho phép liệt kê số liệu trong tệp REC theo các bản ghi dạng các quan sát (observation). Để liệt kê dữ liệu chọn 5. Document và chọn List data, sau đó trong hộp thoại Open chọn tệp cần REC và chọn Open. [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 79 Hình 59: Liệt kê số liệu dạng các quan sát Chú ý: Tương tự như với chức năng xem cấu trúc tệp REC, người sử dụng cũng có thể lưu các thông tin về dữ liệu đã được liệt kê ra tệp dạng TEXT (tệp .txt) hoặc in ra máy in. 5. Xem mô tả số liệu Chức năng này cho phép người sử dụng đưa ra thông tin mô tả tệp số liệu REC. Thông tin mô tả tệp REC gồm tên trường, nhãn, kiểu và các thông tin thống kê khác về số liệu theo từng trường trong tệp REC. Đây là những thông tin cần thiết cho người sử dụng khi làm việc với tệp số liệu. Để đưa ra các thông tin mô tả tệp số liệu, người sử dụng [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 80 chọn 5. Document, chọn Codebook. Khi hộp thoại Open xuất hiện, chọn tệp REC và chọn Open, màn hình xuất hiện hộp thoại Codebook như sau: Hình 60: Hộp thoại Codebook Khi hộp thoại codebook xuất hiện, người sử dụng phải chọn các tham số tùy chọn cho báo cáo mô tả tệp số liệu và chọn OK để sinh báo cáo. Các tham số tùy chọn chính trên hộp thoại Codebook gồm: ƒ All records: chỉ định tạo Codebook cho tất cả các bản ghi của tệp số liệu ƒ From record # to # : Tạo Codebook cho các bản ghi từ số # đến số # ƒ Select fields: liệt kê danh sách các trường có trong tệp số liệu. Trường nào cần được mô tả trong tệp tài liệu codebook thì phải được chọn (3) và ngược lại. Với trường hợp tệp REC của nghiên cứu cúm gà, báo cáo mô tả tệp số liệu có hình ảnh như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 81 Hình 61: Báo cáo mô tả tệp số liệu cúm gà Chú ý: Tương tự như với chức năng xem cấu trúc tệp REC, người sử dụng cũng có thể lưu các thông tin mô tả tệp dữ liệu ra tệp dạng TEXT (tệp .txt) hoặc in ra máy in. Câu hỏi lượng giá 1. Nêu các thao tác kỹ thuật nhập số liệu với phần mềm Epidata. 2. Khi xem cấu trúc dữ liệu, người sử dụng biết được những thông tin gì? 3. Khi liệt kê số liệu, người sử dụng biết được những thông tin gì? 4. Nội dung của báo cáo mô tả tệp số liệu là gì? [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 82 BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU Ghép các tệp số liệu và chuyển định dạng của chúng sang các tệp định dạng khác để các phần mềm phân tích thống kê số liệu khác nhau có thể đọc được là rất cần thiết. Thực tế, khi làm việc với các tệp số liệu, người ta luôn có nhu cầu thực hiện các công việc này để tạo ra tệp số liệu có đầy đủ các bản ghi, các trường số liệu mong muốn, từ nhiều tệp số liệu khác nhau. Chẳng hạn, người sử dụng muốn ghép tệp số liệu hộ gia đinh và tệp số liệu các cá nhân để có được tệp số liệu có thông tin hộ gia đình và thông tin và các thành viên trong hộ gia đình, hoặc chuyển tệp REC sang tệp định dạng Stata để thực hiện phân tích số liệu bằng phần mềm Stata. Bài học giúp cho người sử dụng có thể hiểu và thực hiện được các công việc trên với phần mềm Epidata. 1. Ghép tệp số liệu Ghép các tệp số liệu phục vụ cho phân tích thống kê số liệu là một yêu cầu thường gặp khi làm việc với số liệu. Số liệu có thể được nhập trên nhiều máy tính khác nhau, do nhiều người nhập. Kết quả là có nhiều tệp số liệu thành phần của một bộ số liệu. Để có một bộ số liệu hoàn chỉnh, người sử dụng phải ghép các tệp số liệu này lại với nhau. Tệp được ghép sẽ có tổng số bản ghi bằng tổng số các bản ghi của các tệp số liệu thành phần. Một trường hợp khác, khi có hai tệp số liệu là danh sách bệnh nhân HIV và thông tin khám lần đầu của các bệnh nhân HIV. Tệp số liệu danh sách các bệnh nhân HIV chứa các thông tin cá nhân như mã số, họ tên, địa chỉ, .v.v. Tệp thông tin khám lần đầu chứa các thông tin như ngày khám, các thông tin xét nghiệm, các triệu trứng lâm sàng .v.v. Để có một tệp số liệu có thông tin cá nhân của bệnh nhân HIV và thông tin khám lần đầu của bệnh nhân phục vụ cho phân tích, ta phải ghép hai tệp số liệu đó theo trường khóa mã cá nhân. Khi đó, tệp được ghép sẽ có các trường số liệu là các trường trong tệp thứ nhất và tệp thứ hai được hợp lại theo trường khóa (trường mã cá nhân). Epidata cung cấp tính năng Append/Merge phục vụ cho hai trường hợp ghép tệp số liệu với hai phương thức ghép là Append (nối) và Merge (hợp nhất). ƒ Append là phương thức nối tiếp danh sách các bản ghi của tệp thứ hai vào danh sách các bản ghi của tệp thứ nhất. Tệp được ghép có số bản ghi bằng tổng số bản ghi của hai tệp thành phần cộng lại. Tập hợp biến của tệp ghép đầu ra có thể là hợp của tập hợp biến trong tệp thứ nhất và tập hợp biến trong tệp thứ hai hợp lại, hoặc chỉ bằng tập hợp biến của tệp thứ nhất, tùy theo tham số tùy chọn được chọn khi nối hai tệp. [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 83 ƒ Merge là phương thức hợp nhất hai tệp số liệu, trong đó, tệp số liệu được tạo ra có các biến là hợp của tập hợp các biến trong tệp thứ nhất và tập hợp các biến trong tệp thứ hai hợp lại. Số lượng các bản ghi của tệp ghép có thể là hợp các bản ghi của hai tệp thành phần, hoặc chỉ bằng số bản ghi của tệp thứ nhất tùy theo tham số tùy chọn được chọn khi hợp nhất hai tệp. Các bước thực hiện ghép tệp như sau: Mở các tệp số liệu cần ghép Trong cửa sổ của Epidata, chọn Data in/out, chọn Append/Merge Hình 62: Khởi động chức năng ghép tệp Khi chức năng Append/Merge được kích hoạt, hộp thoại Append/Merge xuất hiện có hình ảnh như sau: Hình 63: Hộp thoại Append/merge data file [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 84 Chọn các tệp số liệu thành phần Trên cửa sổ Append/Merge data files, kích nút lệnh chọn các tệp số liệu cần ghép thứ nhất và thứ hai và chọn OK, hộp thoại Append/Merge xuất hiện sau đó, như hình dưới đây: Hình 64: Hộp thoại Append/merge data file Chọn phương thức ghép tệp và kết thúc ghép tệp Tùy theo yêu cầu ghép tệp số liệu mà ta có thể chọn phương thức ghép tương ứng là Append hay Merge. Ghép tệp theo phương thức Append: các tham số cần được thiết lập gồm: ƒ Resulting data file: tên tệp kết quả sẽ được tạo ra ƒ Thẻ Append: thẻ Append được chọn để thiết lạp tham số ghép tệp ƒ “Append only data from fields in data file B that also exists in data file A” chỉ định các trường của tệp kết quả chỉ gồm các trường của tệp A (tệp thứ nhất). [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 85 ƒ “Append all fields in data file B” chỉ định tệp kết quả có số trường là số trường của cả hai tệp thành phần hợp lại. Các tùy chọn được thiết lập sẽ quy định kết quả tệp ghép được sinh ra. Chẳng hạn, ta muốn ghép hai tệp women.rec (tệp A) trong thư mục khamthai và tệp women.rec (tệp B) trong thư mục khác (thư mục khamthai\test1) theo phương thức Append. Yêu cầu ghép tệp là chỉ ghép những số liệu tồn tại trong các trường của tệp A mà tồn tại trong tệp B. Các tham số tùy chọn có hình ảnh như sau: Hình 65: Tham số ghép tệp trên hộ thoại Append/merge data file Sau khi thiết lập được các tham số cho phương thức ghép tệp, ta chọn nút lệnh Append để kết thúc việc ghép tệp. Chú ý: Sau khi chọn Append, Epidata sẽ hỏi đặt nhãn chú thích cho tệp ghép, ta có thể chọn OK để bỏ qua việc đặt nhãn tệp (nếu muốn đặt nhẵn để ghi chú về tệp như người tạo, ngày tạo, mục đích sử dụng, … thì có thể gõ vào hộp thoại yêu cầu nhaapj nhãn tệp). Ghép tệp theo phương thức Merge: ghép tệp theo phương thức Merge được thực hiện tương tự như với ghép tệp theo phương thức Append. Sự khác biệt chỉ là các tham số tùy chọn được thiết lập, các tham số tùy chọn như sau: [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 86 ƒ Với phương thức ghép tệp là Append, ta chọn thẻ Append trên hộp thoại. Với ghép tệp theo phương thức Merge, chọn thẻ Merge. ƒ Select key fields: cho phép chọn trường khóa được sử dụng làm căn cứ để hợp nhất hai tệp. Trường khóa được chọn cho ghép tệp phải là một trường đồng thời có trong cả hai tệp thứ nhất (tệp A) và tệp thứ hai (tệp B). ƒ Merge only record from data file B that match records in data file A: yêu cầu số liệu tệp được ghép sẽ gồm toàn bộ các bản ghi của tệp A ghép thêm số liệu trong tệp B có giá trị trường khóa tương ứng. ƒ Merge all records from data file B: yêu cầu các bản ghi trong tệp ghép bằng các bản ghi hai tệp thành phần hợp lại. Chọn nút lệnh Merge để thực hiện ghép tệp là thao tác cuối cùng sau khi các tham số tùy chọn đã được thiết lập. Hình ảnh dưới đây là ví dụ của việc ghép hai tệp số liệu theo phương thức Merge với trường khóa được chỉ định là Personid (mã cá nhân). Hình 66: Tham số hợp hai tệp trên hộ thoại Append/merge data file [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 87 2. Xuất nhập tệp số liệu Có nhiều phần mềm có thể sử dụng để phân tích số liệu như SPSS, Epi_info, Stata, SAS.v.v. Các phần mềm này sử dụng các loại tệp có định dạng không giống nhau. Vì vậy, để phân tích số liệu bằng một phần mềm nào đó thì phải chuyển định dạng tệp số liệu sang định dạng khác để phần mềm đó có thể đọc được. Nhập xuất tệp số liệu và chuyển định dạng tệp số liệu là chức năng phần mềm tiện ích được xây dựng nhằm đáp ứng yêu cầu chuyển định dạng tệp số liệu. 2.1 Xuất tệp số liệu Sử dụng chức năng xuất tệp số liệu của Epidata, người sử dụng có thể sinh ra một tệp số liệu có định dạng khác như SPSS, Stata, SAS, Excel. Các bước xuất tệp số liệu gồm chọn tệp REC, chọn tham số tùy chọn và thực hiện xuất tệp. Chọn tệp số liệu REC Chọn Export Data trên thanh công cụ và chọn kiểu định dạng số liệu đầu ra. Nếu số liệu đầu ra mong muốn có định dạng của SPSS, ta chọn Export Data và chọn SPSS. Khi hộp thoại Open xuất hiện cần chọn tệp dữ liệu REC và chọn Open. Hình 67: Xuất tệp số liệu sang định dạng của Spss Chọn các tham số tùy chọn và xuất tệp số liệu Khi tệp REC đã được mở, hộp thoại Export Data xuất hiện. Việc tiếp theo là chọn các tham số tùy chọn và nhấn OK để thực hiện xuất tệp số liệu. [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 88 Hình 68: Hộp thoại Export data Chú ý: Hộp thoại Export Data có các tham số có ý nghĩa như sau: ƒ All records: Xuất tất cả các bản ghi của tệp dữ liệu ƒ From record # to # : Chỉ xuất các bản ghi từ số # đến số # ƒ Select fields: cho phép chọn các trường dữ liệu sẽ xuất hiện ở tệp đầu ra (trường được tích trong danh sách sẽ xuất hiện trong tệp đầu ra) 2.2 Nhập tệp số liệu Nếu chức năng xuất tệp số liệu sinh ra tệp số liệu có định dạng khác từ một tệp REC thì chức năng nhập tệp số liệu của Epidata tạo ra tệp số liệu REC từ tệp số liệu Excel, dBase hoặc Stata. Để nhập tệp số liệu, chọn Import Data từ thực đơn Data in/out trên thanh thực đơn, sau đó chọn tệp số liệu đầu vào và chọn OK trên hộp thoại Import from Stata (dBase/Text). [Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 89 Hình 69: Khởi động chức năng import tệp Stata Hình 70: Hộp thoại chọn tệp Chú ý: trên hộp thoại nhập tệp số liệu, có thể chọn nút để chọn tệp số liệu đầu vào, sau đó chỉ định tên tệp đầu ra (tệp REC) và nơi lưu tệp ở mục Import to. Câu hỏi lượng giá 1. Nêu các bước của kỹ thuật ghép các tệp số liệu. 2. Nêu ý nghĩa của hai phương thức ghép tệp số liệu Append và Merge. 3. Vì sao phải thực hiện chuyển định dạng tệp số liệu? 4. Các bước để thực hiện chuyển định dạng tệp số liệu với chức năng Xuất tệp dữ liệu của Epidata. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 90 BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH Bài học này hướng dẫn người học sử dụng các chức năng tiện ích của Epidata. Các chức năng này được phát triển dựa trên những yêu cầu thực tế của công việc quản trị số liệu, vì vậy, chúng làm cho Epidata trở thành một công cụ hiệu quả đối với người sử dụng. 1. Sửa tên trường Thực tế, khi tệp REC được tạo ra, số liệu đã được nhập vào thì người sử dụng lại muốn sửa lại tên biến (trường). Người sử dụng có thể sửa lại tên trường trong tệp QES và tạo lại tệp REC từ tệp QES. Tuy nhiên, số liệu đã nhập sẽ bị mất nếu ta làm theo cách này. Epidata có tính năng sửa tên trường (Rename fields) hỗ trợ đổi tên trường trực tiếp trên tệp REC, không làm mất số liệu đã nhập. Để sửa tên trường, ta chọn tools, chọn rename fields trên thanh thực đơn chương trình. Khi hộp thoại Open xuất hiện, ta chọn tệp REC và chọn Open, hộp thoại change field names sau đó được mở có hình ảnh như sau: Hình 71: Hộp thoại đổi tên trường Hộp thoại trên có ba cột Field name, Label và New field name. Cột Field name chứa tên hiện tại của các trường số liệu trong tệp REC, cột Label chứa nhãn biến và cột New field name cho phép nhập vào tên mới của các trường số liệu. Để sửa tên trường [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 91 nào, người sử dụng chỉ cần nhập tên mới của các biến vào cột New field name trên cùng dòng, tương ứng với tên biến cũ và sau đó chọn Save and close để ghi lại tên biến mới và đóng hộp thoại. 2. Sao chép cấu trúc tệp REC Chức năng sao chép cấu trúc tệp REC cho phép người sử dụng sao chép cấu trúc tệp REC, không bao gồm số liệu. Chức năng này giúp cho người sử dụng có thể sử dụng lại tệp REC để nhập số liệu mà không cần đến tệp QES. Các bước sao chép cấu trúc tệp REC gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và thực hiện copy. Khởi động chức năng Để khởi động chức năng, ta chọn tool, chọn Copy structure trên thanh thực đơn. Hình 72: Khởi động chức năng copy cấu trúc tệp số liệu Chọn tệp REC Epidata yêu cầu chọn tệp REC trên hộp thoại Select data file to copy sau khi chức năng này được khởi động. Tiếp theo, người sử dụng phải chọn tệp REC để hoàn thành bước này. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 92 Hình 73: Chọn tệp REC Đặt các tham số tùy chọn và thực hiện Copy Khi tệp REC được chọn, Epidata yêu cầu người sử dụng phải chọn các tham số tùy chọn trên hộp thoại Copy file structure. Hình 74: Đặt tham số tùy chọn với hộp thoại copy cấu trúc tệp REC Trong bước này, người sử dụng phải điền vào các tham số tùy chọn trên hộp thoại và nhấn nút OK để kết thúc. Các tham số tùy chọn trên hộp thoại gồm: ƒ New data file: tên tệp REC mới [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 93 ƒ Don’t copy text field : không copy trường kiểu text ƒ Copy check file: copy tệp CHK liên quan tệp REC 3. Đếm bản ghi theo trường dữ liệu Chức năng này đưa ra báo cáo về số lượng bản ghi theo các giá trị số liệu xuất hiện trong một trường số liệu nào đó, các bước thực hiện gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và kết thúc. Khởi động chức năng Để khởi động chức năng, ta chọn 5.Document, chọn Count Records trên thanh thực đơn. Hình 75: Khởi động chức năng đếm bản ghi Chọn tệp REC, các tham số tùy chọn và kết thúc Sau khi khởi động chức năng, Epidata mở hộp thoại Count record by field, yêu cầu người sử dụng chọn tệp REC, chọn biến sẽ được sử dụng. Cuối cùng người sử dụng phải chọn OK để kết thúc. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 94 Hình 76: Hộp thoại Count record by field Hình 77: Báo cáo kết quả đếm bản ghi theo trường SG1 Chú ý: Các tham số tùy chọn trên hộp thoại gồm: ƒ Enter filename: tên tệp REC ƒ Field to evaluate: tên trường sử dụng [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 95 4. So sánh hai tệp dữ liệu Chức năng này cho phép người sử dụng đưa ra báo cáo về các thông tin giống và khác nhau của số liệu trong hai tệp REC. Chẳng hạn, ta đem so sánh hai tệp thông tin điều tra cúm gia cầm được nhập ở bởi hai nhóm nhập liệu khác nhau là cumgiacam1.rec và cumgiacam2.rec, các bước thực hiện như sau: Khởi động chức năng Để khởi động chức năng, ta chọn 5.Document, chọn chọn Validate duplicate files. Chọn tệp REC Trên hộp thoại Validate files, ta chọn các tệp và chọn OK để chuyển sang bước tiếp theo. Hình 78: Hộp thoại chọn tệp Validate files Chọn các tham số tùy chọn và kết thúc Trong bước này, người sử dụng phải chọn các trường khóa (select key fields) và các tham số tùy chọn khác (option) như bỏ qua các bản ghi được đánh dấu xóa (ignore deleted records), trường kiểu Text (ignore text fields), .v.v. và nhấn OK để đưa ra báo cáo. [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 96 Hình 79: Hộp thoại tùy chọn Validate files Hình 80: Kết quả so sánh số liệu 5. Đóng gói tệp số liệu [Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 97 Chức năng đóng gói tệp số liệu tạo ra tệp REC mới từ một tệp REC ban đầu, trong đó, các bản ghi được đánh dấu xóa không được sao chép sang tệp mới. Để thực hiện đóng gói, ta chọn Tool và chọn Pack data file trên thanh thực đơn và chọn tệp REC trong hộp thoại Open. Khi nhấn nút Open để kết thúc bước chọn tệp REC, Epidata đưa ra thông báo hỏi người sử dụng xác nhận là xóa các bản ghi đã được đánh dấu xóa. Nếu đồng ý, người sử dụng nhấn OK để kết thúc và nhấn Cancel để hủy bỏ. 6. Tạo tệp QES từ tệp REC Chức năng này được sử dụng để sinh ra một tệp QES từ một tệp REC. Thực tế, người sử dụng có thể muốn sinh ra tệp REC có cấu trúc gần giống với tệp REC đang có, nhưng lại chưa có tệp QES. Để có thể tạo nhanh ra một tệp REC như vậy, người sử dụng có thể sử dụng chức năng này sinh ra tệp QES từ tệp REC, sửa lại nội dung tệp QES và sinh ra tệp REC mong muốn. Để sinh tệp QES từ tệp REC, ta chọn Tool trên thanh thực đơn, chọn QES file from REC file, chọn tệp REC trên hộp thoại Create QES file from data file và chọn OK để kết thúc. Câu hỏi lượng giá Hãy nêu tên các tiện ích được nhắc đến trong bài học và chức năng của các tiện ích đó. [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 98 BÀI TẬP TỔNG KẾT Giáo trình này đã trình bày những kiến thức và kỹ thuật cần thiết để làm việc với phần mềm Epidata. Để giúp cho người học củng cố lại những kiến thức và kỹ thuật trong nội dung giáo trình, chúng tôi đưa ra bài tập tổng kết này. Bộ câu hỏi được đưa ra dưới đây là một phần trong bộ câu hỏi “Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động và sự chấp nhận của xã hội với hút thuốc”. Yêu cầu đặt ra cho những người học là hãy sử dụng phẩn mềm Epidata để tạo ra công cụ nhập số liệu cho bộ câu hỏi của nghiên cứu này. Các kỹ thuật mà những người học cần thực hiện gồm: khai báo bộ câu hỏi, tạo tệp REC, thiết lập ràng buộc số liệu và nhập số liệu. /___________________________________________________________________/ Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động và sự chấp nhận của xã hội với hút thuốc (Bộ câu hỏi giành cho phụ nữ) Họ và tên:................................................................................................................ Họ tên điều tra viên:................................................................................................ Họ tên giám sát viên:.................................................................. ............................ Ngày phỏng vấn:......................................... ............................... ........................... Đồng ý tham gia phỏng vấn: 1. Có 2. Không Mức độ hoàn thành bảng hỏi: 1. Hoàn thành 2. Không gặp (ĐTV đến 3 lần không gặp) 3. Không có nhà 4. Không hợp tác (Chú ý:1. Tiêu chuẩn lựa chọn đối tượng: Phụ nữ độ tuổi 18-55 (theo danh sách). 2. Thay thế đối tượng: Trong trường hợp không gặp, không có nhà, không hợp tác: chọn đối tượng nhà liền kề bên tay phái) [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 99 I. THÔNG TIN CHUNG Chuyển câu C1 Năm sinh (dương lịch) ....................... C2 Chị hiện đang sống ở đâu Nông thôn 1 Thành thị (thị trấn/thị xã) 2 C3 Trình độ học vấn cao nhất (Với hệ 10 năm: lớp 7 là hết cấp II Với hệ 11 năm: lớp 8 là hết cấp II Với hệ 12 năm: lớp 9 là hết cấp II) Chưa bao giờ đi học Chưa học hết hoặc hết cấp I Chưa học hết hoặc hết cấp II Chưa học hết hoặc hết cấp III Trung cấp Cao đẳng, đại học Trên Đại học 1 2 3 4 5 6 7 C4 Nghề nghiệp chính (nghề mang lại thu nhập chính) của chị hiện nay là gì? Công chức (đang công tác) Nông dân Công nhân Thợ xây, Thợ thủ công Học sinh/sinh viên Buôn bán nhỏ Hưu trí Thất nghiệp/Nội trợ Khác, (ghi rõ).......................... 1 2 3 4 5 6 7 8 9 C5 Tình trạng hôn nhân hiện tại Đang sống với chồng Độc thân 1 2 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 100 (Xa nhau vì công việc là người chồng có mặt ở nhà ít hơn 1 tuần/tháng) Ly thân Ly dị Goá Xa nhau vì công việc Khác, (ghi rõ)........................ 3 4 5 6 7 C6 Hiện tại chị có hút thuốc lá /lào không ? Có Không 1 2 C7 Trong nhà chị hiện tại có ai hút thuốc lá/lào không (sống cùng nhà với chị trong vòng ít nhất 3 tháng trở lại đây)? (nhiều lựa chọn) Bố Chồng Anh/em trai Khác, (ghi rõ)........................ Không ai hút 1 2 3 4 5 ÆC9 C8 Nếu có, có bất cứ ai trong số những người hút thuốc ở cùng nhà với chị trong tuần qua không? Có Không 1 2 1.1.1. II. Thực trạng hút thuốc thụ động C9 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nhà? (phòng khách, phòng ngủ, phòng ăn nhà vệ sinh…) (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày.....…………………… (giá trị từ 0 - 7 ngày) [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 101 C10 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nơi làm việc? (Chỉ hỏi với những người đi làm - được trả lương) (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày.....…………………… (giá trị từ 0 - 7 ngày) C11 Trong tuần qua, có bao nhiêu ngày chị tiếp xúc với khói thuốc ở nơi công cộng (bến tàu xe, nơi tập trung đông người...)? (Chỉ cần tiếp xúc 1 hoặc một số lần trong ngày) Ghi tổng số ngày.....…………………… (giá trị từ 0 - 7 ngày) C12 Con/cháu/trẻ em (nhỏ hơn 16 tuổi, sống cùng nhà) của chị có phải tiếp xúc với khói thuốc lá của bất cứ thành viên nào sống cùng nhà trong tuần qua không? Có Không Tôi không có con/trẻ con sống cùng nhà Không biết/không trả lời 1 2 3 4 C13 Câu nói nào sau đây mô tả đúng nhất tình trạng tiếp xúc với khói thuốc của các thành viên trong nhà chị? (Đọc các phương án trả Mọi người có thể tiếp xúc khói thuốc ở bất cứ đâu trong nhà vào bất cứ lúc nào Mọi người tiếp xúc khói thuốc ở một số nơi, và/hoặc vào một lúc nào đó 1 2 3 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 102 lời) Mọi người không bao giờ phải tiếp xúc khói thuốc trong nhà Không biết/không trả lời 4 III. Hiểu biết về tác hại của khói thuốc lá C14 Theo chị khói thuốc của người hút thuốc có ảnh hưởng tới sức khỏe của người xung quanh không? Có Không Không biết/ không trả lời 1 2 3 Æ C16 Æ C16 C15 Theo chị nếu hít phải khói thuốc có thể gây bệnh thì đó là bệnh gì? (nhiều lựa chọn, để tự trả lời) Bệnh phổi/phế quản/ho & viêm họng Ung thư phổi Lao phổi Bệnh tim mạch Gày yếu suy nhược Khác (ghi rõ):………….................. 1 2 3 4 5 6 C16 Theo chị phụ nữ có thai hít phải khói thuốc thì có hại không? (để phụ nữ đánh giá mức độ có hại của khói thuốc thụ động dựa vào thang đo bên) Rất có hại Có hại Không có ý kiến gì/ko chắc chắn Không có hại lắm Hoàn toàn không có hại 1 2 3 4 5 ÆC18 C17 Theo chị thì khói thuốc có thể gây ra những bệnh gì Sinh con nhẹ cân 1 [Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 103 cho phụ nữ có thai và thai nhi? (nhiều lựa chọn, để tự trả lời) Tăng nguy cơ trẻ sinh ra bị ung thư não, máu trắng Viêm đường hô hấp cấp tính trẻ em Sảy thai/đẻ non Không biết/không trả lời Khác (ghi rõ):................................ 2 3 4 5 6 C18 Theo chị khói thuốc có hại đến sức khỏe của trẻ em không? (để phụ nữ đánh giá mức độ có hại của khói thuốc thụ động dựa vào thang đo bên) Rất có hại Có hại Không có ý kiến gì/không chắc chắn Không có hại lắm Hoàn toàn không có hại 1 2 3 4 5 ÆC20 C19 Nếu có hại thì khói thuốc có thể gây bệnh gì cho trẻ em? (nhiều lựa chọn, để tự trả lời) Viêm đường hô hấp Tăng nguy cơ các bệnh về tim Hen suyễn Viêm tai giữa Không biết Khác (ghi rõ):.......................................... 1 2 3 4 5 6 /___________________________________________________________________/ [Bộ môn Tin học – Đại học YTCC] | TÀI LIỆU THAM KHẢO 104 TÀI LIỆU THAM KHẢO 1. Epidata for data entry and documentation, Ziad EI, Clinical Cancer Epidemiology, 2004 2. Jens ML, Michael BR, Epidata Help, The Epidata Association, Odense Denmark,26/10/2004

Các file đính kèm theo tài liệu này:

  • pdfTài liệu giảng dạy môn kỹ thuật máy tính.pdf