Tin học quản lý - Chương 2: Làm sạch dữ liệu - Đại học công nghiệp TP HCM

Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) Được dùng khi gặp câu hỏi có nhiều trả lới (MA) để tập hợp một thông tin chứa trong các câu trả lời, muốn vậy cần tạo một biến với 2 biểu hiện: 1 có thông tin và 0 không có thông tin, đếm 1 sẽ có được thông tin cần quan tâm; cách tiến hành: Vào Transform \ count. Thí dụ minh họa “baosggp”

pdf3 trang | Chia sẻ: dntpro1256 | Lượt xem: 661 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Tin học quản lý - Chương 2: Làm sạch dữ liệu - Đại học công nghiệp TP HCM, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
09/01/2018 1 FBA TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG II: LÀM SẠCH DỮ LIỆU TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.1 LÝ DO 2.2 CÁC BIỆN PHÁP NGĂN NGỪA 2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU 2.3.1 DÙNG BẢNG TẦN SỐ 2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN (BASIC OR GERERAL) TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.1 LÝ DO  Chất lượng của phỏng vấn và đọc soát  Nhập liệu sai, sót, thừa 09/01/2018 2 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.1 CÁC BIỆN PHÁP NGĂN NGỪA  Thiết kế bảng câu hỏi rõ ràng.  Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng. Điều tra thử trước khi tiến hành chính thức.  Bảng câu hỏi sau khi phỏng vấn phải được đọc kiểm soát lỗi trước khi tiến hành nhập liệu.  Việc mã hóa phải tiến hành tập trung và nhất quán với chuyên gia nhập liệu. TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.3 Các phương pháp làm sạch dữ liệu 2.3.1 Dùng bảng tần số Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần số để tìm dữ liệu sai sót để sửa. Thực hiện: từ cửa sổ Data view Analyze Descriptive Statistics  chọn Frequencies  Hộp thoại. Thí dụ: Minh họa bằng data lamsachdulieu.sav TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.3 Các phương pháp làm sạch dữ liệu 2.3.1 Dùng bảng tần số 09/01/2018 3 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.3 Các phương pháp làm sạch dữ liệu 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến. Thực hiện: từ cửa sổ Data view Analyze Descriptive Statistics  chọn Frequencies  Hộp thoại. - Bước 1: Vào Data  Select Cases..., khi màn hình hiện ra hộp thoại thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào - Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó ấn Continue và ấn tiếp OK. - Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để sửa. - Thí dụ: Minh họa bằng data lamsachdulieu.sav IS TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.3 Các phương pháp làm sạch dữ liệu 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến. Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) Được dùng khi gặp câu hỏi có nhiều trả lới (MA) để tập hợp một thông tin chứa trong các câu trả lời, muốn vậy cần tạo một biến với 2 biểu hiện: 1 có thông tin và 0 không có thông tin, đếm 1 sẽ có được thông tin cần quan tâm; cách tiến hành: Vào Transform \ count. Thí dụ minh họa “baosggp”.

Các file đính kèm theo tài liệu này:

  • pdftin_hoc_quan_ly_spss_baigiangspss_c2_6538_1999322.pdf