Đề tài Thu thập và xử lý dữ liệu

Các phương pháp thu thập dữ liệu: Phỏng vấn trực tiếp (Face to face interview) ▪Phỏng vấn tại nhà (Door to door inetrview) ▪Phỏng vấn tại một địa điểm cụ thể (Central location interview) ▪Phỏng vấn chặng (Mall –Intercept interview) Phỏng vấn qua điện thoại Phỏng vấn qua thư Phỏng vấn qua internet Quan sát (Observation)

pdf69 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 2266 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Đề tài Thu thập và xử lý dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ÂU TRAÛ LÔØI  Trong nhaõn hieäu nöôùc ngoït coù gaz sau ñaây baïn söû duïng thöôøng xuyeân nhaát nhaõn hieäu naøo? Coca-Cola 1 Pepsi-Cola 2 Sprite 3 7-Up 4 Fanta 5 Nguyen Duy Tam - 15  Baïn ñaõ töøng uoáng qua caùc nhaõn hieäu nöôùc ngoït coù gaz naøo trong caùc nhaõnhieäu sau ñaây? Coca-Cola 1 Pepsi-Cola 2 Sprite 3 7-Up 4 Fanta 5 Nguyen Duy Tam - 16 CÂU HỎI LIỆT KÊ NHIEÀU CAÂU TRAÛ LÔØI 28-Mar-10 9 CÂU HỎI XẮP HẠNG Quan troïng Bình thöôøng Khoâng quan troïng Chất lượng bắt sóng Kiểu dáng thời trang ….. Nguồn gốc xuất xứ 1 1 1 1 2 2 2 2 3 3 3 3 17  Q:Trong các yếu tố sau đây anh/chị hãy cho biết mức độ quan trọng nhất, nhì, ba trong việc lựa chọn mua một máy điện thoại? Chất lượng bắt sóng _____ Kiểu dáng thời trang _____ ….. _____ Nguồn gốc xuất xứ _____  Hãy cho biết mức độ quan trọng của các yếu tố sau trong việc lựa chọn mua 1 máy điện thoại di động Nguyen Duy Tam - Ordinal CÁC DẠNG CÂU HỎI PHÂN MỨC 18  Q. “Theo ý bạn những câu nói sau đây câu nào mô tả đúng nhất về màu sắc của bao bì sản phẩm này?” Quá tối 1 Hơi tối 2 Vừa 3 Hơi sáng 4 Quá sáng 5 Nguyen Duy Tam - Ordinal 28-Mar-10 10 CÁC DẠNG CÂU HỎI PHÂN MỨC 19  Q. “Đối với mỗi câu nói sau, bạn làm ơn chỉ ra mức độ đồng ý của bạn như thế nào về vấn đề X?” Hoàn toàn đồng ý 1 Đồng ý 2 Y kiến trung dung 3 Không đồng ý 4 Hoàn toàn không đồng ý 5 Nguyen Duy Tam - Ordinal CÁC DẠNG CÂU HỎI PHÂN MỨC (SCALING) 20  Q.“Bạn hãy cho biết mức độ thỏa mãn của bạn đối với các thuộc tính sau đây đối với sản phẩm ĐTDĐ?” Hoàn toàn Hoàn toàn không thỏa mãn thỏa mãn 1 2 3 4 5  Q"Bạn hãy cho biết mức độ quan trọng của các thuộc tính sau đây đối với sản phẩm điện thoại di động?” Hoàn toàn Hoàn toàn quan trọng Không quan trọng 1 2 3 4 5 Thu phát sóng, nhãn hiệu, Kiểu dáng, tính năng phụ,… Nguyen Duy Tam - Ordinal 28-Mar-10 11 CÁC DẠNG CÂU HỎI CHẤM ĐIỂM 21  Q.“Hãy cho điểm các sản phẩm sau từ 1 đến 10 điểm theo mức độ ưa thích của bạn?” Điểm Nhãn hiệu A \____/ Nhãn hiệu B \____/ Nhãn hiệu C \____/ Nhãn hiệu D \____/ Nhãn hiệu E \____/ Nguyen Duy Tam - Ordinal Thoâng thöôøng, ñoái vôùi bieán Ordinal, ta coù theå ñònh daïng thaønh Scale CAÂU HOÛI THUOÄC THANG ÑO SCALE  Anh/chò saün loøng traû bao nhieâu cho moãi thaùng daønh cho caùc dòch vuï ñieän thoaïi?  ……………………………………………………………………………………… Nguyen Duy Tam - 22 28-Mar-10 12 TÓM LẠI: TẠO DATABASE Phân tích biến cần tạo và nhận dạng: 1. Thuộc tính của biến: Norminal, ordinal, Internal 2. Nhận dạng câu hỏi: (một câu trả lời hoặc nhiều câu trả lời) 3. Mã hóa các kí tự: chuyển từ dạng chữ sang số Nguyen Duy Tam - 23 TAÏO FILE VÔÙI CAÙC BIEÁN SAU C1: Anh/chò coù söû duïng ñieän thoaïi di ñoäng khoâng? 1. Coù 2.  Khoâng C2: Giôùi tính cuûa ngöôøi ñöôïc khaûo saùt  Nam  Nöõ C3: Trong nhaõn hieäu nöôùc ngoït coù gaz sau ñaây baïn söû duïng thöôøng xuyeân nhaát nhaõn hieäu naøo? Coca-Cola 1 Pepsi-Cola 2 Sprite 3 7-Up 4 Fanta 5 C4: “Bạn hãy cho biết mức độ thỏa mãn của bạn đối với thuộc tính kiểu dáng đối với sản phẩm ĐTDĐ?” Hoàn toàn 1 2 3 4 5 C5: "Bạn hãy cho biết mức độ quan trọng của thuộc tính nhãn hiệu đối với sản phẩm điện thoại di động?” 1 2 3 4 5 1: raát khoâng thoûa maõn ñeán 5 laø raát thoûa maõn C6: Những khó khăn của anh/chị trong việc dùng DTDĐ. 1. Sóng yếu, 2. Tính năng ít, 3.Phức tạp, 4. Khác (nêu rõ …. ) Nguyen Duy Tam - 24 28-Mar-10 13 Đọc file từ Excel Chuù yù: (1) file excel phaûi coù daïng hoaøn chænh nhö matraän data. (2) file excel chæ coù 1 sheet data 25Nguyen Duy Tam - Đọc file từ Excel Đọc tên biến từ dòng đầu tiên VÙng dữ liệu cần import vào Ok nếu bạn xong 26Nguyen Duy Tam - 28-Mar-10 14 Đọc file từ Excel Hay wé Còn nhiều cách khác nữa 27Nguyen Duy Tam - 2828-Mar-10 Phaân tích döõ lieäu bằng SPSS Nguyen Duy Tam - 28  Thoáng keâ moâ taû (Descriptive Statistics): Söû duïng baûng bieåu, bieåu ñoà – ñoà thò ñeå toùm taéc, dieãn ñaït döõ lieäu nghieân cöùu.  Thoáng keâ suy dieãn (Statistical Inference): Söû duïng caùc thoâng soá cuûa maãu ñeå öôùc löôïng vaø kieåm nghieäm caùc giaû thuyeát veà toång theå.  Kieåm ñònh caùc moái quan heä – töông quan coù yù nghóa giöõa caùc bieán khaûo saùt  Kieåm nghieäm söï khaùc bieät coù yù nghóa giöõa caùc giaù trò trung bình Thöïc hieän nghieân cöùu 28-Mar-10 15 2928-Mar-10 Thoáng keâ moâ taû (Descriptive Statistics)  Thoáng keâ moâ taû cho bieán ñònh tính (thang ño ñònh danh vaø thang ño thöù töï)  Ñoå baûng ñôn (phaân tích moät bieán): Baûng phaân boå taàn suaát (Frequencies)  Ñoå baûng cheùo (Phaân tích hai bieán): Baûng Crosstabs  Ñoái vôùi bieán nhieàu traû lôøi: tröôùc khi ñoå baûng ta phaûi tieán haønh nhoùm caùc bieán chöùa ñöïng caùc giaù trò traû lôøi coù ñöôïc (multiple – responses/define groups) tröôùc khi tieán haønh ñoå baûng (frequencies hoaëc crosstabs) Nguyen Duy Tam - 29 3028-Mar-10 Ñoå baûng ñôn (phaân tích moät bieán) Baûng phaân boå taàn suaát (Frequencies) Nguyen Duy Tam - 30  Choïn coâng cuï Analyze/ descriptive statistics /frequencies databtap5- statistic.SAV 28-Mar-10 16 3128-Mar-10 Ñoå baûng ñôn (phaân tích moät bieán) Baûng phaân boå taàn suaát (Frequencies) Nguyen Duy Tam - 31 Tinh trang hon nhan 525 56.9 56.9 56.9 16 1.7 1.7 58.6 148 16.0 16.0 74.6 29 3.1 3.1 77.8 205 22.2 22.2 100.0 923 100.0 100.0 Da co gia dinh Goa bua Da ly di Da ly than Chua co gia dinh Total Valid Frequency Percent Valid Percent Cumulat iv e Percent Yù nghóa caùc con soá dieãn giaûi keát quaû 3228-Mar-10 Ñoå baûng ñôn (phaân tích moät bieán) Baûng phaân boå taàn suaát (Frequencies) Nguyen Duy Tam - 32 Trinh do hoc van 85 9.2 9.2 9.2 498 54.0 54.0 63.2 70 7.6 7.6 70.7 180 19.5 19.5 90.2 90 9.8 9.8 100.0 923 100.0 100.0 Duoi bat PTTH Pho thong trung hoc Cao dang/t rung hoc chuyen nghiep Dai hoc Tren dai hoc Total Valid Frequency Percent Valid Percent Cumulat ive Percent Thöïc hieän töông töï cho bieán Trình ñoä hoïc vaán 28-Mar-10 17 Thành phần bảng kết quả Nguyen Duy Tam - 33 Vùng hiển thị kết quả, biểu đồ Vùng thông tin kết quá Hiển thị kết quả Gender 3179 49.7 49.7 49.7 3221 50.3 50.3 100.0 6400 100.0 100.0 Female Male Total Valid Frequency Percent Valid Percent Cumulativ e Percent Tần số Tần suất Tần suất hợp lệ Tần suất tích lũy Ý nghĩa của bảng tần số Cách đọc tần số, tần suất 34Nguyen Duy Tam - 28-Mar-10 18 Hiệu chỉnh bảng kết quả Nguyen Duy Tam - 35 Double table Select / format/table looks Copy kết quả sang word • Right click: chọn 1 trong hai option sau: 1. Copy: có thể hiệu chính bảng kết quả được 2. Copy object: không hiệu chỉnh kết quả được Nguyen Duy Tam - 36 28-Mar-10 19 Xuất kết quả sang word/excel  Chọn table export, Right click: chọn export Nguyen Duy Tam - 37 Những gì hiển thị Xuất tất cả trong output Chỉ phần được chọn Chọn *.doc, *.xls, *.ppt,… Tên file 3828-Mar-10 Tinh trang gia dinh 57% 2% 16% 3% 22% Da co gia dinh Goa bua Da ly di Da ly than Chua co gia dinh TAÏO BIEÅU ÑOÀ TRONG FREQUENCIES Nguyen Duy Tam - 38 Analyze/ descriptive statistics /frequencies/CH ARTS Make up for charts 28-Mar-10 20 Thực hành tương tự cho những bài tập sau  Lập những bảng thống kê đơn biến cho trình độ học vấn và các loại nhạc yêu thích (bigband, bluegrass, country, broadway, classial, folk, jazz, opera,…), hãy nhận xét về những kết quả này. Theo bạn, những kết quả đó cho ta biết điều gì đang diễn ra trên thực tế hiện nay. Nguyen Duy Tam - 39 4028-Mar-10 Ñoå baûng cheùo (Phaân tích hai bieán) Baûng Crosstabs Nguyen Duy Tam - 40  Choïn coâng cuï Analyze/Descriptive Statistics/Crosstabs databtap5- statistic.SAV 28-Mar-10 21 4128-Mar-10 Nguyen Duy Tam - 41  Nhaän ñònh: laø baûng phaân tích cheùo theo taàn soá.  YÙ nghóa: taát caû ñeàu choïn soá toång quan saùt (920) laø ñôn vò so saùnh Trinh do hoc van * Gioi tinh nguoi tra loi Crosstabulation Count 49 35 84 225 272 497 33 37 70 88 91 179 55 35 90 450 470 920 Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Trinh do hoc van Total Nam Nu Gioi tinh nguoi tra loi Total Trong soá 920 ngöôøi traû lôøi, coù 225 ngöôøi nöõ coù trình ñoä hoïc vaán laø PTTH 4228-Mar-10 Ñoå baûng cheùo (Phaân tích hai bieán) Baûng Crosstabs Nguyen Duy Tam - 42 Trinh d hoc van * Gioi tinh nguoi tra loi Crosstabulation % within Gioi tinh nguoi tra loi 10.9% 7.4% 9.1% 50.0% 57.9% 54.0% 7.3% 7.9% 7.6% 19.6% 19.4% 19.5% 12.2% 7.4% 9.8% 100.0% 100.0% 100.0% Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Trinh d hoc v an Total Nam Nu Gioi t inh nguoi tra loi Total Ñoå baûng cheùo theo giôùi tính:  theo coät laø 100%, doøng khoâng laø 100%. Chuù yù: Taàn suaát chæ ñöôïc phaân tích khi toång laø 100% 28-Mar-10 22 4328-Mar-10 Nguyen Duy Tam - 43 Trinn do hoc van - gioi tinh 11% 7% 9% 50% 58% 54% 7% 8% 8% 20% 19% 19% 12% 7% 10% 0% 10% 20% 30% 40% 50% 60% 70% Nam Nu Tong cong Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Ñoà thò cuûa baûng cheùo. Choïn Display cluster bar chart 4428-Mar-10 Nguyen Duy Tam - 44 Ñoå baûng cheùo (Phaân tích hai bieán) Baûng Crosstabs Trinh do hoc van * Gioi tinh nguoi tra loi Crosstabulation % within Trinh do hoc van 58.3% 41.7% 100.0% 45.3% 54.7% 100.0% 47.1% 52.9% 100.0% 49.2% 50.8% 100.0% 61.1% 38.9% 100.0% 48.9% 51.1% 100.0% Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Trinh do hoc v an Total Nam Nu Gioi t inh nguoi tra loi Total Baûng cheùo phaân tích theo doøng Nhaän ñònh Caàn choïn bieán phaân tích tröôùc khi phaân tích 28-Mar-10 23 4528-Mar-10 Nguyen Duy Tam - 45 Trinh do hoc van - gioi tinh 58% 45% 47% 49% 61% 49% 42% 55% 53% 51% 39% 51% 0% 10% 20% 30% 40% 50% 60% 70% Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Tong cong Nam Nu Thực haønh: Laäp caùc baûng cheùo theo caùc caëp bieán sau vaø nhaän xeùt cho caùc baûng 1. Trình ñoä hoïc vaán vôùi chuûng toäc 2. Toång thu nhaäp vaø chuûng toäc 3. Toång thu nhaäp theo giôùi tính  Veõ bieåu ñoà cho caùc baûng keát quaû treân vaø make up cho caùc bieåu ñoà naøy Nguyen Duy Tam - 46 databtap5- statistic.SAV 28-Mar-10 24 4728-Mar-10 Nguyen Duy Tam - 47 Thoáng keâ moâ taû (Descriptive Statistics)  Thoáng keâ moâ taû cho bieán ñònh löôïng (thang ño khoaûng vaø thang ño tyû leä)  Ñoå baûng moâ taû moät bieán löôïng Descriptive  Ñoå baûng moâ taû bieán ñònh löôïng (bieán phuï thuoäc) trong moái quan heä vôùi caùc bieán ñònh tính khaùc (bieán ñoäc laäp): ▪ Söû duïng coâng cuï Compare mean/mean… khai baùo bieán ñònh löôïng caàn phaân tích laø bieán phuï thuoäc vaø bieán ñònh tính (phaân nhoùm bieán ñònh löôïng caàn phaân tích) laø bieán ñoäc laäp 4828-Mar-10 Nguyen Duy Tam - 48 Ñoå baûng moâ taû moät bieán ñònh löôïng Descriptive  Choïn coâng cuï Analyze\Descriptive statistics\Descriptives databta p5- statistic. SAV 28-Mar-10 25 4928-Mar-10 Nguyen Duy Tam - 49 Ñoå baûng moâ taû moät bieán ñònh löôïng Descriptive Descriptive Statistics 923 18 60 38.72 10.30 923 Age of Respondent Valid N (listwise) N Minimum Maximum Mean Std. Dev iation Descriptive Statistics 902 1 5 3.98 1.16 902 Heavy Metal Music Valid N (listwise) N Minimum Maximum Mean Std. Dev iation 5028-Mar-10 Nguyen Duy Tam - 50 Ñoå baûng moâ taû nhiều bieán ñònh löôïng Descriptive Descriptive Statistics 910 1 5 2.33 1.06 902 1 5 2.43 .99 905 1 5 2.50 1.06 886 1 5 2.61 1.20 887 1 5 2.77 1.02 867 1 5 3.57 1.09 903 1 5 3.87 1.12 902 1 5 3.98 1.16 815 Co ntry Western Music Blues or R & B Music Jazz Music Classical Music Folk Music Opera Rap Music Heavy Metal Music Valid N (listwise) N Minimum Maximum Mean Std. Deviation 28-Mar-10 26 5128-Mar-10 Nguyen Duy Tam - 51 Muc do ua thich 3.87 3.57 2.50 3.98 2.77 2.33 2.61 2.43 0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50 Rap Music Opera Jazz Music Heavy Metal Music Folk Music Country Western Music Classical Music Blues or R & B Music 5228-Mar-10 Nguyen Duy Tam - 52 Muc do ua thich 3.98 3.87 3.57 2.77 2.61 2.50 2.43 2.33 1 2 3 4 5 Heavy Metal Music Rap Music Opera Folk Music Classical Music Jazz Music Blues or R & B Music Country Western Music Rat thich Rat ghet 28-Mar-10 27 Có thể tính các chỉ tiêu thống kê mô tả thông qua công cụ Frequency  Analyze/descriptive statistic/frequency/[chon bien]/statistics  Chọn các chỉ tiêu cần tìm: 1. Các chỉ tiêu đo lường mức độ tập trung [central tedency] 2. Các chỉ tiêu đo lượng mức độ phân tán [Dispersion] 3. Các phân vị (tứ phân vị, thập phân vị, bách phân vị) [percentile value] VD: Tìm các chỉ tiêu thống kê mô ta cho hai biến age và educ Nguyen Duy Tam - 53 5428-Mar-10 Nguyen Duy Tam - 54 Ñoå baûng moâ taû bieán ñònh löôïng (bieán phuï thuoäc) trong moái quan heä vôùi caùc bieán ñònh tính khaùc (bieán ñoäc laäp)  Choïn coâng cuï Compare Means/Means…. Giaù trò muoán tính trung bình Bieán phaân nhoùm 28-Mar-10 28 5528-Mar-10 Nguyen Duy Tam - 55 Report Mean 3.24 3.64 2.78 3.84 2.62 3.93 2.23 3.90 1.93 4.14 2.61 3.87 Trinh do hoc van Duoi bat PTTH Pho thong trung hoc Cao dang/trung hoc chuyen nghiep Dai hoc Tren dai hoc Total Classical Music Rap Music Ñoå baûng moâ taû nhieu bieán ñònh löôïng Ñoái vôùi bieán nhieàu caâu traû lôøi Multiple Response  VD: Anh chị thường dùng những thuộc tính nào của điện thoại di động: 1. Goïi, lieân laïc 2. Chæ ñeå nghe 3. Ñeå nghe nhaïc …… : …….. k. Games Nguyen Duy Tam - Multiple 56 28-Mar-10 29 5728-Mar-10 Nguyen Duy Tam - 57 Thoáng keâ moâ taû (Descriptive Statistics) Ñoái vôùi bieán nhieàu traû lôøi  Choïn coâng cuï Anlyzes/Multiple Response/Define sets  Choïn coâng cuï Statistics/Multiple Response/Frequencies hoaëc Crosstabs KVKTP CT Nhoùm caâu traû lôøi Baûng taàn soá multiple response Nguyen Duy Tam - Chuyeån bieán caàn phaân tích vaøo 58 28-Mar-10 30 Baûng taàn soá vôùi bieán nhieàu caâu traû lôøi Nguyen Duy Tam - $mucdich Frequencies 11 30.6% 183.3% 25 69.4% 416.7% 36 100.0% 600.0% Khong Co $mucdicha Total N Percent Responses Percent of Cases Groupa. Case Summary 6 100.0% 0 .0% 6 100.0%$mucdicha N Percent N Percent N Percent Valid Missing Total Cases Groupa. ÖÙng duïng: khu vöïc kinh teá phi chính thöùc: Soá kyõ naêng coù ñöôïc Giaûi thích yù nghóa 59 Ñoå baûng cheùo vôùi bieán nhieàu caâu traû lôøi Nguyen Duy Tam - Ñònh nghóa löïa choïn Analyze/multiple response/crosstabs 60 28-Mar-10 31 Ñoå baûng cheùo vôùi bieán nhieàu caâu traû lôøi Nguyen Duy Tam - q3.1sexCH*$nguyennhan Crosstabulation 158 185 343 62 71 133 27 38 65 57 82 139 117 160 277 65 105 170 26 36 62 22 20 42 254 337 591 Khong tim duoc v iec Khong muon le thuoc Noi nghe truy en thon Tan dung v i tri thua Mong muon on dinh ki Goi y cua nguoi than tan dung thoi gian n Khac $nguyennhan Total Count Count Count Nam Nu Gioi t inh chu ho Total Percentages and totals are based on respondents. Groupa. Theo taàn suaát, choïn Option 61 Thoáng keâ moâ taû (Descriptive Statistics) Ñoái vôùi bieán nhieàu traû lôøi  Choïn coâng cuï Multilpe response table Nguyen Duy Tam - Ñònh nghóa bieán nhieàu löïa choïn Taàn suaát Teân baûng 62 28-Mar-10 32 Thoáng keâ moâ taû (Descriptive Statistics) Ñoái vôùi bieán nhieàu traû lôøi Nguyen Duy Tam - Layers 63 Nguyễn Duy Tâm Nguyen Duy Tam - 64 28-Mar-10 33 CÁC PHÉP BiẾN ĐỔI 1. Mã hóa lại (recode) 2. Công cụ tự động mã hóa lại (automatic recode) 3. Lựa chọn quan sát (sellect cases) 4. Công cụ tính toán giữa các biến (Compute) 5. Thay thế giá trị bị thiếu (missing value) Nguyen Duy Tam - 65 Mã hóa lại (recode) Công dụng: xác định giá trị của một biến thành một giá trị mới phù hợp hơn (thường dùng cho biến định lượng, đôi khi vẫn có thể dùng cho biến định tính) 1. Mã hóa trên cùng một biến(Recode into same variables). Mất biến cũ, chỉ còn biến mới. 2. Mã hóa trên cùng một biến(Recode into diffenrent variables). Tạo biến mới, vẫn duy trì biến cũ Nguyen Duy Tam - 66 28-Mar-10 34 Mã hóa trên cùng một biến(Recode into same variables)  Phân nhóm biến mức lương hiện tại của các nhân viên trong trường  thành các nhóm như sau: Nguyen Duy Tam - 67 Universal of florida Muc luong khoi diem 58 5.3 5.3 5.3 759 69.0 69.0 74.3 272 24.7 24.7 99.0 11 1.0 1.0 100.0 1100 100.0 100.0 Duoi 15000 USD Tu 150000 - 30000 USD Tu 30000 - 45000 USD Tren 45000 USD Total Valid Frequency Percent Valid Percent Cumulative Percent Mã hóa trên cùng một biến(Recode into same variables)  Transform/recode/Recode into same variable Nguyen Duy Tam - 68 Chuyển biến cần Mã Hóa Chuyển giá trị cũ thành giá trị mới 28-Mar-10 35 Mã hóa trên cùng một biến(Recode into same variables)  Mã hóa  1: Dưới 1 triệu  2: Từ 1-3 triệu  3: Từ 3 – 5 triệu  4: 5 – 10 triệu  5: 10 – 30 triệu  6: 30 – 50 triệu  7: trên 50 triệu Nguyen Duy Tam - 69 New Value Old value Mã hóa trên cùng một biến(Recode into diffenrent variables)  Transform/recode/recode in to different variable. Nguyen Duy Tam - 70 Biến recode Tên biến mới Mã hóa biến 28-Mar-10 36 Mã hóa có điều kiện  Trong trường hợp tác giả chỉ muốn mã hóa trong trường hợp thỏa điều kiện nào đó. Ví dụ: Mã hóa cho những cơ sở tại thành phố HCM. Nguyen Duy Tam - 71 Mã hóa có điều kiện Mã hóa có điều kiện Nguyen Duy Tam - 72 Không điều kiện Điều kiện 28-Mar-10 37 Công cụ tự động mã hóa lại (automatic recode)  Là phương pháp mã hóa tự động các giá trị dạng chuổi sang dạng số vào trong một biến mới. Biến mới này sẽ chứa các con số nguyên liên tục, mỗi con số nguyên trong biến mới sẽ đại diện cho các giá trị dạng chuổi giống nhau .  Ví dụ: bạn có biến giới tính (male, female), muốn mã hóa lại thành (1: male. 2: female)  BT: Universal of florida Nguyen Duy Tam - 73 Universal of florida Công cụ tự động mã hóa lại (automatic recode)  Transform/Automatic Recode Nguyen Duy Tam - 74 Biến cần mã hóa Tên biến mới 28-Mar-10 38 Lựa chọn các quan sát (Select Cases)  Công cụ Select Cases đưa ra một vài phương pháp cho phép ta lựa chọn ra những nhóm nhỏ các trường hợp quan sát dựa trên tiêu chuẩn hay điều kiện cụ thể. Ta cũng có thể dùng phương pháp này để lựa chọn một mẫu ngẫu nhiên các trường hợp quan sát từ tổng thể dữ liệu. Để thực hiện lệnh lựa chọn các quan sát này ta chọn Data/select cases từ menu ta sẽ có hộp thoại Nguyen Duy Tam - 75 Lựa chọn các quan sát (Select Cases) Nguyen Duy Tam - 76 Không điều kiện Thỏa điều kiện Ngẫu nhiên theo xác xuât Từ quan sát k đến K 28-Mar-10 39 Lựa chọn các quan sát (Select Cases) Nguyen Duy Tam - 77 cụ If conditions are satisfied random sample of cases Base range Công cụ tính toán giữa các biến (Compute)  Công cụ compute được dùng để tính toán giữa các giá trị trong các biến và kết quả sẽ được lưu giữ trong một biến mới hoặc là một biến khác sẳn có hoặc biến chứa đựng giá trị đang tính toán.  Tính mức chênh lệch giữa mức lương khởi điểm và lương hiện tại của các nhân viên Nguyen Duy Tam - 78 Employee data.sav 28-Mar-10 40 Công cụ tính toán giữa các biến (Compute)  Transform/compute  Current salary – beginning salary Nguyen Duy Tam - 79 Lệnh tính toán Tên biến mới Thay thế giá trị bị thiếu (missing value)  Công cụ này giúp ta có thể tự động thay thế các giá trị bị thiếu trong tập dữ liệu.  Transform/replace missing value  Series mean  Mean of nearby point  Median of near by point  Linear interpolation  Linear trend at point. VD: xóa 2 giá trị trong Lương khởi điểm và thay Thế bằng giá trị khác Nguyen Duy Tam - 80 Giá trị cần thay Employee data 28-Mar-10 41 Thoáng keâ suy dieãn  Muïc tieâu: Duøng tham soá maãu ñeå öôùc löôïng caùc tham soá cuûa ñaùm ñoâng  Phöông phaùp: Duøng caùc phöông phaùp kieåm ñònh thoáng keâ ñeå kieåm nghieäm caùc giaû thuyeát veà toång theå Nguyen Duy Tam - 81 Kieåm ñònh trung bình toång theå  Baøi toaùn: Löông khôûi ñieåm. Löông hieän taïi  Coù giaû thieát cho raèng möùc löông hieän taïi cuûa caùc nhaân vieân laø 30000USD (μ 0 ).Theo anh chò, giaû thieát treân ñuùng khoâng?  Giả thiết, chọn α = 5% Nguyen Duy Tam - 82 28-Mar-10 42 Quy trình kieåm ñònh  B1: Ñaët hai giaû thieát H 0 vaø H 1 ▪ H 0 : Giaû thieát ñuùng μ = μ 0 ▪ H 1 : μ μ 0: Giaû thieáùt sai  B2: Tìm möùc yù nghóa cuûa toång theå maãu (.sig)  B3: tìm mieàn baùc boû H 0 (α)  B4: Ra quyeát ñònh H 0 neáu sig > α vaø ngöôïc laïi Nguyen Duy Tam - 83  Xaùc ñònh giaù trò tôùi haïn: 0,5 – 0,025 = 0,475. Tra baûng phaân phoái Z  giaù trò tôùi haïn laø 1,96 (vaø -1,96) Tính Z theo coâng thöùc:  Baùc boû giaû thuyeát Ho neáu Z>1,96 hoaëc Z<-1,96 Vuøng chaáp nhaän giaû thuyeát Ho Vuøng baùc boû Ho 0,025 Vuøng baùc boû Ho 0,025 Z = -1,96 Z =1,96Z = 0 μ = 368 nS x z /   Duøng phaân phoái z kieåm nghieäm giaû thuyeát veà cho giaù trò trung bình toång theå. Nguyen Duy Tam - 84 28-Mar-10 43 Heä soá yù nghóa (P-value hay Significant level) Nguyen Duy Tam - (Ví duï phaân phoá student’s t) Vuøng chaáp nhaän giaû thuyeát Ho Vuøng baùc boû Ho 0,025 - t (α/2,n-1) tα/2,n-1 Giaù trò t tính ñöôïc nhoû hôn ñieåm tôùi haïn Giaù trò t tính ñöôïc lôùn hôn ñieåm tôùi haïn P-value (sig.)>0,025 P-value (sig.) <0,025 Thöïc hieän nghieân cöùu So saùnh P-value vôùi möùc yù nghóa (sai soá choïn maãu)α  baùc boû (p-value α) giaû thuyeát thoáng keâ 85 Kieåm ñònh trung bình toång theå Nguyen Duy Tam - Nhaäp bieán caàn kieåm ñònh (Variable of scale) μ0 86 28-Mar-10 44 Kieåm ñònh trung bình toång theå Nguyen Duy Tam - One-Sample Test 5.622 472 .000 $4,418.446 $2,874.01 $5,962.88Luong hien tai t df Sig. (2-tailed) Mean Dif f erence Lower Upper 95% Conf idence Interv al of the Dif f erence Test Value = 30000 Böôùc hai Sig. < α H1 87 One-Sample Statistics 474 $34,419.57 $17,075.661 $784.311Current Salary N Mean Std. Deviation Std. Error Mean μ0 Kieåm ñònh trung bình hai toång theå  Baøi toaùn: Löông khôûi ñieåm. Löông hieän taïi  Coù giaû thieát cho raèng, möùc löông cuûa nam vaø nöõ trong coâng ty laø nhö nhau. Theo anh chò, ñieàu naøy coù ñuùng?  Giả thiết, chọn α = 5%  Analyzy/compare means/independent sample T test Nguyen Duy Tam - 88 28-Mar-10 45 Kiểm định trung bình hai mẫu độc lập (1 biến định lượng, 1 biến định tính) Biến định lượng Biến phân nhóm (biến định tính) Thay đổi độ tin cậy 89Nguyen Duy Tam - Kieåm ñònh trung bình hai toång theå  Quy trình kieåm ñònh: 1. B1: Kieåm ñònh phöông sai choïn höôùng kieåm ñònh (Levene’s test). 2. B2: Kieåm ñònh giaû thieát của bài toán Nguyen Duy Tam - 90 28-Mar-10 46 Kieåm ñònh trung bình hai toång theå Nguyen Duy Tam - Kieåm ñònh phöông sai PS khoâng ñoåi PS thay ñoåi 91 Kiểm định sự bằng nhau về mức lương hiện tại của thư kí văn phòng và quản đốc, hoặc giữa quản đốc và quản lí Kieåm ñònh hai maãu phụ thuộc Baøi toaùn: Löông khôûi ñieåm. Löông hieän taïi Coù giaû thieát cho raèng möùc löông hieän taïi khoâng khaùc so vôùi möùc löông khôûi ñieåm. Theo anh chò, giaû thieát naøy coù ñuùng? Giả thiết, chọn α = 5% Analyze/compare means/pare sample T test Nguyen Duy Tam - 92 28-Mar-10 47 Kieåm ñònh hai maãu ñoäc laäp Nguyen Duy Tam - Choïn caëp muoán so saùnh (daønh cho bieán ñònh löôïng) 93 Kieåm ñònh hai maãu ñoäc laäp Nguyen Duy Tam - Paired Samples Test $17,409.197 $10,825.353 $497.750 $16,431.116 $18,387.277 34.976 472 .000 Mean Std. Dev iation Std. Error Mean Lower Upper 95% Conf idence Interval of the Dif f erence Paired Dif f erences t df Sig. (2-tailed) Luong hien tai - Luong khoi diem Pair 1 Baøi taäp: soá saûn phaåm loaïi 1 vaø loaïi 2 Tröôùc vaø sau QC 94 28-Mar-10 48 Kieåm ñònh ANOVA  Kieåm ñònh trung bình hai maãu chæ coù theå thöïc hieän cho hai löïa choïn (Ex: giôùi tính). ANOVA coù theå kieåm ñònh cho nhieàu löïa choïn.  Baøi toaùn: Löông khôûi ñieåm. Löông hieän taïi  Anh chò vui loøng cho bieát coù phaûi möùc löông theo ngaønh ngheà trong coâng ty laø nhö nhau? Giả thiết, chọn α = 5%  Analyze/compare means/one way ANOVA Nguyen Duy Tam - 95 Kieåm ñònh ANOVA  Quy trình kieåm ñònh:  B1: Kieåm ñònh phöông sai choïn höôùng kieåm ñònh (Test of Homogeneity of Variances).  B2: Kieåm ñònh giaû thieát Nguyen Duy Tam - 96 28-Mar-10 49 Kieåm ñònh ANOVA Nguyen Duy Tam - 97 Nhaäp bieán caàn kieåm ñònh Biến phân biệt Phát hiện khác biệt. Kiểm định sâu Kieåm ñònh ANOVA  Kiểm định phương sai  Kiểm định ANOVA Nguyen Duy Tam - Test of Homogeneity of Variances Luong hien tai 59.638 2 470 .000 Levene Stat ist ic df 1 df 2 Sig. Test of Homogeneity of Variances Luong hien tai 59.638 2 470 .000 Levene Stat ist ic df 1 df 2 Sig. Chọn H1  Kiểm định sâu 98 28-Mar-10 50 Kieåm ñònh ANOVA Nguyen Duy Tam - Phương sai không đổi Phương sai thay đổi 99 Kieåm ñònh ANOVA Nguyen Duy Tam - Multiple Comparisons Dependent Variable: Luong hien tai -$3,119.994 ********* .124 -$7,099.26 $859.27 -$36158.90* ********* .000 -$38,574.57 -$33,743.23 $3,119.994 ********* .124 -$859.27 $7,099.26 -$33038.91* ********* .000 -$37,451.61 -$28,626.21 *********** ********* .000 $33,743.23 $38,574.57 *********** ********* .000 $28,626.21 $37,451.61 -$3,119.994* $569.106 .000 -$4,503.69 -$1,736.29 -$36158.90* ********* .000 -$41,098.22 -$31,219.59 $3,119.994* $569.106 .000 $1,736.29 $4,503.69 -$33038.91* ********* .000 -$37,982.78 -$28,095.04 *********** ********* .000 $31,219.59 $41,098.22 *********** ********* .000 $28,095.04 $37,982.78 (J) Nganh nghe Cong nhan Quan ly Van phong Quan ly Van phong Cong nhan Cong nhan Quan ly Van phong Quan ly Van phong Cong nhan (I) Nganh nghe Van phong Cong nhan Quan ly Van phong Cong nhan Quan ly LSD Tamhane Mean Dif f erence (I-J) Std. Error Sig. Lower Bound Upper Bound 95% Conf idence Interv al The mean dif f erence is signif icant at the .05 lev el.*. (*)Coù söï khaùc bieät giöõa vaên phoøng vaø coâng nhaân Baøi taäp hieäu quaû baùn haøng 100 28-Mar-10 51 Thoáng keâ suy dieãn  Kieåm nghieäm moái quan heä giöõa hai bieán ñònh tính: kieåm nghieäm moái quan heä giöõa hai bieán trong baûn cheùo. Söû duïng kieåm nghieäm Chi bình phöông  Kieåm nghieäm söï khaùc nhau giöõa hai giaù trò trung bình  Kieåm nghieäm Student’s t cho hai maãu ñoäc laäp (independent samples t test)  Kieåm nghieäm Student’s t cho caëp maãu (paired samples t test)  Phaân tích phöông sai moät yeáu toá (one-way ANOVA) Nguyen Duy Tam - 101 Kieåm nghieäm moái quan heä giöõa hai bieán ñònh tính  Söû duïng phaân phoái chi-bình phöông kieåm nghieäm giaû thuyeát:  H 0 : 2 bieán khaûo saùt ñoäc laäp vôùi nhau  H 1 : Toàn taïi moái quan heä giöõa 2 bieán  Xaùc ñònh giaù trò Chi bình phöông tôùi haïn X2 df, α  Baät töï do df=(soá haøng – soá coät – 1) vôùi möùc yù nghóa α xaùc ñònh  Tính giaù trò Chi bình phöông tính toaùn X2  So saùnh X2 vôùi X2 df, α : Baùc boû H0 khi X 2 < X 2 df, α , hay  Baùc boû giaû thuyeát H 0 neáu p-value (sig.)< α (= 0,05)      r i c j ij ijij E EO X 1 1 2 2 )( Nguyen Duy Tam - 102 28-Mar-10 52 Nguyen Duy Tam - 103 Bao lau doc bao mot lan * Trinh do hoc van Crosstabulation % within Trinh do hoc v n 16.9% 38.7% 47.9% 55.7% 50.9% 41.8% 35.6% 33.4% 25.0% 26.2% 36.8% 31.9% 18.6% 13.5% 14.6% 13.1% 5.3% 13.2% 13.6% 11.4% 12.5% 4.9% 1.8% 9.6% 15.3% 2.9% 5.3% 3.5% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% Moi ngay Vai lan mot tuan Mot lan mot tuan It hon mot lan mot tuan Khong bao gio doc Bao lau doc bao mot lan Total Duoi bat PTTH Pho thong trung hoc Cao dang/t rung hoc chuyen nghiep Dai hoc Tren dai hoc Trinh do hoc v an Total Chi-Square Tests 62.771a 16 .000 63.044 16 .000 29.721 1 .000 627 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Assoc iation N of Valid Cases Value df Asy mp. Sig. (2-sided) 5 cells (20.0%) have expected count less than 5. The minimum expected count is 1.68. a. Kieåm nghieäm moái quan heä giöõa hai bieán ñònh tính P-value< α (0.05). Baùc boû H 0 Thôøi löôïng ñoïc baùo coù quan heä vôùi trình ñoä hoïc vaán Nguyen Duy Tam - 104 Kieåm nghieäm moái quan heä giöõa hai bieán ñònh tính P-value > α (0.05). Chaáp nhaän H 0 Khoâng ñuû cô sôû ñeå keát luaän: Thôøi löôïng ñoïc baùo coù quan heä vôùi tình traïng coâng vieäc Bao lau doc bao mot lan * Tinh trang cong viec Crosstabulation % within Tinh t rang cong v iec 44.5% 36.8% 33.3% 42.8% 31.4% 30.5% 37.0% 31.6% 12.0% 17.9% 18.5% 13.3% 8.7% 10.5% 3.7% 8.8% 3.3% 4.2% 7.4% 3.6% 100.0% 100.0% 100.0% 100.0% Moi ngay Vai lan mot tuan Mot lan mot tuan It hon mot lan mot tuan Khong bao gio doc Bao lau doc bao mot lan Total Lam v iec toan thoi gian Lam v iec ban thoi gian That nghiep Tinh trang cong v iec Total Chi-Square Tests 7.043a 8 .532 6.869 8 .551 2.193 1 .139 580 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Assoc iation N of Valid Cases Value df Asy mp. Sig. (2-sided) 4 cells (26.7%) have expected count less than 5. The minimum expected count is .98. a. 28-Mar-10 53 PHAÂN TÍCH VAØ DIEÃN ÑAÏT DÖÕ LIEÄU NGHIEÂN CÖÙU Nhìn vaøo 2 logo sau, haõy cho bieát yù kieán ñoái vôùi caùc caâu noùi sau. Vôùi möùc ñoä ñoàng yù nhö sau: 1: Hoaøn toaøn khoâng ñoàng yù vaø möùc ñoä ñoàng yù taêng daàn tôùi 5: hoaøn toaøn ñoàng yù Hoaøn toaøn ñoàng yù Ñoàng yù Khoâng ñoàng yù khoâng phaûn ñoái Khoâng ñoàng yù Hoaøn toaøn khoâng ñoàng yù Chaát löôïng cao 5 4 3 2 1 Thieát keá ñeïp 5 4 3 2 1 Ñaùng tin caäy 5 4 3 2 1 Giaù caû hôïp lyù 5 4 3 2 1 Saùng taïo 5 4 3 2 1 Tin xaûo 5 4 3 2 1 Daãn ñaàu 5 4 3 2 1 Nhaõn hieäu toaøn caàu 5 4 3 2 1 Nhaõn hieäu öa thích cuûa toâi 5 4 3 2 1 Nguyen Duy Tam - 105  Kieåm nghieäm giaù trò trung bình cuûa hai maãu ñoäc laäp  Ñoái vôùi kieåm nghieäm naøy chuù yù ñeán keát quaû kieåm nghieäm söï ngang baèng phöông sai cuûa hai maãu (Levene Test). Tuøy theo keát quaû kieåm nghieäm söï ngang baèng phöông sai maø löïa choïn kieåm nghieäm t veà söï ngang baèng giöõa 2 giaù trò trung bình töông öùng. Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 106 28-Mar-10 54  Böôùc 1: Kieåm nghieäm phöông sai ngang baèng (Levene’s test)  Thieát laäp giaû thuyeát ▪ Ho: Phöông sai giöõa 2 maãu ngang baèng nhau ▪ H1: Phöông sai giöõa 2 maãu khoâng ngang baèng nhau  Kieåm nghieäm F ▪ Coâng thöùc tính F: ▪ Neáu p-value (sig.)< α Baùc boû Ho  Löïa choïn kieåm nghieäm t so saùnh trung bình maãu vôùi ñieàu kieän phöông sai khoâng ngang baèng (Equal variances not assumed) ▪ Neáu p-value (sig.)<= α  Chaáp nhaän Ho  Löïa choïn kieåm nghieäm t so saùnh trung bình maãu vôùi ñieàu kieän phöông sai ngang baèng (Equal variances assumed) 2 2 2 1 )1,1( 21 S S F nn  Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 107  Böôùc 2: Kieåm nghieäm söï ngang baèng veà giaù trò trung bình (t – student test)  Thieát laäp giaû thuyeát ▪ H0: Giaù trò trung bình cuûa hai maãu laø baèng nhau ▪ H1: Giaù trò trung bình cuûa hai maãu laø khaùc nhau  Neáu p-value (Sig. – two-tailed) < α/2  Ta baùc boû giaû thuyeát Ho (Kieàm nghieäm 2 nhaùnh – two tailed) Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 108 28-Mar-10 55  Kieåm nghieäm t  Coâng thöùc tính t ▪ Giaû thuyeát phöông sai ngang baèng ñöôïc chaáp nhaän ▪ Vôùi baät töï do df          21 2 21 11 nn S xx t p 2 )1()1( 21 2 22 2 112    nn SnSn S P Nguyen Duy Tam - (n1 + n2 – 2) SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 109  Coâng thöùc tính t  Giaû thuyeát phöông sai ngang baèng khoâng ñöôïc chaáp nhaän  Vôùi baät töï do df            2 2 2 1 2 1 21 n S n S xx t 1 ) ( 1 ) ( )( 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1      n n S n n S n S n S df Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 110 28-Mar-10 56  Ví duï:  Coù söï khaùc bieät hay khoâng giöõa hai khu vöïc nghieân cöùu (Haø Noäi – TP.HCM) trong quan ñieåm cho raèng Sony laø “Saùng taïo” vaø “Thieát keá ñeïp” Group Statistics 200 4.81 .48 3.38E-02 200 4.92 .30 2.10E-02 200 4.66 .61 4.28E-02 200 4.72 .55 3.89E-02 AREA Area Code 12 Ha Noi 13 TP.HCM 12 Ha Noi 13 TP.HCM SONY1 Chat luong cao SONY2 Thiet ke dep N Mean Std. Dev iation Std. Error Mean Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 111 Independent Samples Test 30.940 3.325 .000 .069 -2.766 -1.037 398 398 .006 .300 -.11 -6.00E-02 3.98E-02 5.79E-02 -.19 -.17 -3.18E-02 5.37E-02 -2.766 -1.037 332.890 394.492 .006 .300 -.11 -6.00E-02 3.98E-02 5.79E-02 -.19 -.17 -3.18E-02 5.37E-02 F Sig. Lev ene's Test for Equality of Variances t df Sig. (2-tailed) Mean Dif f erence Std. Error Dif f erence Lower Upper 95% Conf idence Interv al of the D if f erence t-test f or Equality of Means t df Sig. (2-tailed) Mean Dif f erence Std. Error Dif f erence Lower Upper 95% Conf idence Interv al of the D if f erence t-test f or Equality of Means Equal v ariances assumed Equal v ariances not assum d SONY1 Chat luong cao SONY2 Thiet ke dep Nguyen Duy Tam - SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA HAI MAÃU ÑOÄC LAÄP 112 28-Mar-10 57 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA CAËP MAÃU  Khaûo saùt caùc giaù trò khaùc bieät giöõa hai giaù trò trung bình trong hai bieán khaûo saùt trong töøng quan saùt vaø tieán haønh kieåm nghieäm giaù trò trung bình caùc khaùc bieät ñoù coù baèng 0 hay khoâng  Do kieåm nghieäm naøy duøng cho hai bieán (2 maãu) coù moái quan heä vôùi nhau neân trong kieåm nghieäm naøy coù phaàn kieåm nghieäm môùi töông quan giöõa 2 bieán (correlation)  Neáu 2 bieán quan saùt khoâng coù töông quan thì caùc kieåm nghieäm t so saùnh giaù trò trung bình giöõa 2 bieán naøy laø khoâng ñaùng tin caäy Nguyen Duy Tam - 113 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA CAËP MAÃU  Kieåm t cho töøng caëp maãu  Thieát laäp giaû thuyeát ▪ H0: giaù trò trung bình cuûa caùc khaùc bieät baèng 0 ▪ H1: giaù trò trung bình cuûa caùc khaùc bieät khaùc 0  Coâng thöùc tính t  Neáu giaù trò sig (p-value) < α/2 ta baùc boû giaû thuyeát h0 n SD n yx t n I II    1 )( Nguyen Duy Tam - 114 28-Mar-10 58  Kieåm nghieäm so saùnh giaù trò trung bình giöõa hai bieán quan heä (paired samples t –test)  Ví duï:  Lieäu coù söï khaùc bieät veà quan ñieåm cuûa ngöôøi tieâu duøng veà hai nhaõn hieäu sony vaø jvc khoâng (ví duï chæ khaûo saùt thuoäc tính “Chaát löôïng cao” vaø “giaù caû hôïp lyù”) SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA CAËP MAÃU Paired Samples Statistics 4.86 395 .40 2.03E-02 4.30 395 .78 3.91E-02 4.05 395 .93 4.65E-02 3.92 395 .90 4.55E-02 SONY1 Chat luong cao JVC1 Chat luong cao Pair 1 SONY4 Gia ca hop ly JVC4 Gia ca hop ly Pair 2 Mean N Std. Dev iation Std. Error Mean Nguyen Duy Tam - 115 PHAÂN TÍCH VAØ DIEÃN ÑAÏT DÖÕ LIEÄU NGHIEÂN CÖÙU Paired Samples Correlations 395 .183 .000 395 .250 .000 SONY1 Chat luong cao & JVC1 Chat luong cao Pair 1 SONY4 Gia ca hop ly & JVC4 Gia ca hop ly Pair 2 N Correlat ion Sig. Paired Samples Test .56 .81 4.07E-02 .48 .64 13.824 394 .000 .12 1.12 5.63E-02 1.07E-02 .23 2.157 394 .032 SONY1 Chat luong cao - JVC1 Chat luong cao Pair 1 SONY4 Gia ca hop ly - JVC4 Gia ca hop ly Pair 2 Mean Std. Dev iation Std. Error Mean Lower Upper 95% Conf idence Interv al of the Dif f erence Paired Dif f erences t df Sig. (2-tailed) Nguyen Duy Tam - 116 28-Mar-10 59 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA  Phaân tích phöông sai moät yeáu toá (one-way ANOVA)  Phöông phaùp thoáng keâ so saùnh trung bình giöõa nhieàu maãu ñoäc laäp  Kieåm nghieäm naøy döïa treân söï xem xeùt caùc bieán thieân (phöông sai) cuûa caùc giaù trò quan saùt trong noäi boä caùc nhoùm vaø giöõa caùc nhoùm  Bao goàm hai daïng bieán, moät bieán ñöôïc söû duïng nhö bieán yeáu toá (hay bieán ñoäc laäp), bieán naøy seõ phaân caùc bieán khaûo saùt (bieán phuï thuoäc) thaønh nhieáu nhoùm khaùc nhau. Vaø nhieäm vuï cuûa phaân tích phöông sai 1 yeáu toá laø kieåm nghieäm giaû thuyeát (H0) cho raèng caùc giaù trò trung bình giöõa caùc nhoùm laø ngang baèng nhau Nguyen Duy Tam - 117 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA  Kieåm nghieäm ANOVA  Kieåm nghieäm söï ngang baèng giaù trò trung bình cuûa taát caû caùc maãu quan saùt  Thieát laäp giaû thuyeát: ▪ H0: Taát caû caùc giaù trò trung bình cuûa caùc maãu quan saùt ngang baèng nhau ▪ H1: Toàn taïi ít nhaát moät caëp maãu coù giaù trò trung bình khaùc bieät (Tuy nhieân ta seõ khoâng xaùc ñònh ñöôïc laø caëp maãu naøo)  Kieåm nghieäm (Kieåm nghieäm F) ▪ Chaáp nhaän H0 khi Sig. >= α ngöng tieán trình kieåm nghieäm ▪ Baùc boû H0 khi p-value hay Asympt sig. < α Kieåm nghieäm Post hoc (vôùi ñieàu kieän caân baèng veà phöông sai töông öùng) ñeå tìm ra caùc caëp maãu coù giaù trò trung bình khaùc bieät Nguyen Duy Tam - 118 28-Mar-10 60 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA  Kieåm nghieäm phöông sai ngang baèng (Levene’s test)  Neáu baùc boû H0 (phöông sai giöõa caùc maãu khoâng ngang baèng): Löïa choïn kieåm nghieäm Post hoc vôùi ñieàu kieän phöông sai khoâng ngang baèng (Equal variances not assumed)  Neáu chaáp nhaän H0 (phöông sai giöõa caùc maãu ngang baèng): Löïa choïn kieåm nghieäm Post hoc vôùi ñieàu kieän phöông sai ngang baèng (Equal variances assumed) Nguyen Duy Tam - 119 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA  Kieåm nghieäm Posh hoc (kieåm nghieäm t)  Kieåm nghieäm söï khaùc bieät giaù trò trung bình giöõa töøng caëp maãu rieâng bieät  Thieát laäp giaû thuyeát (laàn löôït kieåm nghieäm töøng caëp maãu rieâng bieät vôùi nhau) ▪ H0: Giaù trò trung bình cuûa maãu i baèng giaù trò trung bình maãu j ▪ H1: Giaù trò trung bình cuûa maãu i khaùc giaù trò trung bình maãu j  Kieåm nghieäm (kieåm nghieäm t moät nhaùnh) ▪ Baùc boû H0 khi sig. (p-value ) < α Nguyen Duy Tam - 120 28-Mar-10 61 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA  Ví duï:  YÙ kieán cho raèng Sony laø “Chaát löôïng cao” vaø “Thieát keá ñeïp” coù khaùc bieät hay khoâng ôû nhöõng nhoùm tieâu duøng coù ñoä tuoåi khaùc nhau Report Mean 4.80 4.52 4.84 4.65 4.86 4.73 4.89 4.73 4.93 4.84 4.86 4.69 TUOI TUOI 1 Duoi 20 tuoi 2 Tu 20 - 29 tuoi 3 Tu 30 - 39 tuoi 4 Tu 40 - 49 tuoi 5 Tu 50 tuoi tro len Total SONY1 Chat luong cao SONY2 Thiet ke dep Nguyen Duy Tam - 1: Hoaøn toaøn khoâng ñoàng yù 5: Hoaøn toaøn ñoàng yù 121 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA ANOVA .654 4 .163 1.017 .398 63.506 395 .161 64.160 399 3.991 4 .998 3.042 .017 129.569 395 .328 133.560 399 Between Groups Within Groups Total Between Groups Within Groups Total SONY1 Chat luong cao SONY2 Thiet ke dep Sum of Squares df Mean Square F Sig. Test of Homogeneity of Variances SONY2 Thiet ke dep 8.406 4 395 .000 Lev ene Stat istic df 1 df 2 Sig. Nguyen Duy Tam - 122 28-Mar-10 62 SO SAÙNH GIAÙ TRÒ TRUNG BÌNH GIÖÕA NHIEÀU MAÃU ÑOÄC LAÄP - ANOVA Multiple Comparisons Dependent Variable: SONY2 Thiet ke dep Tamhane -.13 8.92E-02 .920 -.43 .17 -.22 9.28E-02 .303 -.51 7.47E-02 -.21 9.97E-02 .488 -.54 .11 -.32* 9.90E-02 .030 -.63 -1.84E-02 .13 8.92E-02 .920 -.17 .43 -8.79E-02 8.14E-02 .941 -.30 .13 -8.18E-02 8.92E-02 .990 -.34 .18 -.19 8.84E-02 .173 -.42 3.79E-02 .22 9.28E-02 .303 -7.47E-02 .51 8.79E-02 8.14E-02 .941 -.13 .30 6.06E-03 9.28E-02 1.000 -.24 .25 -.10 9.20E-02 .845 -.32 .11 .21 9.97E-02 .488 -.11 .54 8.18E-02 8.92E-02 .990 -.18 .34 -6.06E-03 9.28E-02 1.000 -.25 .24 -.11 9.90E-02 .921 -.37 .15 .32* 9.90E-02 .030 1.84E-02 .63 .19 8.84E-02 .173 -3.79E-02 .42 .10 9.20E-02 .845 -.11 .32 .11 9.90E-02 .921 -.15 .37 (J) TUOI TUOI 2 Tu 20 - 29 tuoi 3 Tu 30 - 39 tuoi 4 Tu 40 - 49 tuoi 5 Tu 50 tuoi t ro len 1 Duoi 20 tuoi 3 Tu 30 - 39 tuoi 4 Tu 40 - 49 tuoi 5 Tu 50 tuoi t ro len 1 Duoi 20 tuoi 2 Tu 20 - 29 tuoi 4 Tu 40 - 49 tuoi 5 Tu 50 tuoi t ro len 1 Duoi 20 tuoi 2 Tu 20 - 29 tuoi 3 Tu 30 - 39 tuoi 5 Tu 50 tuoi t ro len 1 Duoi 20 tuoi 2 Tu 20 - 29 tuoi 3 Tu 30 - 39 tuoi 4 Tu 40 - 49 tuoi (I ) TUOI TUOI 1 Duoi 20 tuoi 2 Tu 20 - 29 tuoi 3 Tu 30 - 39 tuoi 4 Tu 40 - 49 tuoi 5 Tu 50 tuoi t ro len Mean Dif f erence (I -J) Std. Error Sig. Lower Bound Upper Bound 95% Conf idence Interv al The mean dif f erence is s ignif icant at the .05 lev el.*. Nguyen Duy Tam - 123 ÑO LÖÔØNG MOÁI TÖÔNG QUAN GIÖÕA HAI BIEÁN ÑÒNH LÖÔÏNG  Ño löôøng cöôøng ñoä vaø chieàu cuûa moái töông quan giöõa caùc bieán ñònh löôïng  Ño löôøng töông quan laø ño löôøng hai bieán ñoäc laäp ngang baèng nhau (khoâng phaân bieät bieán phuï thuoäc vaø bieán ñoäc laäp)  Ño löôøng moái töông quan tuyeán tính giöõa 1 bieán phuï thuoäc vaø moät (hoaëc nhieàu) bieán ñoäc laäp (Linear Regression) Nguyen Duy Tam - 124 28-Mar-10 63 ÑO LÖÔØNG MOÁI TÖÔNG QUAN GIÖÕA HAI BIEÁN ÑÒNH LÖÔÏNG  Heä soá töông quan (Correlation)  Heä soá töông quan R luoân naèm trong khoaûng (-1,1)  Giaù trò tuyeät ñoái cuûa R caøng lôùn (gaàn baèng 1) hai bieán coù töông quan chaët cheû vôùi nhau  R<0: moái töông quan giöõa hai bieán laø töông quan nghòch  R>0: moái töông quan giöõa hai bieán laø töông quan thuaän  R=0: hai bieán khoâng coù moái lieân heä tuyeán tính Nguyen Duy Tam - 125 ÑO LÖÔØNG MOÁI TÖÔNG QUAN GIÖÕA HAI BIEÁN ÑÒNH LÖÔÏNG  Kieåm nghieäm giaû thuyeát veà moái töông quan  Thieát laäp giaû thuyeát ▪ H0: R=0 (khoâng coù lieân heä giöõa hai bieán) ▪ H1: R0 (coù lieân heä giöõa hai bieán)  Duøng kieåm nghieäm t vaø ta baùc boû giaû thuyeát H0 khi p_value (Asympt. Sig.)< α (kieåm nghieäm hai nhaùnh) hoaëc p_value (Asympt. Sig.)< α/2 (kieåm nghieäm moät nhaùnh) Nguyen Duy Tam - 126 28-Mar-10 64 ÑO LÖÔØNG MOÁI TÖÔNG QUAN GIÖÕA HAI BIEÁN ÑÒNH LÖÔÏNG Correlations 1.000 .446** .287** .203** .220** . .000 .000 .000 .000 400 400 400 400 400 .446** 1.000 .461** .281** .333** .000 . .000 .000 .000 400 400 400 400 400 .287** .461** 1.000 .317** .236** .000 .000 . .000 .000 400 400 400 400 400 .203** .281** .317** 1.000 .226** .000 .000 .000 . .000 400 400 400 400 400 .220** .333** .236** .226** 1.000 .000 .000 .000 .000 . 400 400 400 400 400 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N SONY15 La nhan hieu ua thich cua toi SONY1 Chat luong cao SONY2 Thiet ke dep SONY4 Gia ca hop ly SONY8 Dan dau SONY15 La nhan hieu ua thich cua toi SONY1 Chat luong cao SONY2 Thiet ke dep SONY4 Gia ca hop ly SONY8 Dan dau Correlat ion is signif icant at the 0.01 lev el (2-tailed).**. Nguyen Duy Tam - 127 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Phöông trình hoài qui tuyeán tính döï baùo xu höôùng taêng (hay giaûm) cuûa moät bieán phuï thuoäc trong söï bieán ñoäng (taêng hoaëc giaûm) cuûa nhieàu bieán ñoäc laäp khaùc Phöông trình hoài qui boäi: y ^ = a + b1x1 + b2x2 + … + bkxk Nguyen Duy Tam - 128 28-Mar-10 65 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Heä soá xaùc ñònh (Coefficient of determination): Seõ giuùp ta giaûi ñaùp moät soá caâu hoûi sau :  Moâ hình hoài qui tuyeán tính ñöôïc xaây döïng ñaõ theå hieän moái quan heä giöõa X vaø Y toát nhö theá naøo. Hoaëc bao nhieâu % söï bieán thieân cuûa Y coù theå giaûi thích bôûi söï phuï thuoäc tuyeán tính cuûa Y vaøo X  R bình phöông bieán thieân töø 0 cho tôùi 1 (giaù trò 0 töông öùng söï bieán thieán cuûa Y hoaøn toaøn khoâng do moái quan heä hoài qui tuyeán tính giöõa Y vaø X, giaù trò 1 töông öùng söï bieán thieân cuûa Y hoaøn toaøn laø do moái quan heä hoài qui tuyeán tính giöõa Y vaø X)  R bình phöông caøng lôùn thì moâ hình hoài qui tuyeán tính giöõa Y vaø X caøng thích hôïp vaø hay caùc bieán ñoäc laäp X caøng coù yù nghóa trong vieäc giaûi thích söï bieán thieân cuûa bieán phuï thuoäc Y Nguyen Duy Tam - 129 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Heä soá xaùc ñònh R bình phöông vaø heä soá xaùc ñònh ñieàu chænh Adjusted R bình phöông  Do trong phaân tích hoài qui boäi R bình phöông caøng taêng khi soá bieán ñoäc laäp caøng taêng do ñoù ñoâi khi R bình phöông khoâng theå hieän ñuùng yù nghóa cuûa phöông trình hoài qui tuyeán tính  Söû duïng Adjusted R bình phöông seõ giuùp giaûi quyeát ñöôïc haïn cheá naøy Nguyen Duy Tam - 130 28-Mar-10 66 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Kieåm nghieäm F  Gioáng nhö kieåm nghieäm F söû duïng trong phaân tích ANOVA nhaèm kieåm ñònh giaû thuyeát veà söï toàn taïi moái lieân heä tuyeán tính giöõa caùc bieán X vaø bieán Y  Giaû thuyeát: ▪ H0: β1 = β 2 = … = β k = 0 ▪ H1: Coù ít nhaát moät β i 0  Baùc boû H0 khi Sig (p-value) < α Nguyen Duy Tam - 131 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Kieåm ñònh giaû thuyeát veà heä soá hoài qui (kieåm ñònh t)  Kieåm nghieäm moái quan heä hoài qui tuyeán tính cuûa töøng bieán Xi vôùi Y ▪ H0: Khoâng coù moái quan heä tuyeán tính giöõa Y vaø Xi ▪ Baùc boû H0 khi sig.(p-value) < α  Khaùc vôùi kieåm nghieäm F cho bieát moái quan heä tuyeán tính cuûa taát caû caùc bieán ñoäc laäp vôùi bieán phuï thuoäc. Kieåm nghieäm t cho bieát coù hay khoâng moät moái quan heä hoài qui tuyeán tính giöõa moät bieán ñoäc laäp cuï theå vôùi bieán phuï thuoäc. Nguyen Duy Tam - 132 28-Mar-10 67 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP  Ví duï: Ño löôøng moái quan heä tuyeán tính giöõa:  Bieán ñoäc laäp: YÙ kieán choù raèng “Sony laø nhaõn hieäu öa thích cuûa toâi”  Vôùi caùc bieán phuï thuoäc laø caùc yù kieán cho raèng Sony laø: ▪ “Chaát löôïng cao” ▪ “Thieát keá ñeïp” ▪ “Ñaùng tin caäy” ▪ “Saùng taïo” ▪ “Daãn ñaàu” ▪ “Nhaõn hieäu toaøn caàu” Nguyen Duy Tam - 133 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP Variables Entered/Removeda SONY1 Chat luong cao . Stepwise (Criteria: Probability -of -F-to-enter = .100). SONY3 Dang tin cay . Stepwise (Criteria: Probability -of -F-to-enter = .100). SONY7 Tinh sao . Stepwise (Criteria: Probability -of -F-to-enter = .100). Model 1 2 3 Variables Entered Variables Remov ed Method Dependent Variable: SONY15 La nhan hieu ua thich cua toia. Model Summary .446a .199 .197 .65 .477b .228 .224 .63 .486c .237 .231 .63 Model 1 2 3 R R Square Adjusted R Square Std. Error of the Estimate Predic tors : (Constant), SONY1 Chat luong caoa. Predic tors : (Constant), SONY1 Chat luong cao, SONY3 Dang tin cay b. Predic tors : (Constant), SONY1 Chat luong cao, SONY3 Dang tin cay , SONY7 Tinh sao c. Nguyen Duy Tam - 134 28-Mar-10 68 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP ANOVAd 41.146 1 41.146 98.870 .000a 165.632 398 .416 206.778 399 47.097 2 23.549 58.547 .000b 159.680 397 .402 206.778 399 48.904 3 16.301 40.889 .000c 157.874 396 .399 206.778 399 Regress ion Res idual Total Regress ion Res idual Total Regress ion Res idual Total Model 1 2 3 Sum of Squares df Mean Square F Sig. Predic tors: (Constant ), SONY1 Chat luong caoa. Predic tors: (Constant ), SONY1 Chat luong cao, SONY3 Dang tin cayb. Predic tors: (Constant ), SONY1 Chat luong cao, SONY3 Dang tin cay , SONY7 Tinh sao c. Dependent Variable: SONY15 La nhan hieu ua thich cua toid. Nguyen Duy Tam - 135 ÑO LÖÔØNG MOÁI QUAN HEÄ TUYEÁN TÍNH GIÖÕA BIEÁN PHUÏ THUOÄC VAØ NHIEÀU BIEÁN ÑOÄC LAÄP Coefficientsa .776 .393 1.975 .049 .801 .081 .446 9.943 .000 .540 .391 1.381 .168 .619 .092 .345 6.706 .000 .238 .062 .198 3.847 .000 .448 .392 1.143 .254 .587 .093 .327 6.311 .000 .206 .063 .171 3.247 .001 9.116E-02 .043 .101 2.129 .034 (Constant) SONY1 Chat luong cao (Constant) SONY1 Chat luong cao SONY3 Dang tin cay (Constant) SONY1 Chat luong cao SONY3 Dang tin cay SONY7 Tinh sao Model 1 2 3 B Std. Error Unstandardized Coef f icients Beta Standardi zed Coef f icien ts t Sig. Dependent Variable: SONY15 La nhan hieu ua thich cua toia. Nguyen Duy Tam - Phöông trình hoài qui: “Laø nhaõn hieäu öu thích” = 0,448 + 0,587 “Chaát löôïng cao” + 0,206 “ñaùng tinh caäy” + 0,009 “tinh saûo” 1: Hoaøn toaøn khoâng ñoàng yù 5: Hoaøn toaøn ñoàng yù 136 28-Mar-10 69 TÀI LiỆU THAM KHẢO 1. Phương pháp nghiên cứu trong kinh doanh – Th.S Đào Hoài Nam 2. Xử lí dữ liệu với phần mềm SPSS – Hoàng Trọng – Chu Nguyễn Mộng Ngọc Nguyen Duy Tam - 137

Các file đính kèm theo tài liệu này:

  • pdfphan_tich_du_lieu_voi_phan_mem_spss_0762.pdf
Tài liệu liên quan