Chúng ta thực hiện thao tác trên SPSS như sau:
Analyze -> Compare Means (so sánh trung bình của biến với 3) -> One- Sample T- Test -> Nhập biến C5 vào, thay giá trị Test value bằng 5 (mặc nhiên là 0) -> OK.
Ở màn hình Output sẽ cho kết quả trung bình (mean) là một giá trị cụ thể (con số) tại bảng tóm tắt (one sample Statistics). Tại bảng kết quả kiểm định (One- Sample Test), trên cột cuối (95% Confidence interval of the difference) ta thấy giá trị dưới (lower) và trên (Upper). Kết quả kiểm định như sau:
(Mean + Lower) ≤ μ0 ≤ (Mean + Upper)
Nếu (Mean + Lower) ≥3, ta chấp nhận giả thuyết H0: ĐTDĐ nhãn hiệu NOKIA có chất lượng tốt (với mức ý nghiã α = 5%). Và ngược lại, ta bác bỏ giả thuyết.
320 trang |
Chia sẻ: aloso | Lượt xem: 5100 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Bài giảng Nghiên cứu Marketing - Chương 1: Tổng quan về phương pháp nghiên cứu Marketing, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bạn có tán thành việc không cho học sinh sử dụng xe máy đến trường nhằm làm giảm bớt tai nạn giao thông không? Tránh đặt câu hỏi dựa theo giá trị xã hội đã xác nhận. Ví dụ: ông có kiếm nhiều tiền hơn vợ không? (thông thường sẽ nhận được câu trả lời là “có” vì theo quan niệm xã hội thì chồng phải hơn vợ) Tránh dùng ngôn từ đã có sẵn sự đánh giá thiên kiến. Không nên dùng những từ như : sản phẩm hàng đầu, sản phẩm đại hạ giá,… * Bước 5: Xác định cấu trúc bảng câu hỏi Đó là việc sắp đặt trình tự bảng câu hỏi sao cho hợp lý, tạo hứng thú cho đối tượng nghiên cứu, và có khả năng thu thập được thông tin tốt nhất. Vì vậy: Sắp xếp các câu hỏi theo trình tự hợp lý. Câu hỏi này phải dẫn đến câu hỏi kế tiếp theo một trình tự hợp lý, theo một dòng tư tưởng liên tục. Một vấn đề lớn nên phân ra nhiều vấn đề nhỏ. Trong các câu trả lời lại tiếp tục đặt ra câu hỏi phân nhánh để tiếp tục sàng lọc thông tin. Tuân theo trình tự về tâm lý: Sau khi đã thiết lập mối quan hệ thân thiện tốt đẹp thì mới hỏi các câu hỏi riêng tư. Nên theo trình tự là hỏi cái chung rồi mới đến cái riêng; những câu hỏi ít gây hứng thú nên hỏi cuối cùng, nên theo trình tự để khơi gợi trí nhớ về các sự việc đã qua. * Bước 6: Xác định cấu trúc bảng câu hỏi *Cấu trúc bảng câu hỏi : Thường bao gồm 5 phần : Phần mở đầu: Giải thích lý do, có tác dụng gây thiện cảm để tạo nên sự hợp tác của người trả lời lúc bắt đầu buổi phỏng vấn. Phần gạn lọc (Câu hỏi định tính): Có tác dụng xác định, và gạn lọc đối tượng được phỏng vấn. Phần khởi động (Hâm nóng): Có tác dụng gợi nhớ để tập trung vào chủ đề mà bảng câu hỏi đang hướng tới. Phần chính (Câu hỏi đặc thù): Có tác dụng làm rõ nội dung cần nghiên cứu. Phần kết thúc (Câu hỏi phụ): Có tác dụng thu thập thêm thông tin về đặc điểm nhân khẩu người trả lời (giới tính, tuổi tác, nghề nghiệp,..) * Bước 7: Thiết kế và trình bày bảng câu hỏi Mối quan hệ giữa dạng câu hỏi và thang đo * Bước 7: Thiết kế và trình bày bảng câu hỏi Các bạn cũng cần quan tâm đến việc in ấn trình bày bảng câu hỏi để tạo thiện cảm và lôi cuốn người trả lời tham gia vào cuộc phỏng vấn. Dùng giấy màu có tác dụng kích thích trả lời hơn. In bảng câu hỏi thành tập có tác dụng hấp dẫn hơn so với trang rời. * Bước 8: Điều tra thử để trắc nghiệm bảng câu hỏi Về nguyên tắc, một bảng câu hỏi cần phải được điều tra thử ( điều tra sơ bộ) để đánh giá độ tin cậy của thang đo trước khi nghiên cứu chính thức. Việc điều tra sơ bộ được tiến hành trên một mẫu nhỏ được chọn ra từ tổng thể mẫu cần nghiên cứu, để xem người trả lời có hiểu và trả lời đúng không, để xem người phỏng vấn có làm tốt nhiệm vụ không, để xem thông tin được thu thập như thế nào, và xác định thời gian cho thực hiện phỏng vấn một người. Sau khi điều tra thử sẽ xử lý và phân tích dữ liệu để qua đó chỉnh sửa, loại bỏ, bổ sung thêm câu hỏi. Chúng ta sẽ nghiên cứu kỹ hơn vấn đề này ở chương 7. * Bài tập về nhà 1. Câu hỏi ôn tập: (Xem giáo trình tr.67). SV tự ôn tập ở nhà ; 2. Bài đọc thêm: Tạo bảng câu hỏi bằng công cụ Google document (Hướng dẫn gửi bằng email cho các nhóm) 2. Bài tập về nhà (Thực hiện theo nhóm): Thực hiện lập bảng câu hỏi cho Dự án nghiên cứu ============================ CẢM ƠN CÁC BẠN đã chú ý theo dõi! * * CHƯƠNG 6 PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU MARKETING NGHIÊN CỨU MARKETING * NỘI DUNG CÁC KHÁI NIỆM CƠ BẢN TRONG CHỌN MẪU. QUI TRÌNH CHỌN MẪU. CÁC PHƯƠNG PHÁP CHỌN MẪU. CÁC PHƯƠNG PHÁP XÁC ĐỊNH CỠ MẪU. CHỈ DẪN XÁC ĐỊNH CỠ MẪU THEO TÍNH CHẤT NGHIÊN CỨU Hướng dẫn viết tiểu luận môn học. * Phần tử (element) là đối tượng cần thu thập dữ liệu, phần tử là đơn vị nhỏ nhất của đám đông và là đơn vị cuối cùng của quá trình chọn mẫu. Đám đông (Population) là thị trường mà nhà nghiên cứu tiến hành thực hiện nghiên cứu để thỏa mãn mục tiêu và phạm vi của nghiên cứu. Số lượng phần tử trong đám đông thường được ký hiệu là N (được gọi là kích thước đám đông). Mẫu (Sample) là một tập hợp những phần tử nhỏ được lấy ra từ một tổng thể lớn. Người ta nghiên cứu những mẫu nhỏ để tìm ra những tính chất, những phản ứng đối với những lần thử nghiệm. Để rồi có thể suy diễn ra những kết quả tìm được ỡ mẫu là điển hình của cả một tổng thể mà mẫu là đại diện. Số lượng phần tử của mẫu thường được ký hiệu là n (được gọi là cỡ, hay kích thước mẫu). 1. CÁC KHÁI NIỆM CƠ BẢN * 1.1 Các khái niệm cơ bản Điều tra chọn mẫu có nghĩa là không tiến hành điều tra hết toàn bộ các phần tử của tổng thể, mà chỉ điều tra trên 1 nhóm nhỏ (chọn mẫu) các phần tử thuộc tổng thể nhằm tiết kiệm thời gian, công sức và chi phí. Vấn đề quan trọng nhất là đảm bảo cho mẫu phải có khả năng đại diện được cho tổng thể chung. Đơn vị chọn mẫu (sampling unit). Để thuận tiện trong nhiều kỹ thuật chọn mẫu người ta thường chia đám đông ra thành nhiều nhóm theo những đặc tính nhất định. Những nhóm có được sau khi phân chia đám đông được gọi là đơn vị chọn mẫu. Khung của tổng thể/ chọn mẫu (Sampling frame) là danh sách liệt kê dữ liệu cần thiết của tất cả các đơn vị và phần tử của đám đông để thực hiện việc chọn mẫu. * 1. Các khái niệm cơ bản Đám đông (Population) là thị trường mà nhà nghiên cứu tiến hành thực hiện nghiên cứu để thỏa mãn mục tiêu và phạm vi của nghiên cứu. Ví dụ: Chúng ta cần nghiên cứu người tiêu dùng tại TP.HCM có độ tuổi từ 18-45. Như vậy, tập hợp những người sinh sống tại TP.HCM ở độ tuổi 18-45 là đám đông cần nghiên cứu. Số lượng phần tử trong đám đông thường được ký hiệu là N (được gọi là kích thước đám đông). * Hiệu quả của chọn mẫu Hiệu quả chọn mẫu (Sampling efficiency) được đo lường theo 2 chỉ tiêu là: Hiệu quả thống kê (Statistical efficiency); Hiệu quả kinh tế (Economic efficiency of sampling). Hiệu quả thống kê của một mẫu được đo lường dựa vào độ lệch chuẩn của ước lượng (Xem ước lượng trung bình, tỷ lệ đám đông – Giáo trình Xác xuất thống kê). Một mẫu có hiệu quả thống kê cao hơn mẫu khác khi cùng một cỡ mẫu, nó có độ lệch chuẩn nhỏ hơn. Hiệu quả kinh tế của một mẫu được đo lường dựa vào chi phí thu thập dữ liệu của mẫu với một “độ chính xác” mong muốn nào đó. 2. Qui trình chọn mẫu * 1- Xác định tổng thể / thị trường nghiên cứu Việc xác định tổng thể (đám đông) / thị trường nghiên cứu là vấn đề mang tính tiên quyết trong một nghiên cứu marketing. Nó chính là đối tượng nghiên cứu của một đề tài nghiên cứu. Thông thường, khi lập một dự án nghiên cứu thì nhà nghiên cứu phải xác định ngay tổng thể (đám đông) nghiên cứu và thị trường nghiên cứu trong bước đặt tên cho đề tài nghiên cứu của mình. Ví dụ: Phân tích các yếu tố tác động đến việc lựa chọn (mua) sản phẩm bột giặt OMO của khách hàng trên thị trường TP.HCM. Như vậy, trong bước này ta cần làm rõ “Khách hàng” là ai? Và hãy mô tả về đặc tính của đám động và thị trường nghiên cứu. * 2- Xác định khung tổng thể / Chọn mẫu Các khung chọn mẫu có sẵn, thường được sử dụng là: Các danh bạ điện thoại hay niên giám điện thoại xếp theo tên cá nhân, công ty, doanh nghiệp, cơ quan; các niên giám điện thoại xếp theo tên đường, hay tên quận huyện thành phố; danh sách liên lạc thư tín : hội viên của các câu lạc bộ, hiệp hội, độc giả mua báo dài hạn của các toà soạn báo…; danh sách tên và địa chỉ khách hàng có liên hệ với công ty (thông qua phiếu bảo hành), các khách mời đến dự các cuộc trưng bày và giới thiệu sản phẩm * 3. Lựa chọn phương pháp chọn mẫu Dựa vào mục đích nghiên cứu, đặc điểm của tổng thể nghiên cứu, tầm quan trọng của công trình nghiên cứu, thời gian tiến hành nghiên cứu, kinh phí dành cho nghiên cứu, kỹ năng của nhóm nghiên cứu,… để quyết định chọn phương pháp chọn mẫu xác suất hay phi xác suất; sau đó tiếp tục chọn ra hình thức cụ thể của phương pháp này. * 4- Xác định kích thước/ cỡ mẫu (sample size) Xác định cỡ mẫu thường dựa vào : yêu cầu về độ chính xác, khung chọn mẫu đã có sẵn chưa, phương pháp thu thập dữ liệu, chi phí cho phép. Đối với chọn mẫu theo xác suất: thường có công thức để tính cỡ mẫu; đối với mẫu phi xác suất: thường dựa vào kinh nghiệm và sự am hiểu về vấn đề nghiên cứu để chọn cỡ mẫu. * 5- Xác định các chỉ thị để nhận diện được đơn vị mẫu trong thực tế: Đối với mẫu xác suất: phải xác định rõ cách thức để chọn từng đơn vị trong tổng thể chung vào mẫu sao cho đảm bảo mọi đơn vị đều có khả năng được chọn như nhau. Ghi chú: Kiểm tra quá trình chọn mẫu trên các mặt sau: Kiểm tra đơn vị trong mẫu có đúng đối tượng nghiên cứu không? (vì thường mắc sai lầm ở khâu chọn đối tượng: do thu thập thông tin ở nơi không thích hợp, ở những người không thích hợp, hoặc bỏ qua thông tin của những người lẽ ra phải được phỏng vấn…). Kiểm tra sự cộng tác của người trả lời (hỏi càng dài thì sự từ chối trả lời càng lớn). Kiểm tra tỷ lệ hoàn tất (xem đã thu thập đủ số đơn vị cần thiết trên mẫu chưa): trong phỏng vấn bằng thư có khi thư bị trả lại do không có người nhận, trong phỏng vấn bằng điện thoại có thể không tiếp xúc được với người cần hỏi vì họ không có mặt hay họ không có điện thoại. * 3. CÁC PHƯƠNG PHÁP CHỌN MẪU Chọn mẫu theo xác suất (Probability Sampling) Chọn mẫu phi xác suất (Non- Probability Sampling) Có 2 phương pháp chọn mẫu cơ bản là : * 3.1 Chọn mẫu theo xác suất (probability sampling) Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau. Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể. Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung Tuy nhiên ta khó áp dụng phương pháp này khi không xác định được danh sách cụ thể của tổng thể chung (ví dụ nghiên cứu trên tổng thể tiềm ẩn); tốn kém nhiều thời gian, chi phí, nhân lực cho việc thu thập dữ liệu khi đối tượng phân tán trên nhiều địa bàn cách xa nhau,… 3.1. Chọn mẫu theo xác suất Có 5 dạng chọn mẫu theo xác suất: Chọn mẫu phân tầng Ngẫu nhiên đơn giản Ngẫu nhiên hệ thống Chọn mẫu cả khối Chọn mẫu nhiều giai đoạn * Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu ngẫu nhiên đơn giản (simple random sampling): Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự nào đó : lập theo vần của tên, hoặc theo quy mô, hoặc theo địa chỉ…, sau đó đánh số thứ tự các đơn vị trong danh sách; rồi rút thăm, quay số, dùng bảng số ngẫu nhiên, hoặc dùng máy tính để chọn ra từng đơn vị trong tổng thể chung vào mẫu. Thường vận dụng khi các đơn vị của tổng thể chung không phân bố quá rộng về mặt địa lý, các đơn vị khá đồng đều nhau về đặc điểm đang nghiên cứu. Thường áp dụng trong kiểm tra chất lượng sản phẩm trong các dây chuyền sản xuất hàng loạt. * Chọn mẫu ngẫu nhiên hệ thống (systematic sampling): Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách. Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách ; sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn vị của mẫu. Ví dụ : Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách chọn là : k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu. * Chọn mẫu cả khối (cluster sampling) Trước tiên lập danh sách tổng thể chung theo từng khối (như làng, xã, phường, lượng sản phẩm sản xuất trong 1 khoảng thời gian…). Sau đó, ta chọn ngẫu nhiên một số khối và điều tra tất cả các đơn vị trong khối đã chọn. Thường dùng phương pháp này khi không có sẵn danh sách đầy đủ của các đơn vị trong tổng thể cần nghiên cứu. Ví dụ : Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp để điều tra. * Chọn mẫu phân tầng (stratified sampling) Trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu (như phân tổ các DN theo vùng, theo khu vực, theo loại hình, theo quy mô,…). Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ : Một toà soạn báo muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể căn cứ vào các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền Nam) ; hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu. * Chọn mẫu nhiều giai đoạn (multi-stage sampling) Phương pháp này thường áp dụng đối với tổng thể chung có quy mô quá lớn và địa bàn nghiên cứu quá rộng. Việc chọn mẫu phải trải qua nhiều giai đoạn (nhiều cấp). Trước tiên phân chia tổng thể chung thành các đơn vị cấp I, rồi chọn các đơn vị mẫu cấp I. Tiếp đến phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II…Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu. Ví dụ :Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu phố, mỗi khu phố có 50 hộ. Cách tiến hành như sau : Trước tiên đánh số thứ tự các khu phố từ 1 đến 10, chọn ngẫu nhiên trong đó 5 khu phố. Đánh số thứ tự các hộ trong từng khu phố được chọn. Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ có đủ mẫu cần thiết. * 3.2.Phuơng pháp chọn mẫu phi xác suất (non-probability sampling methods) Chọn mẫu phi ngẫu nhiên (hay chọn mẫu phi xác suất) là phương pháp chọn mẫu mà các đơn vị trong tổng thể chung không có khả năng ngang nhau để được chọn vào mẫu nghiên cứu. Chẳng hạn : Ta tiến hành phỏng vấn các bà nội trợ tới mua hàng tại siêu thị tại một thời điểm nào đó ; như vậy sẽ có rất nhiều bà nội trợ do không tới mua hàng tại thời điểm đó nên sẽ không có khả năng được chọn Việc chọn mẫu phi ngẫu nhiên hoàn toàn phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người nghiên cứu nên kết quả điều tra thường mang tính chủ quan của người nghiên cứu. Mặt khác, ta không thể tính được sai số do chọn mẫu, do đó không thể áp dụng phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho tổng thể chung 3.2 Chọn mẫu phi xác suất 1-Chọn mẫu thuận tiện (convenience sampling) 2-Chọn mẫu phán đoán (judgement sampling): CÁC DẠNG CHỌN MẪU 3-Chọn mẫu định ngạch (quota sampling) * Chọn mẫu thuận tiện Có nghĩa là lấy mẫu dựa trên sự thuận lợi hay dựa trên tính dễ tiếp cận của đối tượng, ở những nơi mà nhân viên điều tra có nhiều khả năng gặp được đối tượng. Chẳng hạn nhân viên điều tra có thể chặn bất cứ người nào mà họ gặp ở trung tâm thương mại, đường phố, cửa hàng,.. để xin thực hiện cuộc phỏng vấn. Nếu người được phỏng vấn không đồng ý thì họ chuyển sang đối tượng khác. Lấy mẫu thuận tiện thường được dùng trong nghiên cứu khám phá, để xác định ý nghĩa thực tiễn của vấn đề nghiên cứu; hoặc để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng; hoặc khi muốn ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất nhiều thời gian và chi phí. * Chọn mẫu phán đoán Là phương pháp mà phỏng vấn viên là người tự đưa ra phán đoán về đối tượng cần chọn vào mẫu. Như vậy tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc điều tra và cả người đi thu thập dữ liệu. Chẳng hạn, nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng vấn. * Chọn mẫu định ngạch Đối với phương pháp chọn mẫu này, trước tiên ta tiến hành phân tổ tổng thể theo một tiêu thức nào đó mà ta đang quan tâm, cũng giống như chọn mẫu ngẫu nhiên phân tầng, tuy nhiên sau đó ta lại dùng phương pháp chọn mẫu thuận tiện hay chọn mẫu phán đoán để chọn các đơn vị trong từng tổ để tiến hành điều tra. Sự phân bổ số đơn vị cần điều tra cho từng tổ được chia hoàn toàn theo kinh nghiệm chủ quan của người nghiên cứu. Chẳng hạn nhà nghiên cứu yêu cầu các vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Nếu áp dụng phương pháp chọn mẫu định ngạch, ta có thể phân tổ theo giới tính và tuổi như sau:chọn 400 người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên. Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc. * 4. XÁC ĐỊNH QUI MÔ (CỠ) MẪU MỨC ĐỘ CHÍNH XÁC CỦA KẾT QUẢ NGHIÊN CỨU CHI PHÍ NGHIÊN CỨU THỜI GIAN NGHIÊN CỨU Cỡ mẫu là kích thước (qui mô) của mẫu được lựa chọn trong đám đông. Cỡ mẫu sẽ ảnh hưởng trực tiếp đến: 2. Qui trình xác định qui mô (cỡ) mẫu * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 1: Xác định sai số e tối đa có thể chấp nhận được. Yếu tố đầu tiên ảnh hưởng đến kích thước mẫu là sai số giữa trị số mẫu và tham số của tổng thể. Vì ta chỉ điều tra một mẫu nhỏ rồi suy ra tổng thể lớn, nên luôn tồn tại một tham số e. Độ lớn của e nằm trong sai số của mục đích ra quyết định. Độ chính xác (ε) = 1- e (%) * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 2: Xác định hệ số tin cậy (1-α). Hệ số tin cậy là xác suất để khoảng tin cậy tính được từ trị số mẫu chứa đựng tham số tổng thể. Nếu chọn hệ số tin cậy =100% thì ta phải điều tra toàn bộ tổng thể. Vì vậy, để tiết kiệm chi phí điều tra trong thực tiễn hệ số tin cậy thường được lựa chọn là: 90%; 95%; 99%. * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 3: Xác định hệ số Z. Z Là biến số chuẩn tương ứng với độ tin cậy: Với hệ số tin cậy 90% -> Z= 1,65; hệ số tin cậy 95% -> Z= 1,96; hệ số tin cậy 99% -> Z= 2,58. Lưu ý: Z chính là tα (tra bảng 2)- Xem giáo trình Xác suất thống kê. * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 4: Ước lượng độ lệch chuẩn (σ) của tổng thể Nếu X có phân phối chuẩn, và: 68,27% phần tử nằm trong khoảng trung bình thì σ= +/- 1; 95,45% -> σ = +/- 2; 99,73% -> σ = +/- 3 -3 -2 -1 0 1 2 3 σ * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 5: Sử dụng công thức thống kê thích ứng; Và tính toán cỡ mẫu thích hợp. Ta có trường hợp tính số tỷ lệ và số trung bình: 5.1 Trường hợp tính số tỷ lệ: Ở đây lại phân thành 2 trường hợp: Trường hợp không tính đến qui mô của tổng thể. Ta áp dụng công thức để xác định cỡ mẫu: n = p.q [Z/ e] Với : - n: Qui mô (cỡ) mẫu nghiên cứu; - p: Xác suất xuất hiện dấu hiệu của phần tử đang nghiên cứu. Và q = 1 – p; Trường hợp có tính đến qui mô của tổng thể. Ta áp dụng công thức để xác định cỡ mẫu: n = (N.Z2 p.q)/[N.e2 + Z2. p.q] Với N là qui mô mẫu tổng thể. * GIẢI THÍCH QUI TRÌNH TỔNG QUÁT Bước 5: Sử dụng công thức thống kê thích ứng; Và tính toán cỡ mẫu thích hợp. Ta có trường hợp tính số tỷ lệ và số trung bình: 5.2 Trường hợp tính số trung bình. Ta cũng phân thành 2 trường hợp Trường hợp không tính đến qui mô mẫu của tổng thể. Ta áp dụng công thức để xác định cỡ mẫu: n = (Z.μx)/ e Trường hợp có tính đến qui mô mẫu của tổng thể. Ta áp dụng công thức xác định cỡ mẫu: n = [N.Z2.S]/[N.e2 + Z2.S2] * 4.2 Xác định cỡ mẫu trong phương pháp chọn mẫu phi xác suất Trong phương pháp chọn mẫu phi xác suất, việc xác định cỡ mẫu được các nhà nghiên cứu chọn (cỡ mẫu) theo kinh nghiệm nghiên cứu, trong thực tế cỡ mẫu thường được chọn là: n = Số lượng biến quan sát x số lượng thang đo (5). * 5. Chỉ dẫn xác định cỡ mẫu theo tính chất nghiên cứu Để xác định cỡ mẫu trong phương pháp chọn mẫu theo xác suất ta phải xác định trước các chỉ tiêu:(1) Độ chính xác ε (%); (2) Độ tin cậy (1-α). Nếu ε =0% ( Chính xác 100%), và Độ tin cậy (1-α =1), tức là tin cậy 100% thì chúng ta phải điều tra tòan bộ đám đông (đây là điều không thể). Do đó, ta phải chấp nhận đánh đổi mức độ chính xác của kết quả nghiên cứu (ở một mức độ nào đó) để có thể nhận được việc điều tra trên một cỡ mẫu hữu hạn có thể chấp nhận được nhằm tiết kiệm thời gian và chi phí. * 5.1 Vận dụng bài tóan ước lượng khỏang cho tỷ lệ đám đông để xác định cỡ mẫu trong các biến định tính Ta chọn 1 mẫu điều tra sơ bộ (n0 ≥ 30) từ đám đông có phân phối chuẩn. Mẫu này dùng để ước lượng tỷ lệ của đám đông ở mức tin cậy (1-α ). Ta tiến hành tính tóan các đặc trưng của mẫu sơ bộ: Tỷ lệ mẫu (f =m/n); và phương sai mẫu hiệu chỉnh (s2). Mức tin cậy (1- α) → (1-α)/2 → tα/2 (Tra bảng 4) Cỡ mẫu n được xác định là: n = [(f(1-f).(tα/2 /ε)2)] + 1 Và ta phải điều tra thêm m mẫu nữa với: m = n - n0 ( Nếu m > 0) * 5.2 Vận dụng bài tóan ước lượng khỏang cho trung bình đám đông để xác định cỡ mẫu trong các biến định lượng Ta chọn 1 mẫu điều tra sơ bộ (n0 ≥ 30) từ đám đông có phân phối chuẩn. Mẫu này dùng để ước lượng trung bình của đám đông ở mức tin cậy (1-α ). Ta tiến hành tính tóan các đặc trưng của mẫu sơ bộ: Trung bình mẫu (X); và phương sai mẫu hiệu chỉnh (s2). Mức tin cậy (1- α) → (1-α)/2 → tα/2 (Tra bảng 4) Cỡ mẫu n được xác định là: n = (tα/22. S2)/ ε2 Và ta phải điều tra thêm m mẫu nữa với: m = n - n0 ( Nếu m > 0) * Lưu ý ! Các bạn lưu ý rằng cỡ mẫu trên được xác định tương ứng với một thuộc tính, khái niệm (biến số) nào đó của mẫu mà ta quan tâm quan sát tìm hiểu. Vấn đề là ở chỗ là trong nghiên cứu marketing thường thì chúng ta phải quan sát nhiều biến số trong một nghiên cứu, để xác định cỡ mẫu đủ để đảm bảo độ chính các và tin cậy thì chúng ta lần lượt phải thực hiện các phép tóan xác định cỡ mẫu trên với từng biến số sau đó chọn n lớn nhất. Lẽ dĩ nhiên chúng cũng làm tiêu tốn nhiều công sức của các bạn. Liệu có giải pháp nào khả thi hơn không? SPSS hay phần mềm nào có thể giúp ta trong trường hợp này không? * 6. Hướng dẫn viết TLMH 1. Các bạn hãy tiến hành điều tra sơ bộ với cỡ mẫu n0 = 30 và tính toán xác định cỡ mẫu cho Dự án nghiên cứu của nhóm mình. 2. Các nhóm lưu ý hoàn tất các bước của dự án nghiên cứu để tuấn tới thực hiện xử lý dữ liệu nghiên cứu trên SPSS theo hướng dẫn của giảng viên- Nhớ mang theo máy Laptop. XIN CẢM ƠN CÁC BẠN! * * CHƯƠNG 7 XỬ LÝ DỮ LIỆU- ỨNG DỤNG PHẦN MỀM SPSS NGHIÊN CỨU MARKETING * NỘI DUNG XỬ LÝ DỮ LIỆU Các phương pháp xử lý dữ liệu; Các giai đoạn xử lý dữ liệu. ỨNG DỤNG PHẦN MỀM SPSS Giới thiệu phần mềm SPSS; Chuẩn bị dữ liệu; Định biến và nhập dữ liệu; Các phép biến đổi và thao tác trên tập dữ liệu. * A. XỬ LÝ DỮ LIỆU TRONG NC MAR Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa” những ghi chép quan sát hoặc các câu trả lời dưới dạng “thô” thành các con số thống kê theo một trật tự nhất định để chuẩn bị cho việc phân tích và diễn giải các kết quả nghiên cứu thu được. * 1. Các phương pháp xử lý dữ liệu Xử lý thủ công Xử lý với trợ giúp của máy tính Có 2 phương pháp xử lý dữ liệu cơ bản là : * 2. Các giai đoạn xử lý dữ liệu Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ Giai đọan này gổm 3 bước: Kiểm tra và hiệu chỉnh dữ liệu; Định biến dữ liệu; Mã hóa dữ liệu. Giai đọan này cũng gồm 3 bước: Nhập dữ liệu vào máy tính; Làm sạch dữ liệu; Lưu trữ dữ liệu. * 2.1.1 Kiểm tra và hiệu chỉnh dữ liệu Đây là bước kiểm tra chất lượng thông tin trong bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết kế ban đầu. Người kiểm tra phải bảo đảm tính toàn vẹn và tính chính xác của từng bảng câu hỏi. Thông thường ở bước này các nhà nghiên cứu sẽ tiến hành kiểm tra các đặc tính cơ bản của bảng câu hỏi. Cụ thể: Tính lôgíc của các câu trả lời; Tính đầy đủ của một câu trả lời và của một bảng câu hỏi; Tính hợp lý và xác thực của các câu trả lời. * 2.1.1 Kiểm tra và hiệu chỉnh dữ liệu Quá trình kiểm tra, rà soát lại bảng câu hỏi là nhằm mục đích kiểm tra, phát hiện, sửa chữa và thông báo kịp thời cho người thu thập dữ liệu để tránh những sai sót tương tự. Để xử lý các sai sót phát hiện được qua kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai sót. Cụ thể: Trả về cho bộ phận thu thập dữ liệu nhằm làm sáng tỏ vấn đề; Suy luận từ các câu trả lời khác; Loại bỏ bảng câu hỏi. * 2.1.2 Định biến dữ liệu Biến nghiên cứu là tập hợp các khái niệm có ý nghiã mô tả (định tính, định lượng ) cho mục tiêu nghiên cứu, được thể hiện bằng các ký hiệu (mã hoá) theo một qui ước nào đó. Biến nghiên cứu được thể hiện và là một bộ phận không thể thiếu trong mô hình nghiên cứu. Biến nghiên cứu có thể được phân loại theo kiểu dữ liệu (dạng thang đo). Biến định tính là biến chứa các giá trị quan sát ở dạng thang đo biểu danh và thang đo xếp hạng theo bậc. Biến định lượng là biến chứa các giá trị quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Trong bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một mục đích quan sát nào đó. Do vậy, thường mỗi một câu hỏi tương ứng với ít nhất một biến quan sát. * Thí dụ về biến nghiên cứu Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn. Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính cấu thành kết luận chất lượng sản phẩm tốt của mì ăn liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao; … Và các yếu tố còn lại cũng có các thuộc tính xác định chúng. * Thí dụ về biến nghiên cứu Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến số trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì ăn liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các biến số cấp 2 ( Xem mô hình nghiên cứu). Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua Vinamilk? -> Ta có thể định biến nghiên cứu là: c3: Sở thích của khách hàng đối với sữa chua Vinamilk. * 2.1.3 Mã hoá dữ liệu Mã hoá dữ liệu (Coding) là quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử lý dữ liệu. Mục đích của việc mã hoá là tạo nhãn (labels) cho các câu trả lời, thường là bằng các con số, hay ký hiệu. Một trả lời khi mã hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo). Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua Vinamilk? Code: 1 2 3 4 5 Rất ghét Ghét Tạm được Thích Rất thích * 2.1.3 Mã hoá dữ liệu Mã hoá còn giúp giảm thiểu các câu trả lời bằng cách nhóm các câu trả lời vào 1 nhóm có cùng ý nghiã. Mã hoá dữ liệu làm cơ sở cho việc thống kê phân tích dữ liệu. Tiến trình mã hoá có thể được tiến hành bằng việc lập Sổ mã hoá dữ liệu như sau: Xác định loại câu trả lời cho những câu hỏi tương ứng. Những câu trả lời này có thể thu thập từ một mẫu các bảng câu hỏi đã hoàn tất; Xây dựng một danh mục liệt kê các câu trả lời; Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giá trị (thường là một con số cụ thể). * Hình 7.1: Sổ mã hoá dữ liệu 2.2 Nhập dữ liệu và lưu trữ 2.2.1- Nhập dữ liệu vào máy tính (Inputing data into computer) 2.2.2- Làm sạch dữ liệu (Data cleaning) CÁC BƯỚC CÔNG ViỆC 2.2.3- Lưu trữ dữ liệu (Data saving) * 2.2.1 Nhập dữ liệu vào máy tính Bảng câu hỏi sau khi phỏng vấn, hiệu chỉnh và mã hoá dữ liệu thì công việc tiếp theo là nhập dữ liệu vào máy. Dữ liệu sau khi nhập xong ở dạng một ma trận được gọi là Ma trận dữ liệu (data matrix). Các phần mềm xử lý dữ liệu trong thống kê đều cần dữ liệu ở dạng ma trận. * 2.2.2 Làm sạch dữ liệu 1- Ô trống (Missing data) 2- Trả lời không hợp lý (Roque value) Có 2 sai sót thường gặp trong nhập dữ liệu là : * 2.2.2 Làm sạch dữ liệu Các ô trống là các ô của ma trận không chứa đựng dữ liệu trả lời. Nguyên nhân của sai sót là do thu thập dữ liệu bị sót, hoặc nhập dữ liệu sai. Để phát hiện ô trống ta có thể dùng phép đếm (count) theo các biến, vì số ô theo các biến sẽ phải có số lượng đúng bằng cỡ mẫu. Khi phát hiện sai sót phải chỉnh sửa lại. Trả lời không hợp lý là các trả lời có dữ liệu không nằm trong thang đo đã thiết kế. Ví dụ: thang đo có 5 bậc (từ 1-5), nhưng lại có dự liệu là 7, hoặc 33 là những dữ liệu không hợp lý. Để phát hiện các trả lời không hợp lý ta chỉ cần tính tần số theo cột (biến). Loại sai sót này chủ yếu do nhập liệu (do gõ sai). 2.2.3 Lưu trữ dữ liệu: Dưới dạng văn bản hoặc files. Dữ liệu sau khi được lưu giữ ở dạng ma trận dữ liệu, công việc tiếp theo là tóm tắt chúng để chuẩn bị cho các phương pháp phân tích tiếp theo. Dữ liệu thường được tóm tắt ở 3 dạng: * 3. TÓM TẮT DỮ LIỆU Dạng thống kê Dạng đồ thị Dạng bảng, biểu * 3.1 Tóm tắt dạng thống kê 1- Đo lường mức độ tập trung (Measure of centrality) 2- Đo lường mức độ phân tán (Measure of dispersion) Gồm có: Trung bình (mean); Trung vị ( Median); Mode. Gồm có: Phương sai (Variance); Độ lệch chuẩn (Standard Deviation); Khoảng biến thiên (Range) * 3.1 Tóm tắt thống kê 3.1.1 Đo lường mức độ tập trung Ba đại lượng thường sử dụng trong đo lường mức độ tập trung của các quan sát có công thức tính như sau: Trung bình của biến Xi ( i= 1,2,3… n) của mẫu: X = (1/n ). Σni=1Xi Trung vị là giá trị nằm giữa của thang đo. Mode là giá trị có tần số xuất hiện lớn nhất của một tập hợp các số đo. * 3.1 Tóm tắt thống kê 3.1.2 Đo lường mức độ phân tán Phương sai (S2) đo lường mức độ phân tán của một tập số đo xung quanh trung bình của nó. công thức tính như sau: S2 = [1/(n-1)]. Σni=1(Xi – X)2 Căn bậc 2 của phương sai được gọi là độ lệch chuẩn (SD), SD = S2 Khoảng biến thiên là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của một tập số đo. * 3.2 Tóm tắt dạng bảng 1- Bảng đơn (Simple one-way Tabulation) 2- Bảng chéo (Cross- Tabulation) Hai dạng bảng thường dùng trong nghiên cứu thị trường là: * Bảng đơn (mẫu) C3: Sở thích của khách hàng đối với sữa chua Vinamilk. * Bảng chéo (mẫu) C7: Sở thích về sữa chua Vinamilk theo giới tính. 3.3 Tóm tắt dạng đồ thị Có 4 dạng đồ thị thường dùng là: Scatter graph Bar chart Pie chart Line graph * 3.3 Tóm tắt dạng đồ thị Đồ thị thanh thường được sử dụng cho các câu hỏi cho nhiều trả lời để biểu diễn tần số - tổng của nó lớn hơn kích thước mẫu ( tần số tuyệt đối) hay lớn hơn 100% tần số tương đối. * 3.3 Tóm tắt dạng đồ thị Đồ thị bánh thường được sử dụng cho các câu hỏi đơn trả lời để biểu diễn tần số tương đối – Tổng của nó bằng 100%. * 3.3 Tóm tắt dạng đồ thị Đồ thị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến. Để chọn phương pháp phân tích dữ liệu phù hợp, nhà nghiên cứu cần chú ý một số vấn đề có ý nghiã quan trọng sau: * 4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU 1- Thang đo 4- Số biến cần phân tích 2- Phân bố của dữ liệu 3- Phương pháp chọn mẫu 5- Mối quan hệ giữa các biến * 4.1 Thang đo Có các cách phân tích thích hợp đối với mỗi loại thang đo: Thang đo định danh chỉ cho chúng ta tính: tần số; kiểm định tần số (Chi- bình phương). Thang đo xếp hạng theo thứ tự cho phép chúng ta tính: tần số; trung vị; kiểm định tần số; Kolmogorov – Smirnov; Wilcoxon. Thang đo khoảng và thang đo tỷ lệ cho phép chúng ta thực hiện các phân tích nêu trên. Bên cạnh đó còn cho phép ta tính: giá trị trung bình; Các phép kiểm định Z, t. * 4.2 Phân bố của dữ liệu Tuỳ theo sự phân bố của dữ liệu ở các dạng chúng ta có phương pháp phân tích tương thích: Phân bố tham số (Parametric) : => dùng phép kiểm định Z,t; Phân bố phi tham số (Non- Parametric): => dùng phép kiểm định tần số; Wilcoxon. * 4.3 Phương pháp chọn mẫu 1- Chọn mẫu theo xác suất 2- Chọn mẫu phi xác suất Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể. Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung Việc chọn mẫu phi ngẫu nhiên hoàn toàn phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người nghiên cứu nên kết quả điều tra thường mang tính chủ quan của người nghiên cứu. Mặt khác, ta không thể tính được sai số do chọn mẫu, do đó không thể áp dụng phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho tổng thể chung * 4.4 Số biến cần phân tích Các nhà nghiên cứu thường căn cứ vào số lượng biến số cần phân tích để phân loại các phương pháp phân tích dữ liệu: Khi số biến được phân tích là 1 thì được gọi là phương pháp phân tích đơn biến (Univariate data analysic); Khi số biến được phân tích là 2 thì gọi là phương pháp phân tích nhị biến (Bivariate data analysic); Khi có nhiều biến để phân tích thì các phương pháp phân tích đó gọi là phương pháp phân tích đa biến (Multivariate data analysic). * 4.5 Mối quan hệ giữa các biến 1- Phân tích phụ thuộc 2- Phân tích phụ thuộc lẫn nhau Xét về mối liên hệ giữa các biến, chúng ta có hai nhóm phân tích chính: * 4.5.1 Phân tích phụ thuộc Khi các biến phân tích được chia thành hai nhóm: Bíên độc lập – biến phụ thuộc thí phương pháp phân tích là phân tích phụ thuộc. Các phương pháp phổ biến trong nhóm này có thể kể như: Phân tích hồi qui đa biến (Multiple regression analysis); Phân tích phân biệt (Discriminant analysis); Phân tích phương sai đa biến (Multivariate analysis of variance). * 4.5.2 Phân tích phụ thuộc lẫn nhau Trong trường hợp không có biến độc lập và biến phụ thuộc mà các biến này phụ thuộc lẫn nhau thì phương pháp phân tích là phân tích phụ thuộc lẫn nhau. Các phương pháp thường dùng trong nhóm này như: Phân tích yếu tố khám phá (Exploratory factor analysis); Phân tích nhóm đồng nhất (Cluster analysis); Phân tích đa hướng (Multidimensional Scaling);… B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU * 1. Giới thiệu phần mềm SPSS SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968. Thế hệ mới nhất là thế hệ (Verison) 18.0 được giới thiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và Linux / UNIX. Trong phạm vi môn học này, chúng ta thống nhất sử dụng SPSS 15.0 cho việc xử lý dữ liệu. Phần mềm SPSS có tất cả 3 dạng màn hình: * 1. Giới thiệu phần mềm SPSS Màn hình hiển thị dữ liệu (Data view) Màn hình hiển thị kết quả (Output) Màn hình hiển thị biến (Variables view) * 1. Giới thiệu phần mềm SPSS Màn hình quản lý dữ liệu (Data view): là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu (data) bao gồm: Cột (Colum)- Đại diện cho biến quan sát, mỗi cột chứa đựng các dữ liệu (n dữ liệu); Hàng (Row)- Đại diện cho 1 phần tử được quan sát, mỗi hàng chức đựng tất cả các câu trả lời (dữ liệu) của một đối tượng nghiên cứu; và ô (Cell)- Chứa đựng một kết quả trả lời tương ứng với một câu hỏi khảo sát (biến) và một phần tử. * 1. Giới thiệu phần mềm SPSS Màn hình quản lý biến (Variable view): Là nơi quản lý các biến (Variable) và các thông số đặc tính của biến. Trong màn hình này mỗi dòng quản lý một biến, và mỗi cột thể hiện một thông số đặc tính của biến. Cụ thể như sau: * 1. Giới thiệu phần mềm SPSS - Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển thị trên đầu mỗi cột trong màn hình quản lý dữ liệu. - Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang số- Numeric (mặc định); Dạng chuỗi – String; Dạng ngày tháng – Date; Dạng đơn vị tiền tệ - Currency;… - Chiều rộng cột (Width): Chỉ số lượng ký tự được hiển thị; - Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu phẩy được hiển thị; - Nhãn của biến (Label): Nêu rõ hơn về ý nghĩa của biến số; - Giá trị trong biến (Values): Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể; - Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích. Để lọai bỏ biến này ta cần khai báo nó như là giá trị khuyết để lọai bỏ giá trị này ra khỏi các phân tích thống kê. - Dạng thang đo (Measures): Hiển thị dạng thang đo của giá trị trong biến. * 1. Giới thiệu phần mềm SPSS Màn hình hiển thị kết quả (output): Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm định. Các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (.SPO). Màn hình này cho phép ta xem và lưu giữ kết quả phân tích. * 2. Định biến và nhập dữ liệu trên SPSS 2.1 Định biến trên SPSS Định biến trong màn hình quản lý biến (Variables view) thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình định biến như sau: 1. Đặt tên biến (Name); 2. Định dạng biến (Type); 3. Xác định số lượng con số hiển thị cho giá trị biến (Width) và số lượng con số lẻ hiển thị (Decimals); 4. Gán nhãn cho biến (Variable Label); 5. Định tên cho các giá trị trong biến (Value labels); 6. Định nghiã các giá trị khuyết (Missing values); 7. Định kích thước cột (Column format); 8. Định vị trí hiển thị giá trị (Align); 9. Định dạng thang đo (Measurement) * 2. Định biến và nhập dữ liệu trên SPSS 2.2 Nhập dữ liệu trên SPSS Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data view). Màn hình này thể hiện ra một ma trận dữ liệu gồm: Cột; hàng; và ô. Với các cột lần lượt tương ứng với các biến, các dòng tương ứng với mỗi phần tử. Ta cũng có thể nhập dữ liệu từ các phần mềm khác như Excel, Fox sau đó chuyển vào SPSS bằng lệnh Copy. 3. Các phép biến đổi và thao tác trên tập dữ liệu Có 5 phép biến đổi trên tập dữ liệu thường sử dụng là: Tách tập dữ liệu Mã hoá lại Làm sạch Và tóm tắt dữ liệu Đánh giá độ tin cậy của thang đo Hợp nhất tập dữ liệu * 3.1 Mã hoá lại 1- Mã hoá lại trên cùng 1 biến (Recode into same variable) 2- Mã hoá vào biến khác (Recode into difference Variable) Mã hoá lại (Recode) là công cụ biến đổi các giá trị (đã mã hoá) thành các mã hoá mới phù hợp với đòi hỏi của việc phân tích dữ liệu. SPSS cung cấp cho ta 2 loại mã hoá lại là: * 3.1 Mã hoá lại Mã hoá lại trên cùng một biến thì các giá trị được mã hoá lại sẽ thay thế cho các giá trị cũ (các giá trị này sẽ mất đi), cần chú ý rằng các giá trị vừa được mã hoá lại chưa có nhãn, do đó sau khi recode ta phải khi báo lại nhãn cho giá trị. Qui trình này được thực hiện qua các bước sau: Transform/ Recode/ Recode into same variables ta sẽ có hộp thoại (7.4); Chọn và chuyển các biến cần mã hoá lại sang hộp thoại variables, nhấn Old and new value để chuyển các giá trị cũ thành các giá trị mới. Old value dùng để khai báo các giá trị cũ cần chuyển đổi, New value dùng để khai báo giá trị mới sẽ thay thế cho giá trị cũ. Add để lưu giữ sự chuyển đổi này. * 3.1 Mã hoá lại Mã hoá lại vào biến khác thì các giá trị hiện tại của một biến trở thành giá trị mới trong một biến khác. Qui trình này thực hiện như sau: Transform/ Recode into different variables ta sẽ có hộp thoại (7.7); Chọn và chuyển các biến cần mã hoá lại vào hộp thoại variables, khai báo tên biến mới và nhãn biến mới trong hộp thoại Output variable. Nhấn Change để xác nhận khai báo này. * 3.2 Làm sạch và tóm tắt dữ liệu với SPSS Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện tính tần số với thao tác đơn giản: Analyze/ Descriptive statistics/ Frequencies. Ta có hộp thoại tóm tắt tần số, ta cần chọn và đưa các biến cần tính vào ô variables. Nhấn OK ta sẽ có bảng tóm tắt tần số. Các bạn chú ý phần Missing (lỗi) nếu có thì phải hiệu chỉnh lại dữ liệu nhé. Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min; (2) Max; (3) Mean; (4) Phương sai chỉ cần thao tác. Tại hộp thoại tóm tắt tần số ta chọn Statistics rồi chọn ô cần thiết rồi Continue/ OK bạn sẽ có kết quả ngay lập tức. * 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Khi thực hiện các nghiên cứu định lượng, người nghiên cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện tượng kinh tế - xã hội vốn rất phức tạp nên việc lượng hoá các khái niệm nghiên cứu đòi hỏi phải có sự kiểm tra độ tin cậy của các thang đo trước khi sử dụng. Phần này chúng ta sẽ thực hành kiểm tra độ tin cậy của thang đo bằng công cụ Cronbach Alpha trên SPSS. Thí dụ: Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn. * 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Người nghiên cứu quan tâm và muốn đo lường xem trong 5 nhân tố nêu trện thì mức độ tác động của các yếu tố nào là mạnh hơn đến quyết định lựa chọn sản phẩm. Muốn vậy, ta phải xây dựng các câu hỏi và thang đo có độ tin cậy về khái niệm “ Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền “Hảo Hảo”. Theo nghiên cứu trước đó thì các yếu tố quyết định… gồm 5 khiá cạnh. Chúng ta sẽ xem xét tính toán Cronbach Alpha đối với các mục hỏi của từng khiá cạnh. Câu hỏi liên quan đến đo lường mức độ tác động của các yếu tố … như sau: * 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con số ở từng dòng. Những con số này thể hiện mức độ bạn đồng ý hay không đồng ý đối với các phát biểu theo qui ước sau: Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng ý 1 2 3 4 5 * 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Vấn đề ở đây là đây có phải là một thang đo tốt cho một khía cạnh khái niệm mà ta quan tâm hay không? Để trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach Alpha. Một nghiên cứu sơ bộ với cỡ mẫu n0 > 30 cho ta ma trận mẫu, sau khi làm sạch dữ liệu và lưu mẫu ta tiến hành tính toán Cronbach Alpha: Analys / Scale/ Reliability Analysis. Hộp thoại hiện ra ta chọn các biến từ a1 – a5 đưa vào hộp Items. Sau đó chọn Statistics. Trong hộp thoại Statistics, hãy nhấp mouse để chọn các đại lượng cơ bản nhất như: Item; Scale; Scale if item deleted sau đó nhấn Continue trở về hộp thoại đầu tiên và chọn OK kết quả tính toán Cronbach Alpha sẽ hiển thị tại màn hình Output. * 3.3 Đánh giá độ tin cậy của thang đo bằng Cronbach Alpha trên SPSS Với kết quả Alpha từ : >0.8 -> Là thang đo tốt; 0.7- 0.8 -> Là thang đo sử dụng được; 0.6 – 0.7 -> Là thang đo sử dụng được đối với những khái niệm mới, hoặc cho SV mới bắt đầu học nghiên cứu; Là thang đo không đảm bảo độ tin cậy, không sử dụng được và bạn phải sửa chữa bảng câu hỏi. Chú ý cột Alpha if item deleted nếu có tồn tại giá trị lớn hơn Alpha thì hãy loại bỏ đi mục hỏi đó (mức độ tác động đến quyết định … của yếu tố đó là thấp/ không đáng kể) do đó ta loại bỏ bớt đi. * 3.4 Tách tập dữ liệu (Split file) Công cụ Split file cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt. Sau khi thực hiện lệnh này các phân tích xử lý thống kê sẽ cho kết quả riêng biệt theo từng nhóm được tách ra này. Data/ Split file ta có hộp thoại. Ta chọn Group based on list và chọn các biến để phân tách dữ liệu, và OK. * 3.5 Hợp nhất các tập dữ liệu (Merge files) SPSS cho phép ta hợp nhất các dữ liệu/ biến quan sát từ trong một tập dữ liệu vào tập dữ liệu đang sử dụng. Cả hai tạo ra một tập dữ liệu/ biến mới chứa đựng tất cả các quan sát từ 2 tập dữ liệu. Add Cases/ hay Add Variables và OK. * C. Hướng dẫn tiểu luận môn học Sau khi hoàn chỉnh Bảng câu hỏi, và điều tra sơ bộ với cỡ mẫu n0 > 30. Các bạn thực hiện việc xử lý dữ liệu với SPSS, trong đó chú ý: Hiệu chỉnh và làm sạch dữ liệu; Tóm tắt dữ liệu (Dạng bảng, dạng thống kê, dạng đồ thị); Kiểm định độ tin cậy của thang đo với SPSS; Xác định cỡ mẫu cho nghiên cứu chính thức (vận dụng Excell). XIN CẢM ƠN CÁC BẠN! * * CHƯƠNG 8: MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆU - ỨNG DỤNG PHẦN MỀM SPSS NGHIÊN CỨU MARKETING * KHÁI NIỆM Phân tích dữ liệu là việc phân tích và diễn giải ý nghiã của dữ liệu thu thập được thông qua 1 mẫu nghiên cứu, và suy rộng ra cho tổng thể nghiên cứu. Với kết quả nghiên cứu (xét trên tổng thể nghiên cứu) thu được ta sẽ có cơ sở để diễn giải ý nghiã của dữ liệu căn cứ vào mục tiêu của cuộc nghiên cứu. Việc điễn giải ý nghiã của kết quả nghiên cứu được thực hiện thông qua kỹ thuật diễn dịch, bản thân kết quả nghiên cứu chứa đựng thông tin về đối tượng nghiên cứu. Việc trình bày và diễn giải ý nghiã kết quả nghiên cứu sẽ được giới thiệu tại Chương 9: Hướng dẫn trình bày báo cáo nghiên cứu của giáo trình môn học. Trong giáo trình chương này đề cập đến 3 phương pháp phân tích dữ liệu đơn giản. Đó là: 1. Xếp dữ liệu theo thứ tự 2. Đo lường khuynh hướng hội tụ của dữ liệu 3. Đo lường độ phân tán của dữ liệu Các bạn có thể đọc nội dung chi tiết của 3 phương pháp này trong giáo trình của môn học. Thực chất, 3 phương pháp nêu trên là việc tóm tắt thống kê các dữ liệu nghiên cứu (đã được trình bày tại Chương 7, mục 3.1), một nội dung không thể thiếu của việc xử lý dự liệu trong nghiên cứu marketing. * * NỘI DUNG PHÂN TÍCH Đối với hệ cao đẳng Phân tích đơn biến; Phân tích nhị biến. Đối với hệ đại học 2 phương pháp trên; và Phân tích phi tham số; Phân tích các thực nghiệm mở rộng * 1. Phân tích đơn biến Ước lượng tham số thị trường Kiểm định giả thuyết về tham số thị trường Phân tích đơn biến là việc phân tích và diễn giải ý nghiã của dữ liệu thông kê được thu thập trong mẫu nghiên cứu, với 1 biến số, và suy rộng ra cho tổng thể nghiên cứu, với độ tin cậy (1-α), và độ chính xác ε. * 1.1 Ước lượng tham số thị trường 1.1.1 Nguyên tắc ước lượng Nguyên tắc của ước lượng là thu thập thông tin từ mẫu và dùng các thông tin này để ước lượng các thông tin của thị trường. Chúng ta thực hiện được điều này vì có một mối quan hệ giữa thông tin của mẫu và thông tin của đám đông. Có 2 nội dung ước lượng trong thống kê là: (1) Ước lượng điểm (Point estimation); (2) Ước lượng khoảng (Interval estimation). Nguyên tắc của ước lượng điểm là dựa vào các thông tin của mẫu đã thu thập để ước lượng các thông tin của thị trường nghiên cứu. Kết quả của ước lượng điểm là 1 giá trị (điểm). * 1.1.1 Nguyên tắc ước lượng Nguyên tắc của ước lượng khoảng là dựa vào thông tin thu thập từ mẫu để ước lượng cho các tham số của đám đông. Có 3 dạng ước lượng khoảng trong thống kê là: Ước lượng tỷ lệ đám đông – PX; Ước lương trung bình đám đông – μX; Ước lương phương sai đám đông – σ2X. Kết quả của ước lượng là 1 khoảng (a,b) chứa tham số đám đông với xác suất (1-α), nghiã là: P(a μ0. Nếu giả thuyết này đúng (nghiã là đường A là phân bố thực của X). Khi ta thực hiện “Phép” kiểm định thì xác suất bác bỏ giả thuyết H0 là α %, và nếu Giá trị kiểm định Z nằm trong khoảng (Zα, ∞) thì chúng ta đã từ chối một giã thuyết đúng – Chúng ta mắc sai lầm loại 1. Tương tự như vậy, nhưng nếu bây giờ giả thuyết này sai (nghiã là đường A không phải là phân phối thực của X, mà là đường B). Khi ta thực hiện “phép” kiểm định (dựa vào đường A), và khi giá trị kiểm định Z nằm trong khỏang (μ0, Zα) chúng ta chấp nhận giả thiết H0, thì chúng ta đã chấp nhận một giả thuyết sai – Chúng ta mắc sai lầm loại 2. * 1-α Như vậy, khi chúng ta giảm α (để giảm sai lầm loại 1), thì đồng thời chúng ta đã làm tăng β (tăng sai lầm loại 2), và làm giảm khả năng của phép kiểm định. Mối quan hệ giữa α và β Thông thường trong nghiên cứu marketing người ta chọn mức ý nghiã α = 5%. A B μ =μ0 μ >μ0 f(x) α Vùng chấp nhận H0: z Є(μ0,zα) Vùng bác bỏ H0: z Є(zα,∞) x x 1-β Các “phép” kiểm định tham số thị trường thường dùng trong phân tích đơn biến gồm có: * 1.2.5 Các “phép” kiểm định tham số thị trường trong phân tích đơn biến. Kiểm định tỷ lệ đám đông (Biến định tính) Kiểm định phương sai đám đông (Biến định lượng) Kiểm định trung bình đám đông (Biến định lượng) * 1.2.5 Các “phép” kiểm định tham số thị trường trong phân tích đơn biến. 1- Kiểm định Z (kiểm định tỷ lệ - Nonparametric Test) 2- Kiểm định T (kiểm định trung bình - One sample T test) Thay vào đó chúng tôi sẽ hướng dẫn các bạn các “phép” kiểm định: (1); (2) với sự hỗ trợ của phần mềm SPSS. * Kiểm định Z được sử dụng trong kiểm định tỷ lệ đám đông (dùng cho biến định tính- Nonparametric). Giả sử chúng ta phỏng vấn 1 mẫu ngẫu nhiên với 234 KH với câu hỏi: C2: Bạn đang sử dụng ĐTDD có nhãn hiệu nào trong các nhãn hiệu dưới đây 1 Nokia 2 Samsung 3 Apple 4 Ericsion 5 Loại khác Kiểm định Z * Kết quả thu được PNokia = 60%. ta tiến hành kiểm định giả thuyết H0: PNokia Nonparametric Test -> Binominal ta nhập biến C2 vào ô Test Variable test, nhập giá trị kiểm định vào ô Test Proportion -> OK Chúng ta có kết quả kiểm định tại màn hình output. Quan sát cột Asymp. Sig. (1- failed) nếu cho giá trị ≤ .050 thì giả thuyết H0 bị bác bỏ, ngược lại, giả thuyết Ha được chấp nhận. Kiểm định Z * Kiểm định T được sử dụng phổ biến để kiểm định trung bình cho các biến định lượng (Metric). Giả sử chúng ta phỏng vấn 234 KH với câu hỏi: C5: Xin vui lòng cho biết ý kiến của bạn về phát biểu dưới đây ”Điện thoại di động nhãn hiệu NOKIA có chất lượng tốt” Hoàn toàn phản đối Hoàn toàn đồng ý 1 2 3 4 5 Sau khi thu thập dữ liệu với cỡ mẫu n0 = 234 và nhập liệu, nay ta muốn kiểm định xem trung bình của biến này, với ý nghiã xem nhận định, đánh giá của khách hàng về chất lượng ĐTDD NOKIA Chúng ta đặt giả thiết H0: ĐTDD nhãn hiệu NOKIA có chất lượng tốt (với mức ý nghiã α = 5%; Nếu μ0 ≥ 3 thì giả thuyết được chấp nhận), và tiến hành kiểm định biến số trên. Kiểm định T (One sample T test) * Chúng ta thực hiện thao tác trên SPSS như sau: Analyze -> Compare Means (so sánh trung bình của biến với 3) -> One- Sample T- Test -> Nhập biến C5 vào, thay giá trị Test value bằng 5 (mặc nhiên là 0) -> OK. Ở màn hình Output sẽ cho kết quả trung bình (mean) là một giá trị cụ thể (con số) tại bảng tóm tắt (one sample Statistics). Tại bảng kết quả kiểm định (One- Sample Test), trên cột cuối (95% Confidence interval of the difference) ta thấy giá trị dưới (lower) và trên (Upper). Kết quả kiểm định như sau: (Mean + Lower) ≤ μ0 ≤ (Mean + Upper) Nếu (Mean + Lower) ≥3, ta chấp nhận giả thuyết H0: ĐTDĐ nhãn hiệu NOKIA có chất lượng tốt (với mức ý nghiã α = 5%). Và ngược lại, ta bác bỏ giả thuyết. Kiểm định T (One sample T test) * 2. Phân tích nhị biến 1- Biến A 2- Biến B Phân tích nhị biến là việc phân tích và diễn giải ý nghiã của dữ liệu thống kê được thu thập trong mẫu nghiên cứu, với 2 biến số nhằm xác định và làm rõ mối liên hệ giữa 2 biến số với nhau, và suy rộng ra cho tổng thể nghiên cứu, với độ tin cậy (1-α), và độ chính xác ε. Phương pháp phân tích nhị biến sẽ được đề cập với sự hỗ trợ của phần mềm SPSS, cho các “phép” sau đây: * 2. Phân tích nhị biến Kiểm định sự khác biệt giữa 2 trung bình Kiểm định mối quan hệ giữa 2 biến định tính Kiểm định mối quan hệ giữa 2 biến định lượng XIN CẢM ƠN CÁC BẠN! *
Các file đính kèm theo tài liệu này:
- 1_bai_hoc_nghien_cuu_marting_8752.ppt