Sử dụng phầm mềm vitesta để định cỡ câu hỏi trắc nghiệm khách quan đa lựa chọn - Nguyễn Thế Phương

3. KẾT LUẬN Các bảng số liệu, các hình biễu diễn minh họa kết quả định cỡ 38 câu hỏi TNKQ của một bài kiểm tra (có 160 học sinh tham gia) nêu trên cho thấy phần mềm Vitesta sử dụng rất tiện lợi, hiệu quả trong việc phân tích các câu hỏi TN theo lý thuyết trắc nghiệm hiện đại, ngoài ra chương trình còn thiết kế biểu đồ phân bố độ khó và năng lực thí sinh, đường cong điểm thực hoặc giúp ta xác định các câu hỏi đặc biệt trong đề, các thí sinh cần lưu ý Đây được xem như một phương tiện sử dụng trong kiểm tra đánh giá giúp ta xây dựng được một ngân hàng đề đúng chuẩn. Ngoài ra nếu khai thác tốt, phần mềm còn có thể giúp giáo viên đánh giá kết quả học tập, chẩn đoán năng lực của từng học sinh trong lớp học, qua đó góp phần đổi mới phương pháp dạy học nhằm nâng cao chất lượng ở trường phổ thông.

pdf8 trang | Chia sẻ: thucuc2301 | Lượt xem: 574 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Sử dụng phầm mềm vitesta để định cỡ câu hỏi trắc nghiệm khách quan đa lựa chọn - Nguyễn Thế Phương, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Tạp chí Khoa học và Giáo dục, Trường Đại học Sư phạm Huế ISSN 1859-1612, Số 02(14)/2010: tr. 12-18 SỬ DỤNG PHẦM MỀM VITESTA ĐỂ ĐỊNH CỠ CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN ĐA LỰA CHỌN NGUYỄN THẾ PHƯƠNG TÔN THẤT VIỄN TƯƠNG - HỒ NGỌC HÙNG Sở Giáo dục và Đào tạo Thừa Thiên Huế Tóm tắt: Bài viết này nhằm giới thiệu việc sử dụng phần mềm Vitesta - phần mềm được xây dựng dựa vào lý thuyết đáp ứng câu hỏi - để định cỡ các câu hỏi đa lựa chọn trong bài trắc nghiệm khách quan (TNKQ). 1. ĐẶT VẤN ĐỀ Phương pháp kiểm tra, đánh giá kết quả học tập của học sinh bằng hình thức trắc nghiệm khách quan đã và đang được Bộ Giáo dục và Đào tạo thực hiện trong kiểm tra học kỳ, thi tốt nghiệp THPT, tuyển sinh đại học, cao đẳng Do vậy việc xây dựng ngân hàng câu hỏi trắc nghiệm đối với các cơ sở giáo dục là một yêu cầu cấp thiết, mang ý nghĩa hết sức quan trọng Việc sử dụng các phần mềm chuyên dụng, đặc biệt là phần mềm Vitesta do Công ty Công nghệ Giáo dục và Xử lý dữ liệu (EDTECH-DP) thiết kế để định cỡ các câu hỏi TNKQ nhằm tạo được những bộ đề hoàn chỉnh, sử dụng trong quá trình kiểm tra, đánh giá chắc hẳn sẽ góp phần nâng cao chất lượng dạy học của thầy và trò. 2. NỘI DUNG VÀ KẾT QUẢ 2.1. Theo lý thuyết trắc nghiệm cổ điển, để phân tích câu hỏi TNKQ người ta cần phải chọn nhóm chuẩn để làm mẫu thử nghiệm, yêu cầu nhóm chuẩn phải được phân bố hợp lý thỏa mãn tối thiểu các mức trí năng của học sinh tùy thuộc vào các vùng, miền do vậy, các thông số thống kê như độ khó, độ phân biệt của đề phụ thuộc vào mẫu chọn và vì vậy năng lực của học sinh khi làm đề trắc nghiệm cũng phụ thuộc chính vào đề trắc nghiệm mà mình thực hiện [4]. Lý thuyết trắc nghiệm hiện đại dựa vào Mô hình đặc điểm tiềm tàng [4] mà đại diện là Lý thuyết đáp ứng câu hỏi (Items Response Theory, IRT) do Geoge Rasch (nhà toán học Đan Mạch) đề xướng. Lý thuyết này dựa vào lợi điểm các giả định về hành vi con người khi đáp ứng các câu hỏi TN: (a) đặc điểm của một câu hỏi TN không phụ thuộc mẫu thí sinh thử nghiệm, (b) khả năng của 1 thí sinh không phụ thuộc vào mẫu các câu hỏi đặt cho thí sinh đó [3]. IRT cho rằng mối liên hệ giữa mức khả năng của một học sinh và kết quả đạt được khi học sinh đó đáp ứng một câu hỏi TN được mô tả một cách toán học bằng Hàm đáp ứng câu hỏi (IRF) hay đường cong đặc trưng câu hỏi (ICC). IRF cho biết xác suất trả lời đúng một câu hỏi TN của một học sinh ứng với một mức khả năng nhất định của học sinh đó, xác suất này là hàm của các đặc tính các câu hỏi đó [4]: NGUYỄN THẾ PHƯƠNG - TÔN THẤT VIỄN TƯƠNG - HỒ NGỌC HÙNG 112 P(θ ) = c + (1- c) )](exp[1 )](exp[ ba ba −+ − θ θ trong đó các thông số a, b, c có ý nghĩa: a: Độ phân cách của câu hỏi TN, trên ICC a liên hệ với độ dốc của đường cong tại điểm uốn; b: Độ khó của câu hỏi, trên ICC b được xác định đó là hoành độ (mức năng lực) ứng với trung điểm của thang điểm thực; c: Thông số đoán hú họa. Cần lưu ý là mô hình Rasch áp dụng cho câu hỏi trắc nghiệm với hai loại điểm số (điểm 0: câu sai; điểm 1: câu đúng) và trước khi định cỡ (các dữ kiện xử lý được theo mô hình Rasch) cần được kiểm chứng bằng việc phân tích sự hòa hợp trong, ngoài. 2.2. Khi xây dựng ngân hàng câu hỏi trắc nghiệm cho học sinh lớp 10 THPT, các câu hỏi TN trong đề được mã hóa theo các mức năng lực Bloom [1] nhằm thuận tiện cho việc quản lý sau này. Ttoàn bộ các bài thi được chúng tôi tiến hành kiểm tra tại 10 trường THPT trong tỉnh. Kết quả bài làm được quét bằng máy quét điểm quang học DRS 400 (số lượng câu hỏi thô gần 6000 câu cho 6 môn : Lý, Hóa, Sinh, Toán, Tiếng Anh và Tiếng Pháp). Thay vì dùng các phần mềm nước ngoài như trước đây (các phần mềm QUEST, BILOG-MG3 ), chúng tôi đã sử dụng phần mềm VITESTA của Công ty Công nghệ Giáo dục và Xử lý dữ liệu (EDTECH-DP) thiết kế để định cỡ các câu hỏi và các đề kiểm tra, sau đó phân tích để lựa chọn các câu hỏi đạt yêu cầu lưu vào ngân hàng Sau đây là kết quả phân tích đề kiểm tra số 203, môn Sinh lớp 10. Bảng 1. Phân tích sự hòa hợp trong CHỈ SỐ TRÙNG KHỚP TRONG (INFIT) ĐỀ SINH10_203 Câu 63 71 83 100 120 140 160 --------------+---------+---------+---------+---------+---------+---------+--- 1 *| 2 * 3 * 4 * 5 * 6 *| 7 * 8 *| 9 * 10 *| 11 * 12 * | 13 *| 14 * 15 * | 16 * | 17 | * 18 *| 19 |* 20 |* 21 *| 22 * | 23 *| 24 *| SỬ DỤNG PHẦN MỀM VITESTA ĐỂ ĐỊNH CỠ 113 25 * 26 * | 27 *| 28 * | 29 *| 30 * | 31 * 32 * 33 *| 34 *| 35 * 36 *| 37 *| 38 *| Mục đích của việc phân tích sự hòa hợp nhằm xem xét các dữ kiện trắc nghiệm có thích hợp để đo lường theo mô hình Rasch hay không [3], nếu không, các câu đó sẽ bị loại bỏ. Theo lý thuyết trắc nghiệm, trên Bảng 1, đường thẳng ngang biểu diễn các trị số kỳ vọng của sự hòa hợp trong (Infit Meansquare) với trị số kỳ vọng bằng 1, mỗi câu TN sau khi được học sinh trả lời sẽ biểu diễn bằng một dấu (*), đề bài có 38 câu được biểu diễn bởi 38 dấu (*), kết quả cho thấy tất cả các dấu (*) đều nằm trong 2 đường thẳng đứng qua các giá trị 1-0,3 và 1 + 0,3 (các đường chấm chấm), do đó tất cả 38 câu hỏi của đề đều hòa hợp với mô hình Rasch. Hình 1. Các đường cong đặc trưng của các câu trắc nghiệm đề Sinh10 - 203 NGUYỄN THẾ PHƯƠNG - TÔN THẤT VIỄN TƯƠNG - HỒ NGỌC HÙNG 114 Dựa vào Hình 1 ta nhận thấy độ dốc a của các đường thẳng đặc trưng (hoặc độ dốc của tiếp tuyến của đường cong tại điểm uốn) của các câu 3, 6, 10, 13, 18, 29 rất bé không thể phân biệt được mức năng lực của các học sinh tham gia câu hỏi này [2], câu 28 có hoành độ b xác định mức năng lực ứng với tung độ của điểm giữa của trục P(θ ) của đường đặc trưng lệch về bên phải quá xa chứng tỏ chỉ số liên quan độ khó quá lớn (câu hỏi quá khó) (lưu ý định nghĩa độ khó của câu trắc nghiệm theo IRT, [2], [4]) các câu này cần phân tích cẩn thận hoặc loại bỏ. Bảng 2. Các thông số IRT KẾT QUẢ ƯỚC LƯỢNG ĐỘC LẬP THAM SỐ CÂU HỎI Mô hình 3 tham số Tạo ra vào lúc 21/09/2009 - 02:59 ================================================================== Đề thi: Sinh10_203 +-----------------------------------------------------------------| | Câu¦ b| a| c| MSE (*) +-----------+------------+------------+------------+--------------| ¦ 1¦ 279085¦ 019149¦ 000010¦ 023032¦ ¦ 2¦ -032260¦ 027332¦ 001947¦ 021327¦ ¦ 3¦ -016880¦ 004108¦ 006982¦ 020809¦ ¦ 4¦ 080614¦ 028688¦ 000010¦ 021623¦ ¦ 5¦ 085634¦ 030666¦ 000010¦ 021783¦ ¦ 6¦ -064448¦ 002341¦ 028107¦ 021675¦ ¦ 7¦ 240840¦ 024286¦ 000010¦ 023500¦ ¦ 8¦ 047083¦ 029613¦ 008518¦ 021212¦ ¦ 9¦ 096891¦ 026429¦ 000010¦ 021635¦ ¦ 10¦ 363061¦ 005387¦ 000010¦ 021046¦ ¦ 11¦ -035106¦ 042035¦ 000010¦ 022032¦ ¦ 12¦ 393155¦ 018451¦ 000580¦ 024654¦ ¦ 13¦ 738978¦ 001101¦ 000010¦ 020789¦ ¦ 14¦ 052747¦ 049266¦ 000010¦ 022482¦ ¦ 15¦ 449139¦ 017465¦ 000352¦ 025385¦ ¦ 16¦ 476069¦ 033982¦ 007260¦ 030419¦ ¦ 17¦ 112049¦ 089090¦ 000010¦ 027820¦ ¦ 18¦ 368050¦ 017457¦ 000010¦ 023961¦ ¦ 19¦ -055840¦ 131498¦ 001690¦ 029318¦ ¦ 20¦ 007768¦ 222695¦ 000010¦ 033803¦ ¦ 21¦ 034704¦ 106685¦ 014347¦ 023765¦ ¦ 22¦ -012926¦ 068412¦ 000010¦ 023365¦ ¦ 23¦ 349306¦ 020639¦ 000010¦ 024777¦ ¦ 24¦ 176690¦ 028249¦ 001427¦ 022696¦ ¦ 25¦ 135489¦ 034599¦ 000010¦ 022853¦ ¦ 26¦ 325122¦ 038317¦ 002908¦ 029671¦ ¦ 27¦ 023947¦ 132982¦ 000010¦ 027518¦ ¦ 28¦ 515239¦ 041207¦ 005821¦ 036612¦ ¦ 29¦ 034621¦ 003721¦ 000034¦ 020750¦ ¦ 30¦ 287815¦ 057832¦ 007685¦ 029600¦ ¦ 31¦ 153563¦ 028352¦ 000010¦ 022510¦ ¦ 32¦ 273659¦ 022148¦ 000010¦ 023660¦ ¦ 33¦ 030483¦ 066382¦ 007334¦ 022661¦ ¦ 34¦ 317680¦ 020570¦ 000010¦ 024086¦ SỬ DỤNG PHẦN MỀM VITESTA ĐỂ ĐỊNH CỠ 115 ¦ 35¦ 223127¦ 031576¦ 000010¦ 024653¦ ¦ 36¦ 013242¦ 036444¦ 002823¦ 021545¦ ¦ 37¦ 029398¦ 083102¦ 005816¦ 023576¦ ¦ 38¦ 020271¦ 081444¦ 003299¦ 023728¦ |-----------------------------------------------------------------| (*) MSE (Mean Square Error): Sai số bình phương trung bình ------------------------------------------------------------------ Kiểm tra lại các thông số IRT ở bảng 2, quả thật các câu 3, 6, 10, 13, 29 giá trị a rất bé cần loại bỏ khỏi ngân hàng, câu 28 tuy a lớn hơn song chỉ số b lại khá cao cần xem xét lần nữa nhờ bảng thông số cổ điển. Bảng 3. Các thông số cổ điển một số câu trắc nghiệm của đề Sinh10 - 203 Câu số: 5 Bỏ qua: 0 Độ phân biệt (cổ điển): 023261 Độ khó (cổ điển): 039785 Các phương án: A* B C D Số TS chọn: 37 18 22 16 Tỉ lệ TS chọn PA (%) 3978 1935 2366 1720 Tương quan điểm nhị phân: 023261 012027 -040940 003343 Giá trị t: 228152 115564 -428059 031908 Giá trị p: 001243 012543 000002 037520 ============================================================================== Câu số: 6 Bỏ qua: 0 Độ phân biệt (cổ điển): 004576 Độ khó (cổ điển): 064516 Các phương án: A* B C D Số TS chọn: 60 19 7 7 Tỉ lệ TS chọn PA (%) 6452 2043 753 753 Tương quan điểm nhị phân: 004576 -014899 006194 008277 Giá trị t: 043700 -143734 059197 079228 Giá trị p: 033157 007703 027767 021513 Câu số: 12 Bỏ qua: 0 Độ phân biệt (cổ điển): -002014 Độ khó (cổ điển): 021505 Các phương án: A B* C D Số TS chọn: 20 20 46 7 Tỉ lệ TS chọn PA (%) 2151 2151 4946 753 Tương quan điểm nhị phân: -007365 -002014 -001058 016610 Giá trị t: -070444 -019214 -010092 160679 Giá trị p: 024148 042403 045992 005578 ============================================================================== Câu số: 15 Bỏ qua: 3 Độ phân biệt (cổ điển): -002947 Độ khó (cổ điển): 020000 Các phương án: A* B C D Số TS chọn: 18 48 12 12 Tỉ lệ TS chọn PA (%) 2000 5333 1333 1333 Tương quan điểm nhị phân: -002947 033086 003473 -020840 Giá trị t: -028127 334460 033154 -203267 Giá trị p: 038957 000060 037050 002250 ================================================================================= NGUYỄN THẾ PHƯƠNG - TÔN THẤT VIỄN TƯƠNG - HỒ NGỌC HÙNG 116 Câu số: 18 Bỏ qua: 3 Độ phân biệt (cổ điển): 006109 Độ khó (cổ điển): 024444 Các phương án: A B* C D Số TS chọn: 18 22 41 9 Tỉ lệ TS chọn PA (%) 2000 2444 4556 1000 Tương quan điểm nhị phân: -001616 006109 013993 002904 Giá trị t: -015414 058386 134816 027716 Giá trị p: 043892 028038 009048 039114 ============================================================================== Câu số: 19 Bỏ qua: 0 Độ phân biệt (cổ điển): 052420 Độ khó (cổ điển): 068817 Các phương án: A B* C D Số TS chọn: 8 64 15 6 Tỉ lệ TS chọn PA (%) 860 6882 1613 645 Tương quan điểm nhị phân: -035482 052420 -032320 -009959 Giá trị t: -362033 587198 -325803 -095477 Giá trị p: 000024 000000 000079 017111 ============================================================================== Câu số: 23 Bỏ qua: 3 Độ phân biệt (cổ điển): 010411 Độ khó (cổ điển): 022222 Các phương án: A B C* D Số TS chọn: 21 24 20 25 Tỉ lệ TS chọn PA (%) 2333 2667 2222 2778 Tương quan điểm nhị phân: 004111 005670 010411 003087 Giá trị t: 039246 054171 099853 029465 Giá trị p: 034782 029467 016034 038447 ============================================================================== Câu số: 28 Bỏ qua: 1 Độ phân biệt (cổ điển): 005590 Độ khó (cổ điển): 008696 Các phương án: A B C D* Số TS chọn: 15 21 48 8 Tỉ lệ TS chọn PA (%) 1630 2283 5217 870 Tương quan điểm nhị phân: 014118 -002325 -004372 005590 Giá trị t: 136041 -022184 -041750 053411 Giá trị p: 008853 041247 033865 029728 Câu số: 37 Bỏ qua: 0 Độ phân biệt (cổ điển): 042730 Độ khó (cổ điển): 046237 Các phương án: A B* C D Số TS chọn: 23 43 22 5 Tỉ lệ TS chọn PA (%) 2473 4624 2366 538 Tương quan điểm nhị phân: -021950 042730 -018308 -017974 Giá trị t: -214624 450854 -177645 -174301 Giá trị p: 001726 000001 003950 004236 ============================================================================== Kiểm tra theo các thông số cổ điển (bảng 3), ta thấy câu 28 quá khó (chỉ số khó cổ điển: SỬ DỤNG PHẦN MỀM VITESTA ĐỂ ĐỊNH CỠ 117 Dd = 0,08696, chỉ số khó IRT : b = 5,15239), các câu 12, 15 có độ phân biệt cổ điển âm, nên các câu này cũng loại bỏ. Ngoài ra cũng cần xem xét tương quan điểm nhị phân của một số phương án chọn của các câu để chế tác lại một số câu nhiễu (tương quan điểm nhị phân bằng 0 hoặc có giá trị dương và lớn). Tóm lại, với đề bài 38 câu môn Sinh 10 sau khi định cỡ ta loại bỏ 9 câu hỏi, đó là các câu 3, 6, 10, 12, 13, 15,18, 28, 29 (do chỉ số khó cổ điển < 0,25; chỉ số phân biệt cổ điển < 0,2; tham số phân biệt IRT a < 0,1 hoặc độ phân biệt cổ điển âm) Sau khi định cỡ lại, hàm thông tin (Hình 2) cho thấy đây là một đề khá chuẩn. Hình 2. Hàm thông tin - đường cong sai số chuẩn của đề thi Sinh10 - 203 3. KẾT LUẬN Các bảng số liệu, các hình biễu diễn minh họa kết quả định cỡ 38 câu hỏi TNKQ của một bài kiểm tra (có 160 học sinh tham gia) nêu trên cho thấy phần mềm Vitesta sử dụng rất tiện lợi, hiệu quả trong việc phân tích các câu hỏi TN theo lý thuyết trắc nghiệm hiện đại, ngoài ra chương trình còn thiết kế biểu đồ phân bố độ khó và năng lực thí sinh, đường cong điểm thực hoặc giúp ta xác định các câu hỏi đặc biệt trong đề, các thí sinh cần lưu ý Đây được xem như một phương tiện sử dụng trong kiểm tra đánh giá giúp ta xây dựng được một ngân hàng đề đúng chuẩn. Ngoài ra nếu khai thác tốt, phần mềm còn có thể giúp giáo viên đánh giá kết quả học tập, chẩn đoán năng lực của từng học sinh trong lớp học, qua đó góp phần đổi mới phương pháp dạy học nhằm nâng cao chất lượng ở trường phổ thông. TÀI LIỆU THAM KHẢO [1] Huỳnh Huynh (1974). Trắc nghiệm giáo dục. NXB Khai Trí, Sài Gòn. NGUYỄN THẾ PHƯƠNG - TÔN THẤT VIỄN TƯƠNG - HỒ NGỌC HÙNG 118 [2] Lâm Quang Thiệp (2008). Trắc nghiệm và ứng dụng. NXB Khoa học và Kỹ thuật, Hà Nội. [3] Dương Thiệu Tống (1995). Trắc nghiệm và đo lường thành quả học tập. Trường Đại học Tổng hợp, TP Hồ Chí Minh. [4] Dương Thiệu Tống (1998). Trắc nghiệm tiêu chí. NXB Giáo dục, Hà Nội. Title: USING VITESTA SOLFWARE TO CALIBRATE MULTIPLE CHOICE QUESTIONS IN OBJECTIVE TEST Abstract: This paper presents the problem of using Vitesta solfware that based on item response theory to calibrate multiple- choice questions in objective test NGUYỄN THẾ PHƯƠNG TÔN THẤT VIỄN TƯƠNG HỒ NGỌC HÙNG Phòng Khảo thí - Đảm bảo chất lượng giáo dục, Sở Giáo dục và Đào tạo Thừa Thiên Huế.

Các file đính kèm theo tài liệu này:

  • pdf18_279_nguyenthephuong_tonthatvientuong_hothehung_17_nguyen_the_phuong_1363_2021127.pdf
Tài liệu liên quan