Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt - Nguyễn Thị Thanh Tâm

KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO Qua nghiên cứu, khảo sát thực tế và phân tích, chúng tôi đã đề xuất một giải pháp cho bài toán thống kê số lượng sinh viên dự lớp dựa trên việc thu thập dữ liệu thông qua hình ảnh sử dụng phương pháp Viola-Jones phát hiện khuôn mặt. Chúng tôi đã tiến hành thực nghiệm, phân tích đánh giá khách quan trong môi trường thực tế. Kết quả thực nghiệm cho thấy giải pháp đã đề xuất là khả thi, có triển vọng. Trong tương lai, chúng tôi sẽ tiếp tục nghiên cứu kết hợp các kỹ thuật khác và tối ưu hóa các tham số sao cho phù hợp với điều kiện áp dụng để nâng cao hiệu quả bước phát hiện khuôn mặt. Một dự án triển khai hệ thống cũng được dự kiến trong điều kiện cho phép.

6 trang | Chia sẻ: thucuc2301 | Lượt xem: 798 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt - Nguyễn Thị Thanh Tâm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 103 MỘT GIẢI PHÁP MỚI CHO BÀI TOÁN THỐNG KÊ SỐ LƯỢNG SINH VIÊN DỰ LỚP SỬ DỤNG PHƯƠNG PHÁP PHÁT HIỆN KHUÔN MẶT Nguyễn Thị Thanh Tâm*, Nguyễn Văn Tới, Nguyễn Thị Tính, Lê Thu Trang Trường Đại học Công nghệ thông tin và Truyền thông – ĐH Thái Nguyên TÓM TẮT Thống kê số lượng sinh viên dự lớp là một nhu cầu thực tế đặt ra tại các trường đại học. Hiện nay, phương pháp thu thập số liệu một cách độc lập về số lượng sinh viên dự lớp vẫn được thực hiện thủ công bằng cách đếm trực tiếp tại lớp học. Đây là công việc tốn thời gian và gây phiền toái, ảnh hưởng đến giờ học nên việc thu thập dữ liệu một cách độc lập vẫn chưa được thực hiện thường xuyên. Trong bài báo này, chúng tôi đề xuất việc sử dụng phương pháp phát hiện khuôn mặt từ ảnh để đếm số sinh viên dự lớp. Chúng tôi đã thực nghiệm việc áp dụng phương pháp phát hiện khuôn mặt của Viola-Jones trong môi trường lớp học từ đó phân tích, đánh giá khả năng áp dụng trên thực tế. Kết quả thực nghiệm, phân tích cho thấy giải pháp chúng tôi đề xuất là khả thi, đúng hướng. Từ khóa: bài toán thống kê, phương pháp phát hiện khuôn mặt, Viola-Jones GIỚI THIỆU* Hầu hết các trường đại học đều có nhu cầu thống kê, phân tích số lượng sinh viên dự lớp. Số liệu này giúp các bộ phận quản lý nắm được tình hình tham gia học tập của sinh viên từng lớp, mức độ hấp dẫn của bài giảng và nhiều khía cạnh khác. Hiện nay việc thu thập dữ liệu về số lượng sinh viên dự lớp một cách độc lập, với mật độ đủ lớn hầu như vẫn chưa được thực hiện bởi vì những khó khăn, phiền phức. Với cách làm hiện tại, việc thu thập dữ liệu thường được thực hiện bởi các nhân viên bằng cách đi đến đếm trực tiếp tại các lớp vào giờ học. Cách làm này tốn công sức, nhân lực đồng thời gây gián đoạn, ảnh hưởng đến giờ học. Việc đếm trực tiếp trong hoàn cảnh phải nhanh chóng để đỡ ảnh hưởng đến lớp học cũng dẫn đến sai sót. Vì vậy, chúng tôi đề xuất một giải pháp mới cho việc thu thập dữ liệu đó là sử dụng máy ảnh hoặc camera kỹ thuật số để thu ảnh lớp học rồi sử dụng hệ thống tự động phát hiện khuôn mặt để hỗ trợ việc thu thập số liệu một cách nhanh chóng và chính xác. Trong những năm gần đây, phát hiện và nhận dạng khuôn mặt là chủ đề nghiên cứu thu hút sự quan tâm của nhiều nhà khoa học cả trên khía cạnh nghiên cứu phương pháp cơ bản cũng như các nghiên cứu ứng dụng. Đã có * Tel: 0973 002640, Email: ntttam@ictu.edu.vn nhiều phương pháp phát hiện, nhận dạng khuôn mặt được nghiên cứu và đề xuất [1]. Trong đó, phương pháp Viola-Jones [2] được đánh giá là phương pháp tốt và được sử dụng rộng rãi hiện nay [3]. Theo thống kê và xếp hạng của Microsoft Academic Search [4], bài báo đầu tiên trình bày phương pháp Viola- Jones [5] được trích dẫn 3279 lượt (số liệu ngày 10/11/2012) và số lượng trích dẫn vẫn đang liên tục tăng. Bài báo này xếp thứ mười về số lượng trích dẫn trong lĩnh vực thị giác máy tính, đứng thứ nhất trong bài toán phát hiện khuôn mặt và phát hiện đối tượng. Các bài báo khác về phương pháp này [6][2] đều có hàng nghìn lượt trích dẫn. Điều đó chứng tỏ phương pháp Viola-Jones ngày càng được đánh giá cao và sử dụng rộng rãi. Ở bài báo này, chúng tôi nghiên cứu áp dụng phương pháp Viola-Jones trong việc đếm số lượng sinh viên dự lớp. Những đóng góp của chúng tôi trình bày trong bài báo này bao gồm: - Đề xuất giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt; - Đánh giá hiệu quả của phương pháp Viola- Jones trong môi trường lớp học thông qua thực nghiệm từ đó đưa ra kết luận về tính khả thi và hiệu quả của giải pháp đã đề xuất. Phần còn lại của bài báo được trình bày theo cấu trúc như sau: Phần 2 trình bày giải pháp Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 104 giải quyết bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt. Phần 3 giới thiệu sơ lược phương pháp Viola-Jones mà chúng tôi sử dụng. Phần 4 trình bày kết quả thực nghiệm và những phân tích kết luận của chúng tôi khi áp dụng phương pháp Viola-Jones trong môi trường lớp học. Kết luận và hướng nghiên cứu tiếp theo được trình bày trong phần 5. ĐỀ XUẤT GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN THỐNG KÊ SỐ LƯỢNG SINH VIÊN DỰ LỚP Hình 1 là sơ đồ mô tả giải pháp mà chúng tôi đề xuất. Dưới đây là mô tả chi tiết từng bước trong sơ đồ: Thu thập ảnh dữ liệu lớp học: Thay vì trực tiếp đếm số lượng sinh viên trên lớp như cách làm truyền thống, chúng tôi đề xuất hai cách làm tùy theo điều kiện cơ sở vật chất nơi áp dụng. Cách 1: Nhân viên thu thập dữ liệu sử dụng máy ảnh kỹ thuật số để chụp ảnh lớp học. Với công nghệ hiện nay, có những loại máy ảnh có góc chụp rộng cho phép thu được ảnh chứa toàn bộ sinh viên từ cửa lớp. Dữ liệu ảnh thu được là đầu vào cho bước tự động phát hiện khuôn mặt và hiệu chỉnh kết quả. Ưu điểm của cách làm này so với cách làm truyền thống là không làm mất nhiều thời gian, hạn chế đến mức thấp nhất làm gián đoạn việc dạy và học. Cách 2: Sử dụng hệ thống camera gắn tại các phòng học. Việc sử dụng camera để thu thập ảnh dữ liệu sẽ mang lại hiệu quả cao hơn. Dữ liệu ảnh được thu nhận tức thời tại thời điểm mong muốn trong khi các tiết học đang diễn ra thông qua hệ thống mạng. Cách làm này không làm ảnh hưởng đến giờ học. Trong trường hợp này, cần trang bị hệ thống camera nhưng bù lại không cần nhân viên đi chụp ảnh. Xử lý phát hiện khuôn mặt: Sau khi đã có dữ liệu ảnh lớp học, hệ thống sẽ nhận ảnh đầu vào và tự động phát hiện khuôn mặt. Bước này được thực hiện bởi một chức năng trong chương trình phần mềm sẽ được xây dựng. Kết quả ảnh đầu ra được hiển thị với các vùng được đánh dấu được cho là khuôn mặt (có thể đúng hoạc sai). Như đã phân tích trong phần 1, chúng tôi đề xuất sử dụng phương pháp Viola-Jones cho chức năng này. Hình 1. Mô hình hoạt động của hệ thống thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt Hiệu chỉnh kết quả phát hiện khuôn mặt: Ảnh đầu vào thu nhận trong môi trường thực tế có nhiều yếu tố phức tạp như tư thế ngồi của sinh viên khác nhau (hướng của khuôn mặt, người trước ngồi lấp mặt ngườisau...). Chức năng tự động phát hiện khuôn mặt có thể thực hiện không chính xác, nhầm hoặc bỏ sót. Hiện nay, chưa có phương pháp phát hiện khuôn mặt được đúng 100%. Chức năng hiệu chỉnh kết quả tự động phát hiện khuôn mặt được thực hiện bởi người quản lý chương trình một cách dễ dàng, nhanh chóng với các thao tác click chọn trên ảnh. Lưu trữ số lượng sinh viên dự lớp: Sau khi người quản lý hiệu chỉnh lại kết quả của việc phát hiện khuôn mặt để thu được kết quả chính xác, số liệu này được tổ chức lưu trữ trong cơ sở dữ liệu được thiết kế hợp lý và có thể phối hợp với các hệ thống khác liên quan. Những vị trí khuôn mặt trên ảnh cũng được lưu trữ. Tất cả các thông tin có thể được hiển thị, hiệu chỉnh, khai thác trong tương lai. Xử lý, phân tích, thống kê số lượng sinh viên dự lớp: Tùy theo nhu cầu, các chức năng thống kê, phân tích, báo cáo sẽ được trang bị trong chương trình. Đây là việc làm mang tính chuyên môn phục vụ cho tùy từng mục Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 105 đích của việc thống kê số lượng học sinh, sinh viên. Ngoài ra, các kết quả, số liệu có thể được sử dụng ở nhiều công việc khác tiếp theo. PHƯƠNG PHÁP VIOLA -JONES Năm 2001, Paul Viola và cộng sự công bố một phương pháp phát hiện đối tượng theo hướng tiếp cận học máy sử dụng Boosted Cascade của các đặc trưng Haar-like [5]. Phương pháp ban đầu nhằm mục đích giải quyết bài toán phát hiện khuôn mặt. Phương pháp này kết hợp nhiều bộ phân lớp trong một cấu trúc Cascade, Hình 2. Mỗi nút của cấu trúc Cascade là một bộ phân lớp. Ở đây, bộ phân lớp thực hiện phân một đối tượng vào một trong hai lớp: là khuôn mặt hoặc không là khuôn mặt. Hình 2.Cấu trúc Cascade,[5]. Quá trình phát hiện khuôn mặt trên một ảnh đầu vào sẽ diễn ra như sau: tất cả các vùng hình chữ nhật (Sub-Window) ở tất cả các vị trí và với tất cả các kích thước được xem xét. Với một Sub-Window, nó được đưa vào nút đầu tiên của Cascade, nếu nút này xác định Sub-Window là khuôn mặt thì nó được đưa qua nút tiếp theo, nếu không thì kết luận Sub- Window này không phải là khuôn mặt. Một Sub-Window được kết luận là khuôn mặt nếu được lần lượt chấp nhận ở tất cả các nút. Các bộ phân lớp ứng với các nút của Cascade sử dụng đặc trưng Haar-like, Hình 3. Giá trị đặc trưng Haar-like là chênh lệch giữa tổng giá trị điểm ảnh thuộc vùng trắng và tổng giá trị điểm ảnh thuộc vùng xám. Một đặc trưng Haar-like của một ảnh được xác định bởi kiểu đặc trưng, kích thước và vị trí trên ảnh. Tổng số đặc trưng của ảnh là rất lớn, lớn hơn nhiều so với số lượng điểm ảnh. Ví dụ, với ảnh kích thước 24x24 thì số đặc trưng là hơn 180.000. Tuy nhiên, giá trị các đặc trưng Haar-like được tính toán rất nhanh và thời gian tính là bằng nhau cho mỗi giá trị bằng cách sử dụng Integral Image. Hình 3. Các kiểu đặc trưng Haar-like, [5]. (A) Kiểu đặc trưng Two-rectangle (cấu tạo bởi hai vùng hình chữ nhật); (B) và (C) là hai kiểu đặc trưng Three-rectangle; (D) Kiểu đặc trưng Four- rectangle. Hình 4.Ví dụ đặc trưng Haar-like của ảnh khuôn mặt. Đây là những đặc trưng đầu tiên được chọn trong quá trình huấn luyện, [5]. Hình 4 là ví dụ đặc trưng Haar-like trên vùng ảnh khuôn mặt (Sub-Window). Đã có nhiều nghiên cứu mở rộng, cải tiến tập đặc trưng Haar-like. Lienhart và cộng sự đưa ra tập đặc trưng Haar-like mở rộng [7] với 14 loại đặc trưng bằng cách thêm vào các đặc trưng xoay 45o, Hình 4. Chúng tôi sử dụng tập đặc trưng mở rộng này. Mỗi bộ phân lớp ứng với mỗi nút trong cấu trúc Cascade được tạo ra bởi quá trình huấn luyện sử dụng thuật toán AdaBoost [8]. Thuật toán AdaBoost thực hiện T lần lặp để chọn ra T bộ phân loại yếu rồi kết hợp lại thành một bộ phân loại mạnh. Thuật toán AdaBoost được sử dụng vừa để chọn bộ phân loại yếu Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 106 tốt nhất tại mỗi lần lặp (cũng chính là chọn đặc trưng Haar-like) đồng thời huấn luyện bộ phân loại mạnh. Quá trình huấn luyện cũng đồng thời huấn luyện cấu trúc Cascade. (a) Các đặc trưng cạnh: (b) Các đặc trưng đường: (c) Các đặc trưng bao quanh tâm: Hình 4. Tập đặc trưng Haar-like mở rộng, [7]. KHẢO SÁT THỰC NGHIỆM ĐÁNH GIÁ HIỆU QUẢ CỦA HỆ THỐNG ĐỀ XUẤT Để đánh giá tính khả thi và hiệu quả dự kiến của giải pháp đã trình bày ở phần 3, chúng tôi tiến hành thử nghiệm phương pháp Viola- Jones trong môi trường lớp học. Hiệu quả của phương pháp phát hiện khuôn mặt càng cao thì hiệu quả của giải pháp đã đề xuất càng cao. Việc thử nghiệm được tiến hành trong môi trường lớp học tại Trường Đại học Công nghệ thông tin và Truyền thông – Đại học Thái Nguyên. Mô tả thử nghiệm Để có được tập ảnh phục vụ việc thử nghiệm phát hiện khuôn mặt, chúng tôi tiến hành bằng cách đến từng lớp học chụp ảnh học sinh, sinh viên trong giờ học. Trường Đại học Công nghệ thông tin và truyền thông hiện nay có tất cả 4 giảng đường với 31 phòng học phục vụ cho việc học tập trên lớp đó là: C2, C3, C4, và KT (Ký túc). Trong điều kiện cho phép của nhóm nghiên cứu chúng tôi sử dụng máy ảnh Canon PowerShot A580, độ phân giải 8.0 Megapixels, kích thước ảnh thu nhận 3264x2448 pixels. Việc thử nghiệm với loại máy ảnh có cấu hình và chất lượng thấp như thế này nếu cho kết quả khả thi thì khi áp dụng với máy ảnh và camera tốt hơn sẽ còn cho kết quả tốt hơn. Chúng tôi thu thập ảnh lớp học ở tất cả các điều kiện môi trường khác nhau xuất hiện trong trường. Tại mỗi phòng học, chúng tôi chụp nhiều lần tại các thời điểm khác nhau với điều kiện ánh sáng khác nhau, trạng thái sinh viên trong lớp khác nhau. Dữ liệu được thu tại tất cả các giảng đường. Ở mỗi giảng đường, chúng tôi thu dữ liệu ở các phòng học ở mỗi tầng có điều kiện môi trường khác nhau (số lượng bóng đèn chiếu sáng, vị trí bố trí các bóng đèn chiếu sáng, khung cảnh bên ngoài phòng học ảnh hưởng đến ánh sáng trong phòng...). Việc lấy dữ liệu ở tất cả các giảng đường, phòng học với tất cả các môi trường khác nhau nhằm đảm bảo độ tin cậy của kết quả thực nghiệm và các phân tích, kết luận. Tổng số ảnh thu được là 219 với 4600 lượt sinh viên xuất hiện. Với bộ ảnh thu thập được tại các lớp học, chúng tôi xây dựng chương trình thử nghiệm dựa trên bộ thư viện mã nguồn mở OpenCV 2.0 để phát hiện khuôn mặt. Các bộ phát hiện đã được huấn luyện kèm theo thư viện OpenCV 2.0 được sử dụng. Chúng tôi xây dựng công cụ hỗ trợ đánh dấu thủ công những vị trí có khuôn mặt sinh viên trong ảnh để tạo dữ liệu ground truth phục vụ việc thử nghiệm. Tất cả dữ liệu và các công cụ do chúng tôi chuẩn bị có thể được tham khảo cho mục đích học tập, nghiên cứu. (Hãy gửi email yêu cầu cho tác giả số 1 khi cần: ntttam@ictu.edu.vn). Phương pháp đánh giá Để đánh giá hiệu quả của phương pháp Viola- Jones trong môi trường lớp học cho việc phát hiện sinh viên thông qua phát hiện khuôn mặt, chúng tôi sử dụng độ đo Precision-Recall [9] được sử dụng rộng rãi trong lĩnh vực tra cứu thông tin (Information Retrival). Gọi NP là số lượt sinh viên thực tế xuất hiện trong cơ sở dữ liệu thử nghiệm, NT là số lượng khuôn mặt phát hiện đúng, NF là số lượng khuôn mặt phát hiện sai. Khi đó: Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 107 Recall được gọi là độ thu hồi, là tỷ lệ giữa số lượng phát hiện đúng trên số lượng đối tượng thực tế có trong cơ sở dữ liệu thử nghiệm. Precision gọi là độ chính xác, là tỷ lệ giữa số lượng phát hiện đúng trên tổng số đối tượng do chương trình phát hiện ra. F là một độ đo phối hợp giữa Precision và Recall. Cùng với phương pháp đánh giá trên đây, chúng tôi đề xuất một phương pháp đánh giá mức độ hiệu quả của việc áp dụng bước tự động phát hiện khuôn mặt như sau: Ta gọi việc người sử dụng xác định bằng tay một đối tượng có phải là khuôn mặt (sinh viên) hay không là một “thao tác”. Như vậy, với hệ thống không áp dụng phương pháp phát hiện khuôn mặt tự động mà người dùng thực hiện xác định hoàn toàn bằng tay thì số thao tác là NP. Còn trong trường hợp sử dụng phương pháp phát hiện khuôn mặt rồi hiệu chỉnh thì số thao tác của người dùng ở bước hiệu chỉnh là NF + (NP-NT), tức là số thao tác để loại bỏ những phát hiện sai (NF) cộng với số thao tác để xác định thêm những đối tượng còn thiếu (NP-NT). Gọi H là hiệu quả của việc áp dụng bước phát hiện khuôn mặt, được tính là tỷ lệ giữa số thao tác giảm đi khi áp dụng bước phát hiện khuôn mặt so với số thao tác bình thường phải thực hiện khi không áp dụng. Kết quả thử nghiệm và nhận xét Bảng 1 trình bày kết quả đánh giá dưới dạng Precision-Recall của bước tự động phát hiện sinh viên thông qua phát hiện khuôn mặt. Bảng 2 trình bày kết quả đánh giá hiệu quả của bước này theo cách chúng tôi đề xuất trong phần 4.2. Trong thí nghiệm này, phương tiện và điều kiện thu nhận ảnh thử nghiệm chưa tốt (máy ảnh cấu hình thấp, chụp ở vị trí thấp dẫn đến nhiều sinh viên phía dưới bị che khuất mặt). Hơn nữa, với mục tiêu đánh giá khách quan, ảnh được thu nhận trong môi trường thực tế nên nhiều khuôn mặt bị nghiêng, che khuất. Tuy nhiên bộ phát hiện khuôn mặt đã phát hiện khá tốt các khuôn mặt rõ, không bị che khuất. Trong các bảng số liệu trình bày ở trên, NP là số lượt sinh viên xuất hiện, kể cả những trường hợp bị che khuất. Chúng tôi sử dụng trên số liệu này với mục đích đánh giá hiệu quả của bộ phát hiện khuôn mặt tác động lên hệ thống thống kê số lượng sinh viên chứ không đánh giá hiệu quả phát hiện khuôn mặt trên tập khuôn mặt đầu vào. Kết quả cho thấy khi sử dụng bộ phát hiện khuôn mặt, công sức cần bỏ ra thực hiện bước xác định sinh viên trong ảnh giảm 38%. Nếu hệ thống thu nhận ảnh là camera gắn cố định ở vị trí cao, thuận lợi trong lớp thì số khuôn mặt bị che khuất sẽ ít, tỷ lệ tự động phát hiện sẽ cao hơn và mang lại hiệu quả tốt hơn. Bảng 1. Đánh giá dạng Precision-Recall bước phát hiện tự động Chỉ số Giá trị NP 4600 NT 2466 NF 737 Recall 0.54 Precision 0.77 F-measure 0.63 Bảng 2. Đánh giá hiệu quả bước phát hiện tự động. Chỉ số Giá trị Số thao tác khi không áp dụng bước tự động phát hiện khuôn mặt 4600 Số thao tác giảm khi sau khi áp dụng bước tự động phát hiện khuôn mặt 1729 H 38% Hơn nữa, ngay cả trong trường hợp không sử dụng phương pháp phát hiện khuôn mặt tự động mà thực hiện thủ công bằng cách người dùng chỉ ra trên ảnh dựa vào phần mềm với giao diện thân thiện thì đã tốt hơn cách truyền thống. Việc thu thập ảnh trên lớp nhanh hơn, giảm việc gây ảnh hưởng đến lớp. Phần mềm với giao diện thân thiện giúp thao tác dễ dàng, nhanh, chính xác. Hệ thống cũng mở ra nhiều khả năng phối hợp, khai thác thông tin trong toàn trường. Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108 108 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO Qua nghiên cứu, khảo sát thực tế và phân tích, chúng tôi đã đề xuất một giải pháp cho bài toán thống kê số lượng sinh viên dự lớp dựa trên việc thu thập dữ liệu thông qua hình ảnh sử dụng phương pháp Viola-Jones phát hiện khuôn mặt. Chúng tôi đã tiến hành thực nghiệm, phân tích đánh giá khách quan trong môi trường thực tế. Kết quả thực nghiệm cho thấy giải pháp đã đề xuất là khả thi, có triển vọng. Trong tương lai, chúng tôi sẽ tiếp tục nghiên cứu kết hợp các kỹ thuật khác và tối ưu hóa các tham số sao cho phù hợp với điều kiện áp dụng để nâng cao hiệu quả bước phát hiện khuôn mặt. Một dự án triển khai hệ thống cũng được dự kiến trong điều kiện cho phép. TÀI LIỆU THAM KHẢO [1]. C. Zhang and Z. Zhang, “A Survey of Recent Advances in Face Detection, Microsoft Research Technical Report MSR-TR-2010-66,” 2010. [2]. P. Viola and M. J. Jones, “Robust Real-Time Face Detection,” International Journal of Computer Vision, vol. 57, no. 2, pp. 137–154, May 2004. [3]. V. Nguyen, T. Le, T. Tran, R. Mullot, and V. Courboulay, “A method for hand detection based on Internal Haar-like features and Cascaded AdaBoost Classifier,” in The International Conference on Communications and Electronics (ICCE), 2012, pp. 608–613. [4]. “Microsoft Academic Search,” [5]. P. Viola and M. Jones, “Rapid object detection using a boosted cascade of simple features,” in Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR 2001, 2001, pp. 511–518. [6]. P. Viola and M. Jones, “Robust Real-time Object Detection,” 2001. [7]. R. Lienhart and J. Maydt, “An extended set of Haar-like features for rapid object detection,” in Proceedings. International Conference on Image Processing, 2002, pp. 900–903. [8]. Y. Freund and R. E. Schapire, “A Decision- Theoretic Generalization of On-Line Learning and an Application to Boosting,” Journal of Computer and System Sciences, vol. 55, no. 1, pp. 119–139, Aug. 1997. [9]. V. Raghavan, P. Bollmann, and G. S. Jung, “A critical investigation of recall and precision as measures of retrieval system performance,” ACM Transactions on Information Systems, vol. 7, no. 3, pp. 205–229, Jul. 1989. SUMMARY A NEW SOLUTION TO THIS SHEET STATISTICS NUMBER OF PROJECTED GRADE STUDENTS USING FACE DETECTION METHODS Nguyen Thi Thanh Tam*, Nguyen Van Toi, Nguyen Thi Tinh, Le Thu Trang College of Information and Communication Technology - TNU Counting students’ attendances at lectures is a real demand of many universities. The existing way of acknowledging students’ attendances is to count manually and directly the number of students in the classroom. This work is annoying and time-consuming, and affects the lectures negatively. In this paper, we propose a solution for this problem based on face detection. We also present the experimental results of Viola-Jones-face-detection method on the real classroom environment and present the analysis and evaluation of the ability to apply Viola-Jones method into the stated problem. The experimental results and the analysis show that the proposed solution is feasible. Keywords: statistical problem, face detection methods, Viola-Jones Ngày nhận bài:2/11/2012, ngày phản biện:18/11/2012, ngày duyệt đăng:10/12/2012 * Tel: 0973 002640, Email: ntttam@ictu.edu.vn

Các file đính kèm theo tài liệu này:

brief_36956_40539_203201316192103_1601_2052161.pdf