KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU
TIẾP THEO
Qua nghiên cứu, khảo sát thực tế và phân tích,
chúng tôi đã đề xuất một giải pháp cho bài
toán thống kê số lượng sinh viên dự lớp dựa
trên việc thu thập dữ liệu thông qua hình ảnh
sử dụng phương pháp Viola-Jones phát hiện
khuôn mặt. Chúng tôi đã tiến hành thực
nghiệm, phân tích đánh giá khách quan trong
môi trường thực tế. Kết quả thực nghiệm cho
thấy giải pháp đã đề xuất là khả thi, có triển
vọng. Trong tương lai, chúng tôi sẽ tiếp tục
nghiên cứu kết hợp các kỹ thuật khác và tối
ưu hóa các tham số sao cho phù hợp với điều
kiện áp dụng để nâng cao hiệu quả bước phát
hiện khuôn mặt. Một dự án triển khai hệ
thống cũng được dự kiến trong điều kiện
cho phép.
6 trang |
Chia sẻ: thucuc2301 | Lượt xem: 569 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt - Nguyễn Thị Thanh Tâm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
103
MỘT GIẢI PHÁP MỚI CHO BÀI TOÁN THỐNG KÊ SỐ LƯỢNG SINH VIÊN
DỰ LỚP SỬ DỤNG PHƯƠNG PHÁP PHÁT HIỆN KHUÔN MẶT
Nguyễn Thị Thanh Tâm*, Nguyễn Văn Tới,
Nguyễn Thị Tính, Lê Thu Trang
Trường Đại học Công nghệ thông tin và Truyền thông – ĐH Thái Nguyên
TÓM TẮT
Thống kê số lượng sinh viên dự lớp là một nhu cầu thực tế đặt ra tại các trường đại học. Hiện nay,
phương pháp thu thập số liệu một cách độc lập về số lượng sinh viên dự lớp vẫn được thực hiện
thủ công bằng cách đếm trực tiếp tại lớp học. Đây là công việc tốn thời gian và gây phiền toái, ảnh
hưởng đến giờ học nên việc thu thập dữ liệu một cách độc lập vẫn chưa được thực hiện thường
xuyên. Trong bài báo này, chúng tôi đề xuất việc sử dụng phương pháp phát hiện khuôn mặt từ
ảnh để đếm số sinh viên dự lớp. Chúng tôi đã thực nghiệm việc áp dụng phương pháp phát hiện
khuôn mặt của Viola-Jones trong môi trường lớp học từ đó phân tích, đánh giá khả năng áp dụng trên
thực tế. Kết quả thực nghiệm, phân tích cho thấy giải pháp chúng tôi đề xuất là khả thi, đúng hướng.
Từ khóa: bài toán thống kê, phương pháp phát hiện khuôn mặt, Viola-Jones
GIỚI THIỆU*
Hầu hết các trường đại học đều có nhu cầu
thống kê, phân tích số lượng sinh viên dự lớp.
Số liệu này giúp các bộ phận quản lý nắm
được tình hình tham gia học tập của sinh viên
từng lớp, mức độ hấp dẫn của bài giảng và
nhiều khía cạnh khác.
Hiện nay việc thu thập dữ liệu về số lượng
sinh viên dự lớp một cách độc lập, với mật độ
đủ lớn hầu như vẫn chưa được thực hiện bởi
vì những khó khăn, phiền phức. Với cách làm
hiện tại, việc thu thập dữ liệu thường được
thực hiện bởi các nhân viên bằng cách đi đến
đếm trực tiếp tại các lớp vào giờ học. Cách
làm này tốn công sức, nhân lực đồng thời gây
gián đoạn, ảnh hưởng đến giờ học. Việc đếm
trực tiếp trong hoàn cảnh phải nhanh chóng
để đỡ ảnh hưởng đến lớp học cũng dẫn đến
sai sót. Vì vậy, chúng tôi đề xuất một giải
pháp mới cho việc thu thập dữ liệu đó là sử
dụng máy ảnh hoặc camera kỹ thuật số để thu
ảnh lớp học rồi sử dụng hệ thống tự động phát
hiện khuôn mặt để hỗ trợ việc thu thập số liệu
một cách nhanh chóng và chính xác.
Trong những năm gần đây, phát hiện và nhận
dạng khuôn mặt là chủ đề nghiên cứu thu hút
sự quan tâm của nhiều nhà khoa học cả trên
khía cạnh nghiên cứu phương pháp cơ bản
cũng như các nghiên cứu ứng dụng. Đã có
*
Tel: 0973 002640, Email: ntttam@ictu.edu.vn
nhiều phương pháp phát hiện, nhận dạng
khuôn mặt được nghiên cứu và đề xuất [1].
Trong đó, phương pháp Viola-Jones [2] được
đánh giá là phương pháp tốt và được sử dụng
rộng rãi hiện nay [3]. Theo thống kê và xếp
hạng của Microsoft Academic Search [4], bài
báo đầu tiên trình bày phương pháp Viola-
Jones [5] được trích dẫn 3279 lượt (số liệu
ngày 10/11/2012) và số lượng trích dẫn vẫn
đang liên tục tăng. Bài báo này xếp thứ mười
về số lượng trích dẫn trong lĩnh vực thị giác
máy tính, đứng thứ nhất trong bài toán phát
hiện khuôn mặt và phát hiện đối tượng. Các
bài báo khác về phương pháp này [6][2] đều
có hàng nghìn lượt trích dẫn. Điều đó chứng
tỏ phương pháp Viola-Jones ngày càng được
đánh giá cao và sử dụng rộng rãi. Ở bài báo
này, chúng tôi nghiên cứu áp dụng phương
pháp Viola-Jones trong việc đếm số lượng
sinh viên dự lớp.
Những đóng góp của chúng tôi trình bày
trong bài báo này bao gồm:
- Đề xuất giải pháp mới cho bài toán thống kê
số lượng sinh viên dự lớp sử dụng phương
pháp phát hiện khuôn mặt;
- Đánh giá hiệu quả của phương pháp Viola-
Jones trong môi trường lớp học thông qua
thực nghiệm từ đó đưa ra kết luận về tính khả
thi và hiệu quả của giải pháp đã đề xuất.
Phần còn lại của bài báo được trình bày theo
cấu trúc như sau: Phần 2 trình bày giải pháp
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
104
giải quyết bài toán thống kê số lượng sinh
viên dự lớp sử dụng phương pháp phát hiện
khuôn mặt. Phần 3 giới thiệu sơ lược phương
pháp Viola-Jones mà chúng tôi sử dụng. Phần
4 trình bày kết quả thực nghiệm và những
phân tích kết luận của chúng tôi khi áp dụng
phương pháp Viola-Jones trong môi trường
lớp học. Kết luận và hướng nghiên cứu tiếp
theo được trình bày trong phần 5.
ĐỀ XUẤT GIẢI PHÁP GIẢI QUYẾT BÀI
TOÁN THỐNG KÊ SỐ LƯỢNG SINH
VIÊN DỰ LỚP
Hình 1 là sơ đồ mô tả giải pháp mà chúng tôi
đề xuất. Dưới đây là mô tả chi tiết từng bước
trong sơ đồ:
Thu thập ảnh dữ liệu lớp học: Thay vì trực
tiếp đếm số lượng sinh viên trên lớp như cách
làm truyền thống, chúng tôi đề xuất hai
cách làm tùy theo điều kiện cơ sở vật chất
nơi áp dụng.
Cách 1: Nhân viên thu thập dữ liệu sử dụng
máy ảnh kỹ thuật số để chụp ảnh lớp học. Với
công nghệ hiện nay, có những loại máy ảnh
có góc chụp rộng cho phép thu được ảnh chứa
toàn bộ sinh viên từ cửa lớp. Dữ liệu ảnh thu
được là đầu vào cho bước tự động phát hiện
khuôn mặt và hiệu chỉnh kết quả. Ưu điểm
của cách làm này so với cách làm truyền
thống là không làm mất nhiều thời gian, hạn
chế đến mức thấp nhất làm gián đoạn việc
dạy và học.
Cách 2: Sử dụng hệ thống camera gắn tại các
phòng học. Việc sử dụng camera để thu thập
ảnh dữ liệu sẽ mang lại hiệu quả cao hơn. Dữ
liệu ảnh được thu nhận tức thời tại thời điểm
mong muốn trong khi các tiết học đang diễn
ra thông qua hệ thống mạng. Cách làm này
không làm ảnh hưởng đến giờ học. Trong
trường hợp này, cần trang bị hệ thống camera
nhưng bù lại không cần nhân viên đi chụp ảnh.
Xử lý phát hiện khuôn mặt: Sau khi đã có dữ
liệu ảnh lớp học, hệ thống sẽ nhận ảnh đầu
vào và tự động phát hiện khuôn mặt. Bước
này được thực hiện bởi một chức năng trong
chương trình phần mềm sẽ được xây dựng.
Kết quả ảnh đầu ra được hiển thị với các vùng
được đánh dấu được cho là khuôn mặt (có thể
đúng hoạc sai). Như đã phân tích trong phần
1, chúng tôi đề xuất sử dụng phương pháp
Viola-Jones cho chức năng này.
Hình 1. Mô hình hoạt động của hệ thống thống kê
số lượng sinh viên dự lớp sử dụng phương pháp
phát hiện khuôn mặt
Hiệu chỉnh kết quả phát hiện khuôn mặt: Ảnh
đầu vào thu nhận trong môi trường thực tế có
nhiều yếu tố phức tạp như tư thế ngồi của
sinh viên khác nhau (hướng của khuôn mặt,
người trước ngồi lấp mặt ngườisau...). Chức
năng tự động phát hiện khuôn mặt có thể thực
hiện không chính xác, nhầm hoặc bỏ sót. Hiện
nay, chưa có phương pháp phát hiện khuôn
mặt được đúng 100%. Chức năng hiệu chỉnh
kết quả tự động phát hiện khuôn mặt được
thực hiện bởi người quản lý chương trình một
cách dễ dàng, nhanh chóng với các thao tác
click chọn trên ảnh.
Lưu trữ số lượng sinh viên dự lớp: Sau khi
người quản lý hiệu chỉnh lại kết quả của việc
phát hiện khuôn mặt để thu được kết quả
chính xác, số liệu này được tổ chức lưu trữ
trong cơ sở dữ liệu được thiết kế hợp lý và có
thể phối hợp với các hệ thống khác liên quan.
Những vị trí khuôn mặt trên ảnh cũng được
lưu trữ. Tất cả các thông tin có thể được hiển
thị, hiệu chỉnh, khai thác trong tương lai.
Xử lý, phân tích, thống kê số lượng sinh viên
dự lớp: Tùy theo nhu cầu, các chức năng
thống kê, phân tích, báo cáo sẽ được trang bị
trong chương trình. Đây là việc làm mang
tính chuyên môn phục vụ cho tùy từng mục
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
105
đích của việc thống kê số lượng học sinh, sinh
viên. Ngoài ra, các kết quả, số liệu có thể được
sử dụng ở nhiều công việc khác tiếp theo.
PHƯƠNG PHÁP VIOLA -JONES
Năm 2001, Paul Viola và cộng sự công bố
một phương pháp phát hiện đối tượng theo
hướng tiếp cận học máy sử dụng Boosted
Cascade của các đặc trưng Haar-like [5].
Phương pháp ban đầu nhằm mục đích giải
quyết bài toán phát hiện khuôn mặt. Phương
pháp này kết hợp nhiều bộ phân lớp trong một
cấu trúc Cascade, Hình 2. Mỗi nút của cấu
trúc Cascade là một bộ phân lớp. Ở đây, bộ
phân lớp thực hiện phân một đối tượng vào
một trong hai lớp: là khuôn mặt hoặc không là
khuôn mặt.
Hình 2.Cấu trúc Cascade,[5].
Quá trình phát hiện khuôn mặt trên một ảnh
đầu vào sẽ diễn ra như sau: tất cả các vùng
hình chữ nhật (Sub-Window) ở tất cả các vị
trí và với tất cả các kích thước được xem xét.
Với một Sub-Window, nó được đưa vào nút
đầu tiên của Cascade, nếu nút này xác định
Sub-Window là khuôn mặt thì nó được đưa
qua nút tiếp theo, nếu không thì kết luận Sub-
Window này không phải là khuôn mặt. Một
Sub-Window được kết luận là khuôn mặt nếu
được lần lượt chấp nhận ở tất cả các nút. Các
bộ phân lớp ứng với các nút của Cascade sử
dụng đặc trưng Haar-like, Hình 3.
Giá trị đặc trưng Haar-like là chênh lệch giữa
tổng giá trị điểm ảnh thuộc vùng trắng và
tổng giá trị điểm ảnh thuộc vùng xám. Một
đặc trưng Haar-like của một ảnh được xác
định bởi kiểu đặc trưng, kích thước và vị trí
trên ảnh. Tổng số đặc trưng của ảnh là rất lớn,
lớn hơn nhiều so với số lượng điểm ảnh. Ví
dụ, với ảnh kích thước 24x24 thì số đặc trưng
là hơn 180.000. Tuy nhiên, giá trị các đặc
trưng Haar-like được tính toán rất nhanh và
thời gian tính là bằng nhau cho mỗi giá trị
bằng cách sử dụng Integral Image.
Hình 3. Các kiểu đặc trưng Haar-like, [5]. (A)
Kiểu đặc trưng Two-rectangle (cấu tạo bởi hai
vùng hình chữ nhật); (B) và (C) là hai kiểu đặc
trưng Three-rectangle; (D) Kiểu đặc trưng Four-
rectangle.
Hình 4.Ví dụ đặc trưng Haar-like của ảnh khuôn
mặt. Đây là những đặc trưng đầu tiên được chọn
trong quá trình huấn luyện, [5].
Hình 4 là ví dụ đặc trưng Haar-like trên vùng
ảnh khuôn mặt (Sub-Window). Đã có nhiều
nghiên cứu mở rộng, cải tiến tập đặc trưng
Haar-like. Lienhart và cộng sự đưa ra tập đặc
trưng Haar-like mở rộng [7] với 14 loại đặc
trưng bằng cách thêm vào các đặc trưng xoay
45o, Hình 4. Chúng tôi sử dụng tập đặc trưng
mở rộng này.
Mỗi bộ phân lớp ứng với mỗi nút trong cấu
trúc Cascade được tạo ra bởi quá trình huấn
luyện sử dụng thuật toán AdaBoost [8]. Thuật
toán AdaBoost thực hiện T lần lặp để chọn ra
T bộ phân loại yếu rồi kết hợp lại thành một
bộ phân loại mạnh. Thuật toán AdaBoost
được sử dụng vừa để chọn bộ phân loại yếu
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
106
tốt nhất tại mỗi lần lặp (cũng chính là chọn
đặc trưng Haar-like) đồng thời huấn luyện bộ
phân loại mạnh. Quá trình huấn luyện cũng
đồng thời huấn luyện cấu trúc Cascade.
(a) Các đặc trưng cạnh:
(b) Các đặc trưng đường:
(c) Các đặc trưng bao quanh tâm:
Hình 4. Tập đặc trưng Haar-like mở rộng, [7].
KHẢO SÁT THỰC NGHIỆM ĐÁNH GIÁ
HIỆU QUẢ CỦA HỆ THỐNG ĐỀ XUẤT
Để đánh giá tính khả thi và hiệu quả dự kiến
của giải pháp đã trình bày ở phần 3, chúng tôi
tiến hành thử nghiệm phương pháp Viola-
Jones trong môi trường lớp học. Hiệu quả của
phương pháp phát hiện khuôn mặt càng cao
thì hiệu quả của giải pháp đã đề xuất càng
cao. Việc thử nghiệm được tiến hành trong
môi trường lớp học tại Trường Đại học Công
nghệ thông tin và Truyền thông – Đại học
Thái Nguyên.
Mô tả thử nghiệm
Để có được tập ảnh phục vụ việc thử nghiệm
phát hiện khuôn mặt, chúng tôi tiến hành
bằng cách đến từng lớp học chụp ảnh học
sinh, sinh viên trong giờ học. Trường Đại học
Công nghệ thông tin và truyền thông hiện nay
có tất cả 4 giảng đường với 31 phòng học
phục vụ cho việc học tập trên lớp đó là: C2,
C3, C4, và KT (Ký túc). Trong điều kiện cho
phép của nhóm nghiên cứu chúng tôi sử dụng
máy ảnh Canon PowerShot A580, độ phân
giải 8.0 Megapixels, kích thước ảnh thu nhận
3264x2448 pixels. Việc thử nghiệm với loại
máy ảnh có cấu hình và chất lượng thấp như
thế này nếu cho kết quả khả thi thì khi áp
dụng với máy ảnh và camera tốt hơn sẽ còn
cho kết quả tốt hơn.
Chúng tôi thu thập ảnh lớp học ở tất cả các
điều kiện môi trường khác nhau xuất hiện
trong trường. Tại mỗi phòng học, chúng tôi
chụp nhiều lần tại các thời điểm khác nhau
với điều kiện ánh sáng khác nhau, trạng thái
sinh viên trong lớp khác nhau. Dữ liệu được
thu tại tất cả các giảng đường. Ở mỗi giảng
đường, chúng tôi thu dữ liệu ở các phòng học
ở mỗi tầng có điều kiện môi trường khác nhau
(số lượng bóng đèn chiếu sáng, vị trí bố trí
các bóng đèn chiếu sáng, khung cảnh bên
ngoài phòng học ảnh hưởng đến ánh sáng
trong phòng...). Việc lấy dữ liệu ở tất cả các
giảng đường, phòng học với tất cả các môi
trường khác nhau nhằm đảm bảo độ tin cậy
của kết quả thực nghiệm và các phân tích, kết
luận. Tổng số ảnh thu được là 219 với 4600
lượt sinh viên xuất hiện.
Với bộ ảnh thu thập được tại các lớp học,
chúng tôi xây dựng chương trình thử nghiệm
dựa trên bộ thư viện mã nguồn mở OpenCV
2.0 để phát hiện khuôn mặt. Các bộ phát hiện
đã được huấn luyện kèm theo thư viện
OpenCV 2.0 được sử dụng. Chúng tôi xây
dựng công cụ hỗ trợ đánh dấu thủ công những
vị trí có khuôn mặt sinh viên trong ảnh để tạo
dữ liệu ground truth phục vụ việc thử nghiệm.
Tất cả dữ liệu và các công cụ do chúng tôi
chuẩn bị có thể được tham khảo cho mục đích
học tập, nghiên cứu. (Hãy gửi email yêu cầu
cho tác giả số 1 khi cần: ntttam@ictu.edu.vn).
Phương pháp đánh giá
Để đánh giá hiệu quả của phương pháp Viola-
Jones trong môi trường lớp học cho việc phát
hiện sinh viên thông qua phát hiện khuôn mặt,
chúng tôi sử dụng độ đo Precision-Recall [9]
được sử dụng rộng rãi trong lĩnh vực tra cứu
thông tin (Information Retrival). Gọi NP là số
lượt sinh viên thực tế xuất hiện trong cơ sở dữ
liệu thử nghiệm, NT là số lượng khuôn mặt
phát hiện đúng, NF là số lượng khuôn mặt
phát hiện sai. Khi đó:
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
107
Recall được gọi là độ thu hồi, là tỷ lệ giữa số
lượng phát hiện đúng trên số lượng đối tượng
thực tế có trong cơ sở dữ liệu thử nghiệm.
Precision gọi là độ chính xác, là tỷ lệ giữa số
lượng phát hiện đúng trên tổng số đối tượng
do chương trình phát hiện ra. F là một độ đo
phối hợp giữa Precision và Recall.
Cùng với phương pháp đánh giá trên đây,
chúng tôi đề xuất một phương pháp đánh giá
mức độ hiệu quả của việc áp dụng bước tự
động phát hiện khuôn mặt như sau:
Ta gọi việc người sử dụng xác định bằng tay
một đối tượng có phải là khuôn mặt (sinh
viên) hay không là một “thao tác”. Như vậy,
với hệ thống không áp dụng phương pháp
phát hiện khuôn mặt tự động mà người dùng
thực hiện xác định hoàn toàn bằng tay thì số
thao tác là NP. Còn trong trường hợp sử dụng
phương pháp phát hiện khuôn mặt rồi hiệu
chỉnh thì số thao tác của người dùng ở bước
hiệu chỉnh là NF + (NP-NT), tức là số thao
tác để loại bỏ những phát hiện sai (NF) cộng
với số thao tác để xác định thêm những đối
tượng còn thiếu (NP-NT). Gọi H là hiệu quả
của việc áp dụng bước phát hiện khuôn mặt,
được tính là tỷ lệ giữa số thao tác giảm đi khi
áp dụng bước phát hiện khuôn mặt so với số
thao tác bình thường phải thực hiện khi không
áp dụng.
Kết quả thử nghiệm và nhận xét
Bảng 1 trình bày kết quả đánh giá dưới dạng
Precision-Recall của bước tự động phát hiện
sinh viên thông qua phát hiện khuôn mặt.
Bảng 2 trình bày kết quả đánh giá hiệu quả
của bước này theo cách chúng tôi đề xuất
trong phần 4.2.
Trong thí nghiệm này, phương tiện và điều
kiện thu nhận ảnh thử nghiệm chưa tốt (máy
ảnh cấu hình thấp, chụp ở vị trí thấp dẫn đến
nhiều sinh viên phía dưới bị che khuất mặt).
Hơn nữa, với mục tiêu đánh giá khách quan,
ảnh được thu nhận trong môi trường thực tế
nên nhiều khuôn mặt bị nghiêng, che khuất.
Tuy nhiên bộ phát hiện khuôn mặt đã phát
hiện khá tốt các khuôn mặt rõ, không bị che
khuất. Trong các bảng số liệu trình bày ở trên,
NP là số lượt sinh viên xuất hiện, kể cả những
trường hợp bị che khuất. Chúng tôi sử dụng
trên số liệu này với mục đích đánh giá hiệu
quả của bộ phát hiện khuôn mặt tác động lên
hệ thống thống kê số lượng sinh viên chứ
không đánh giá hiệu quả phát hiện khuôn mặt
trên tập khuôn mặt đầu vào. Kết quả cho thấy
khi sử dụng bộ phát hiện khuôn mặt, công sức
cần bỏ ra thực hiện bước xác định sinh viên
trong ảnh giảm 38%. Nếu hệ thống thu nhận
ảnh là camera gắn cố định ở vị trí cao, thuận
lợi trong lớp thì số khuôn mặt bị che khuất sẽ
ít, tỷ lệ tự động phát hiện sẽ cao hơn và mang
lại hiệu quả tốt hơn.
Bảng 1. Đánh giá dạng Precision-Recall bước
phát hiện tự động
Chỉ số Giá trị
NP 4600
NT 2466
NF 737
Recall 0.54
Precision 0.77
F-measure 0.63
Bảng 2. Đánh giá hiệu quả bước phát hiện
tự động.
Chỉ số Giá trị
Số thao tác khi không áp dụng bước
tự động phát hiện khuôn mặt
4600
Số thao tác giảm khi sau khi áp dụng
bước tự động phát hiện khuôn mặt
1729
H 38%
Hơn nữa, ngay cả trong trường hợp không sử
dụng phương pháp phát hiện khuôn mặt tự
động mà thực hiện thủ công bằng cách người
dùng chỉ ra trên ảnh dựa vào phần mềm với
giao diện thân thiện thì đã tốt hơn cách truyền
thống. Việc thu thập ảnh trên lớp nhanh hơn,
giảm việc gây ảnh hưởng đến lớp. Phần mềm
với giao diện thân thiện giúp thao tác dễ dàng,
nhanh, chính xác. Hệ thống cũng mở ra nhiều
khả năng phối hợp, khai thác thông tin trong
toàn trường.
Nguyễn Thị Thanh Tâm và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 99(11): 103 - 108
108
KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU
TIẾP THEO
Qua nghiên cứu, khảo sát thực tế và phân tích,
chúng tôi đã đề xuất một giải pháp cho bài
toán thống kê số lượng sinh viên dự lớp dựa
trên việc thu thập dữ liệu thông qua hình ảnh
sử dụng phương pháp Viola-Jones phát hiện
khuôn mặt. Chúng tôi đã tiến hành thực
nghiệm, phân tích đánh giá khách quan trong
môi trường thực tế. Kết quả thực nghiệm cho
thấy giải pháp đã đề xuất là khả thi, có triển
vọng. Trong tương lai, chúng tôi sẽ tiếp tục
nghiên cứu kết hợp các kỹ thuật khác và tối
ưu hóa các tham số sao cho phù hợp với điều
kiện áp dụng để nâng cao hiệu quả bước phát
hiện khuôn mặt. Một dự án triển khai hệ
thống cũng được dự kiến trong điều kiện
cho phép.
TÀI LIỆU THAM KHẢO
[1]. C. Zhang and Z. Zhang, “A Survey of Recent
Advances in Face Detection, Microsoft Research
Technical Report MSR-TR-2010-66,” 2010.
[2]. P. Viola and M. J. Jones, “Robust Real-Time
Face Detection,” International Journal of
Computer Vision, vol. 57, no. 2, pp. 137–154,
May 2004.
[3]. V. Nguyen, T. Le, T. Tran, R. Mullot, and V.
Courboulay, “A method for hand detection based
on Internal Haar-like features and Cascaded
AdaBoost Classifier,” in The International
Conference on Communications and Electronics
(ICCE), 2012, pp. 608–613.
[4]. “Microsoft Academic Search,”
[5]. P. Viola and M. Jones, “Rapid object
detection using a boosted cascade of simple
features,” in Proceedings of the 2001 IEEE
Computer Society Conference on Computer Vision
and Pattern Recognition. CVPR 2001, 2001, pp.
511–518.
[6]. P. Viola and M. Jones, “Robust Real-time
Object Detection,” 2001.
[7]. R. Lienhart and J. Maydt, “An extended set of
Haar-like features for rapid object detection,” in
Proceedings. International Conference on Image
Processing, 2002, pp. 900–903.
[8]. Y. Freund and R. E. Schapire, “A Decision-
Theoretic Generalization of On-Line Learning and
an Application to Boosting,” Journal of Computer
and System Sciences, vol. 55, no. 1, pp. 119–139,
Aug. 1997.
[9]. V. Raghavan, P. Bollmann, and G. S. Jung,
“A critical investigation of recall and precision as
measures of retrieval system performance,” ACM
Transactions on Information Systems, vol. 7, no.
3, pp. 205–229, Jul. 1989.
SUMMARY
A NEW SOLUTION TO THIS SHEET STATISTICS NUMBER OF PROJECTED
GRADE STUDENTS USING FACE DETECTION METHODS
Nguyen Thi Thanh Tam*, Nguyen Van Toi,
Nguyen Thi Tinh, Le Thu Trang
College of Information and Communication Technology - TNU
Counting students’ attendances at lectures is a real demand of many universities. The existing way
of acknowledging students’ attendances is to count manually and directly the number of students
in the classroom. This work is annoying and time-consuming, and affects the lectures negatively.
In this paper, we propose a solution for this problem based on face detection. We also present the
experimental results of Viola-Jones-face-detection method on the real classroom environment and
present the analysis and evaluation of the ability to apply Viola-Jones method into the stated
problem. The experimental results and the analysis show that the proposed solution is feasible.
Keywords: statistical problem, face detection methods, Viola-Jones
Ngày nhận bài:2/11/2012, ngày phản biện:18/11/2012, ngày duyệt đăng:10/12/2012
*
Tel: 0973 002640, Email: ntttam@ictu.edu.vn
Các file đính kèm theo tài liệu này:
- brief_36956_40539_203201316192103_1601_2052161.pdf