Đề tài Tinh hiểu hệ thống nhận dạng khuôn mặt
Giới thiệu
Bất kỳ ai đã từng xem show truyền hình “Las Vegas" cũng
đã được xem quá trình hoạt động của phần mềm nhận dạng khuôn mặt.
Trong rất nhiều tập phim, bộ phận an ninh tại khách sạn và sòng bạc
Montecito đã sử dụng hệ thống giám sát qua video của mình và phát hiện
được một kẻ gian lận, một tên trộm hay một kẻ nằm trong danh sách đen.
Sau đó, hệ thống này sẽ quét tất cả cách hình ảnh qua cơ sở dữ liệu để so
sánh và nhận dạng nhân vật. Cuối cùng, tất cả những nhân vật phản diện
đều bị tống khứ khỏi sòng bạc hoặc bị bỏ tù. Tuy nhiên, trong thế giới
thực, không phải mọi thứ đều có vẻ dễ dàng như trên truyền hình.
Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera có
gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về
các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này.
Nhưng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm
2003 do thiếu hiệu quả. Bởi những người sống trong khu vực này đã đeo
mặt nạ và thực hiện hành vi phạm tội khiến cho camera không thể nhận
diện được bất kỳ ai.
9 trang |
Chia sẻ: tlsuongmuoi | Lượt xem: 2282 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Đề tài Tinh hiểu hệ thống nhận dạng khuôn mặt, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1. Giới thiệu Bất kỳ ai đã từng xem show truyền hình “Las Vegas" cũng
đã được xem quá trình hoạt động của phần mềm nhận dạng khuôn mặt.
Trong rất nhiều tập phim, bộ phận an ninh tại khách sạn và sòng bạc
Montecito đã sử dụng hệ thống giám sát qua video của mình và phát hiện
được một kẻ gian lận, một tên trộm hay một kẻ nằm trong danh sách đen.
Sau đó, hệ thống này sẽ quét tất cả cách hình ảnh qua cơ sở dữ liệu để so
sánh và nhận dạng nhân vật. Cuối cùng, tất cả những nhân vật phản diện
đều bị tống khứ khỏi sòng bạc hoặc bị bỏ tù. Tuy nhiên, trong thế giới
thực, không phải mọi thứ đều có vẻ dễ dàng như trên truyền hình.
Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera có
gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về
các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này.
Nhưng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm
2003 do thiếu hiệu quả. Bởi những người sống trong khu vực này đã đeo
mặt nạ và thực hiện hành vi phạm tội khiến cho camera không thể nhận
diện được bất kỳ ai.
Sân bay Logan ở Boston cũng đã nhờ những người tình nguyện thực hiện
hai bài kiểm tra hệ thống nhận diện khuôn mặt riêng biệt tại các điểm
chốt an ninh của sân bay. Sau một khoảng thời gian kiểm tra 3 tháng, kết
quả thu được thật đáng thất vọng. Theo như Trung tâm thông tin bảo mật
điện tử, hệ thống này chỉ đạt tỉ lệ chính xác là 61.4%, buộc các nhà quản
lý sân bay phải tính đến những lựa chọn an ninh khác.
Trong bài báo này, chúng ta sẽ nhìn lại lịch sử của hệ thống nhận diện
khuôn mặt, về những thay đổi nhằm tăng tính hiệu quả của hệ thống này
và cách mà các công ty tư nhân sử dụng (hoặc có kế hoạch sử dụng)
chúng.
Từ khi sinh ra, con người đã có khả năng nhận diện và phân biệt các
khuôn mặt, còn máy tính thì chỉ mới có được khả năng đó trong thời gian
gần đây. Vào khoảng giữa thập niên 60 của thế kỷ trước, các nhà khoa
học đã bắt đầu nghiên cứu để sử dụng máy tính vào việc nhận diện mặt
người. Kể từ đó, phần mềm nhận diện khuôn mặt đã tiến những bước dài.
Hình 1: Phần mềm nhận dạng khuôn mặt của Identix đo những điểm nút
trên khuôn mặt để tạo thành FacePrint và tìm kiếm những đặc điểm này
trong cơ sở dữ liệu
Identix®, một công ty có trụ sở tại Minnesota, là một trong số rất nhiều
nhà phát triển công nghệ nhận diện khuôn mặt. Phần mềm mang tên
FaceIt® của họ có thẻ nhận ra một khuôn mật lẫn trong đám đông, tách
khuôn mặt đó ra khỏi khung cảnh còn lại, và đối chiếu nó với cơ sở dữ
liệu hoặc các hình ảnh đã được lưu sẵn. Để có thể hoạt động được, thì
phần mềm này cần phải biết cách phân biệt giữ một khuôn mặt cơ bản với
khung cảnh xung quanh. Phần mềm nhận diện khuôn mặt dựa trên tính
năng nhận ra một khuôn mặt và đánh giá nhiều đặc điểm của khuôn mặt
này.
Mỗi khuôn mặt đều có nhiều điểm mốc, những phần lồi lõm tạo nên các
đặc điểm của khuôn mặt. FaceIt định nghĩa những điểm này là những
điểm nút. Mỗi mặt người có khoảng 80 điểm nút. Phần mềm này có thể
nhận diện một số diểm nút như sau:
Khoảng cách giữa hai mắt
Chiều rộng của mũi
Độ sâu của hốc mắt
Hình dạng của xương gò má
Độ dài của xương hàm
Các điểm nút trên được đo đạc và tạo ra nhiều mã số được gọi là dấu bộ
mặt ( FacePrint ) đại diện cho khuôn mặt trong cơ sở dữ liệu.
Hình 2: Phần mềm nhận dạng so sánh FacePrint với những hình ảnh khác
trong cơ sở dữ liệu
Trước đây, phần mềm nhận diện khuôn mặt dựa trên hình ảnh 2D để so
sánh hoặc nhận diện một hình ảnh 2D khác từ cơ sở dữ liệu. Và để có
được tính chính xác và hiệu quả cao nhất, hình ảnh nhận diện cần phải là
một khuôn mặt nhìn trực diện vào camera, với góc độ ánh sáng và những
biểu hiện trên nét mặt không khác lắm so với hình ảnh trong cơ sở dữ
liệu. Đìều này gây ra nhiều rắc rối.
Trong phần lớn trường hợp, các hình ảnh thường không được ghi trong
một môi trường ổn định. Thậm chí cả những thay đổi nhỏ nhất trong góc
độ ánh sáng hay độ nghiêng của khuôn mặt cũng đủ để làm giảm tính
hiệu quả của hệ thống, vì thế các khuôn mặt này thường không khớp với
bất kỳ khuôn mặt nào trong cơ sở dữ liệu. Trong phần tiếp theo, chúng ta
sẽ cùng tìm hiểu các cách giải quyết vấn đề này.
2. Nhận diện khuôn mặt 3D
Một xu hướng mới nổi lên trong công nghệ nhận diện khuôn mặt là việc
sử dụng các mẫu 3D, giúp cho việc nhận dạng được chính xác hơn. Một
phần mềm nhận diện khuôn mặt 3D sẽ ghi lại một khuôn mặt thực tế của
một người, rồi dùng các điểm nổi bật trên khuôn mặt – nơi những mô
cứng và xương nhìn thấy rõ nhất như đường cong của hốc mắt, mũi và
cằm -- để nhận ra đối tượng. Các đặc điểm này là độc nhất đối với mỗi
khuôn mặt và không thay đổi theo thời gian.
Cách thức sử dụng độ sâu và trục của các phần trên khuôn mặt không bị
ảnh hưởng bởi ánh sáng, vì thế việc nhận dạng khuôn mặt 3D có thể được
sử dụng cả trong bóng tối và có thể nhận ra khuôn mặt từ nhiều góc độ
khác nhau với độ chênh lệch lên tới 90 độ.
Bằng cách sử dụng phần mềm 3D, hệ thống nhận diện này cần trải qua
một loạt bước để nhận diện một đối tượng.
Nhận dạng
Việc ghi lại một hình ảnh có thể thực hiện bằng cách quét một tấm ảnh
2D sẵn có, hoặc sử dụng video để có được một hình ảnh 3D sống của đối
tượng.
Liên kết
Sau khi đã ghi lại một khuôn mặt, hệ thống này sẽ tính toán vị trí, kích cỡ
và tư thế của đầu. Như đã đề cập từ trước, hệ thống có thể nhận ra một
khuôn mặt ở góc lệch lên tới 90 độ, trong khi với hình ảnh 2D, khuôn mặt
của đối tượng phải nghiêng ít nhất là 35 độ về phía camera.
Đo đạc
Sau đó, hệ thống này sẽ đo đạc những đường cong trên khuôn mặt với độ
chính xác lên tới dưới 1 milimet, rồi tạo một khuôn mẫu.
Hình 3:
Tái hiện
Sau đó, hệ thống sẽ chuyển khuôn mẫu này thành một mã độc nhất với
từng người. Với mỗi khuôn mẫu, mã này có dạng một nhóm các con số
đại diện cho khuôn mặt của một đối tượng.
So sánh
Nếu như hình ảnh này có dạng 3D và cơ sở dữ liệu cũng chứa các hình
ảnh 3D, thì việc đối chiếu có thể tiến hành mà không phải thực hiện bất
kỳ thay đổi nào đối với hình ảnh đó. Tuy vậy, nếu như hình ảnh vẫn ở
dạng 2D thì sẽ có đôi chút khó khăn hơn, bởi công nghệ 3D đem lại hình
ảnh thực và sống động hơn so với một hình ảnh 2D phẳng lì, bất động.
Nhưng công nghệ mới có thể giải quyết được khó khăn này. Ví dụ, phần
bên ngoài và bên trong của con mắt cùng với phần đỉnh mũi sẽ được lấy
ra đo đạc. Sau khi việc đo đạc này hoàn tất, một thuật toán sẽ được áp
dụng để chuyển hình ảnh trong cơ sở dữ liệu sang dạng 2D. Sau khi
chuyển đổi, phần mềm sẽ so sánh hai hình ảnh 2D này với nhau để tìm ra
đối tượng.
Xác minh hay nhận diện
Xác minh có nghĩa là một hình ảnh sẽ được đối chiếu với chỉ 1 hình ảnh
trong cơ sở dữ liệu (tỉ lệ 1:1). Ví dụ như, một hình ảnh của một đối tượng
nào đó sẽ được đối chiếu với một hình ảnh trong cơ sở dữ liệu của Uỷ ban
phương tiện giao thông để xác minh xem đối tượng đó là ai. Còn nhận
diện có nghĩa là một hình ảnh sẽ được đối chiếu với tất cả các hình ảnh
trong cơ sở dữ liệu để tìm ra đối tượng (tỉ lệ 1:N). Khi đó, bạn phải ghi lại
hình ảnh đối tượng và so sánh với toàn bộ cơ sở dữ liệu để biết được đối
tượng đó là ai.
Tiếp theo, chúng ta sẽ tìm hiểu xem công nghệ sinh trắc học về da giúp
ích gì trong việc nhận dạng này.
3. Phân tích cấu trúc bề mặt (STA – Surface Texture Analysis )
Nhiều khi hình ảnh không thể được xác minh hay nhận đạng chỉ bằng
công nghệ nhận dạng nét mặt. Identix® đã tạo ra một sản phẩm mới để
giúp cho việc nhận diện chính xác hơn. Phần mềm FaceIt®Argus của họ
sử dụng công nghệ sinh trắc học về da, dựa trên cấu trúc da độc nhất của
mỗi người, giúp đem lại kết quả còn chính xác hơn nữa.
Hình 4: Thuật toán STA cho phép kết quả thu được đạt độ chính xác cao
nhất. STA tạo thành những Dấu da ( SkinPrint ) và đối chiếu theo tỉ lệ 1:1
hoặc 1:N phụ thuộc vào kiểu tìm kiếm .
Quá trình này được gọi là Phân tích cấu trúc bề mặt, cũng hoạt động
giống như hệ thống nhận diện khuôn mặt. Đầu tiên, một mảng da, gọi là
dấu da ( SkinPrint ) , sẽ được chụp thành hình ảnh . Sau đó, mảng da này
được chia nhỏ ra thành nhiều khối. Bằng cách sử dụng thuật toán để
chuyển mảng da thành một không gian toán học có thể đo đạc được, công
nghệ này sau đó sẽ phân biệt từng đường nét, từng lỗ chân lông, và cấu
trúc thực của bề mặt da. Điều này giúp phân biệt được cả một cặp song
sinh giống hệt nhau mà một mình phần mềm nhận dạng khuôn mặt không
thể thực hiện được. Theo Identix, bằng cách kết hợp công nghệ nhận dạng
khuôn mặt với công nghệ phân tích cấu trúc da, độ chính xác có thể tăng
thêm từ 20 đến 25%.
Hiện tại, FaceIt đang sử dụng ba khuôn mẫu khác nhau để xác minh hay
nhận dạng đối tượng: vector, phân tích đặc điểm vùng, và phân tích cấu
trúc bề mặt.
Khuôn mẫu vector rất nhỏ và được sử dụng để nhận diện nhanh qua toàn
bộ cơ sở dữ liệu ban đầu cho bước đầu của nhiều công đoạn tìm kiếm.
Khuôn mẫu phân tích đặc điểm vùng (LFA – Local Feature Analysis )
tìm kiếm ở cấp độ cao hơn hoặc để đối chiếu khuôn mặt theo khuôn mẫu
Vector.
Khuôn phân tích cấu trúc bề mặt (STA) là khuôn mẫu lớn nhất trong ba
loại. Nó là bước cuối cùng sau bước tìm kiếm dựa vào khuôn LFA, dựa
trên đặc điểm da của đối tượng và đưa ra thông tin chi tiết nhất.
Bằng cách kết hợp cả ba loại khuôn mẫu trên, FaceIt® có lợi thế hơn hẳn
các hệ thống nhận diện khuôn mặt khác. Nó ít bị ảnh hưởng bởi sự thay
đổi trong nét mặt, bao gồm những hành động như nháy mắt, cau mày,
hoặc mỉm cười, và có khả năng nhận diện ngay cả khi đối tượng có thêm
râu, ria mép, hay đeo kính râm. Hệ thống này cũng phân biệt được các
chủng tộc và giới tính khác nhau.
Hình 5 : Ánh sáng yếu có thể làm cho chương trình nhận dạng gặp khó
khăn để kiểm tra nhận dạng của một người nào đó.
Tuy vậy, không công nghệ nào là hoàn hảo. Và công nghệ này cũng có
thể bị ảnh hưởng bởi một số nhân tố sau đây:
Ánh sáng chói trên kính mắt hoặc kính râm
Tóc dài che phần chính giữa khuôn mặt
Ánh sáng yếu khiến khuôn mặt bị mờ đi
Độ phân giải thấp (ảnh được ghi lại từ quá xa)
Identix không phải là công ty duy nhất phát triển công nghệ nhận diện
khuôn mặt. Mặc dù phần lớn sản phẩm của các công ty khác đều hoạt
động tương tự như FaceIt, chúng cũng có một số khác biệt. Ví dụ như sản
phẩm FACEngine ID® SetLight của một công ty có tên là Animetrix có
khả năng chỉnh độ sáng, giúp giảm tỉ lệ nhận diện sai, hay sản phẩm của
Sensible Vision có thể bảo mật cho một máy tính bằng cách sử dụng công
nghệ nhận diện khuôn mặt. Máy tính sẽ chỉ hoạt động khi người chủ thực
sự của nó điều hành. Còn khi người chủ ra khỏi khu vực nhận diện, máy
tính sẽ tự động bảo mật tránh những người dùng khác.
Nhờ vào những bước tiến mạnh mẽ trong công nghệ, hệ thống nhận diện
da và khuôn mặt đang được sử dụng nhiều hơn so với chỉ vài năm trước
đây. Trong phần tiếp theo, chúng ta sẽ tìm hiểu xem những công nghệ
này đang được sử dụng ở đâu và như thế nào, và điều gì đang hứa hẹn ở
phía trước.
4. Hiện tại và tương lai của công nghệ nhận dạng khuôn mặt
Trong quá khứ, đối tượng sử dụng chính của phần mềm nhận diện khuôn
mặt là các cơ quan pháp luật để nhận diện các khuôn mặt trong đám
đông. Một số tổ chức chính phủ cũng sử dụng hệ thống này trong công
tác an ninh và để loại trừ việc gian lận trong bầu cử. Gần đây chính phủ
Mỹ đã sử dụng một chương trình có tên US-VISIT (Công nghệ quản lý
tình trạng nhập cư và di trú Hoa Kỳ), nhằm vào những người nước ngoài
nhập cảnh vào Mỹ. Khi một người nước ngoài nhận được visa, người đó
sẽ phải lăn dấu vân tay và chụp ảnh. Sau đó, vân tay và ảnh của người
này được kiểm tra và đối chiếu với cơ sở dữ liệu về những tên tội phạm
và những kẻ khủng bố. Và khi người này đến nước Mỹ, dấu vân tay và
ảnh của anh ta sẽ được sử dụng để xác minh xem đó có đúng là người đã
nhận được visa hay không.
Tuy vậy, hiện nay có nhiều lý do để phần mềm này ngày càng trở nên phổ
biến. Hiện chúng đã trở nên rẻ hơn và trở nên hữu dụng hơn. Chúng được
kết nối với camera và máy tính sẵn có tại các nhà băng và sân bay. TSA
cũng đang nghiên cứu và thử nghiệm chương trình Khách hàng đã đăng
ký của họ. Chương trình này sẽ nhanh chóng thiết lập cơ sở dữ liệu an
ninh đối với các khách hàng tự nguyện cung cấp thông tin và hoàn tất bài
đánh giá về mức độ đe doạ an ninh. Tại sân bay này sẽ có đường đi riêng
dành cho các khách hàng đã đăng ký giúp họ di chuyển nhanh hơn và
nhận diện từng khách hàng qua các đặc điểm trên khuôn mặt của họ.
Những ứng dụng tiềm năng khác của công nghệ này bao gồm việc bảo
đảm an ninh cho việc rút tiền tại các máy ATM. Phần mềm này có thể
nhận diện được khuôn mặt của một khách hàng. Sau khi được sự đồng ý
của khách hàng, máy ATM sẽ ghi lại hình ảnh số của khách hàng đó, rồi
thiết lập dấu mặt trên ảnh để bảo vệ khách hàng khỏi nạn ăn cắp nhân
dạng và trộm tiền. Bằng cách sử dụng phần mềm nhận dạng khuôn mặt,
sẽ không cần dùng đến giấy chứng minh thư, thử nhà băng hay mã số
nhận diện cá nhân (PIN) để xác định danh tính của khách hàng, nhờ đó
các công ty có thể ngăn chặn nạn lừa đảo.
Trong khi tất cả các ví dụ trên đều được thực hiện với sự đồng ý của đối
tượng, thì không phải tất cả đều được phép của mọi người. Trong phần
đầu tiên, chúng ta đã biết hệ thống trên đã được cảnh sát Tâmp sử dụng
tại trận chung kết bóng bầu dục quốc gia Mỹ Super Bowl và tại quận
Ybor City. Hệ thống này đã ghi lại hình ảnh của tất cả những khách đến
thăm mà họ không hề biết hoặc không hề cho phép. Những người ủng hộ
hệ thống này cho rằng nó giúp đảm bảo an ninh ở một mức độ nào đó, và
không hề vượt quá tự do của mỗi người. Tuy nhiên, nhiều người lại lo
lắng rằng việc sử dụng hệ thống này xâm phạm tự do cá nhân, ngoài ra,
nó còn dẫn đến nguy cơ ăn cắp nhân dạng. Thậm chí ngay cả những công
ty cung cấp hệ thống nhận diện khuôn mặt cũng thừa nhận rằng, công
nghệ càng cao thì nguy cơ đánh cắp hoặc lừa đảo nhân dạng càng lớn.
Với công nghệ ngày càng phát triển như hiện nay, việc nhận diện khuôn
mặt cũng gặp một số nhược điểm. Tuy nhiên, các nhà sản xuất đang cố
gắng để tăng cường hiệu quả và độ chính xác của hệ thống này.
Các file đính kèm theo tài liệu này:
- Timh hiểu hệ thống nhận dạng khuôn mặt.pdf