Đề tài Tinh hiểu hệ thống nhận dạng khuôn mặt

Giới thiệu Bất kỳ ai đã từng xem show truyền hình “Las Vegas" cũng đã được xem quá trình hoạt động của phần mềm nhận dạng khuôn mặt. Trong rất nhiều tập phim, bộ phận an ninh tại khách sạn và sòng bạc Montecito đã sử dụng hệ thống giám sát qua video của mình và phát hiện được một kẻ gian lận, một tên trộm hay một kẻ nằm trong danh sách đen. Sau đó, hệ thống này sẽ quét tất cả cách hình ảnh qua cơ sở dữ liệu để so sánh và nhận dạng nhân vật. Cuối cùng, tất cả những nhân vật phản diện đều bị tống khứ khỏi sòng bạc hoặc bị bỏ tù. Tuy nhiên, trong thế giới thực, không phải mọi thứ đều có vẻ dễ dàng như trên truyền hình. Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera có gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này. Nhưng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm 2003 do thiếu hiệu quả. Bởi những người sống trong khu vực này đã đeo mặt nạ và thực hiện hành vi phạm tội khiến cho camera không thể nhận diện được bất kỳ ai.

pdf9 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 2273 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề tài Tinh hiểu hệ thống nhận dạng khuôn mặt, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1. Giới thiệu Bất kỳ ai đã từng xem show truyền hình “Las Vegas" cũng đã được xem quá trình hoạt động của phần mềm nhận dạng khuôn mặt. Trong rất nhiều tập phim, bộ phận an ninh tại khách sạn và sòng bạc Montecito đã sử dụng hệ thống giám sát qua video của mình và phát hiện được một kẻ gian lận, một tên trộm hay một kẻ nằm trong danh sách đen. Sau đó, hệ thống này sẽ quét tất cả cách hình ảnh qua cơ sở dữ liệu để so sánh và nhận dạng nhân vật. Cuối cùng, tất cả những nhân vật phản diện đều bị tống khứ khỏi sòng bạc hoặc bị bỏ tù. Tuy nhiên, trong thế giới thực, không phải mọi thứ đều có vẻ dễ dàng như trên truyền hình. Vào năm 2001, Sở cảnh sát Tampa đã lắp đặt một hệ thống camera có gắn phần mềm nhận diện khuôn mặt tại quận Ybor City vốn nổi tiếng về các hoạt động về đêm nhằm giảm bớt tỉ lệ tội phạm trong khu vực này. Nhưng kế hoạch này đã hoàn toàn thất bại, và nó bị đình chỉ vào năm 2003 do thiếu hiệu quả. Bởi những người sống trong khu vực này đã đeo mặt nạ và thực hiện hành vi phạm tội khiến cho camera không thể nhận diện được bất kỳ ai. Sân bay Logan ở Boston cũng đã nhờ những người tình nguyện thực hiện hai bài kiểm tra hệ thống nhận diện khuôn mặt riêng biệt tại các điểm chốt an ninh của sân bay. Sau một khoảng thời gian kiểm tra 3 tháng, kết quả thu được thật đáng thất vọng. Theo như Trung tâm thông tin bảo mật điện tử, hệ thống này chỉ đạt tỉ lệ chính xác là 61.4%, buộc các nhà quản lý sân bay phải tính đến những lựa chọn an ninh khác. Trong bài báo này, chúng ta sẽ nhìn lại lịch sử của hệ thống nhận diện khuôn mặt, về những thay đổi nhằm tăng tính hiệu quả của hệ thống này và cách mà các công ty tư nhân sử dụng (hoặc có kế hoạch sử dụng) chúng. Từ khi sinh ra, con người đã có khả năng nhận diện và phân biệt các khuôn mặt, còn máy tính thì chỉ mới có được khả năng đó trong thời gian gần đây. Vào khoảng giữa thập niên 60 của thế kỷ trước, các nhà khoa học đã bắt đầu nghiên cứu để sử dụng máy tính vào việc nhận diện mặt người. Kể từ đó, phần mềm nhận diện khuôn mặt đã tiến những bước dài. Hình 1: Phần mềm nhận dạng khuôn mặt của Identix đo những điểm nút trên khuôn mặt để tạo thành FacePrint và tìm kiếm những đặc điểm này trong cơ sở dữ liệu Identix®, một công ty có trụ sở tại Minnesota, là một trong số rất nhiều nhà phát triển công nghệ nhận diện khuôn mặt. Phần mềm mang tên FaceIt® của họ có thẻ nhận ra một khuôn mật lẫn trong đám đông, tách khuôn mặt đó ra khỏi khung cảnh còn lại, và đối chiếu nó với cơ sở dữ liệu hoặc các hình ảnh đã được lưu sẵn. Để có thể hoạt động được, thì phần mềm này cần phải biết cách phân biệt giữ một khuôn mặt cơ bản với khung cảnh xung quanh. Phần mềm nhận diện khuôn mặt dựa trên tính năng nhận ra một khuôn mặt và đánh giá nhiều đặc điểm của khuôn mặt này. Mỗi khuôn mặt đều có nhiều điểm mốc, những phần lồi lõm tạo nên các đặc điểm của khuôn mặt. FaceIt định nghĩa những điểm này là những điểm nút. Mỗi mặt người có khoảng 80 điểm nút. Phần mềm này có thể nhận diện một số diểm nút như sau: Khoảng cách giữa hai mắt Chiều rộng của mũi Độ sâu của hốc mắt Hình dạng của xương gò má Độ dài của xương hàm Các điểm nút trên được đo đạc và tạo ra nhiều mã số được gọi là dấu bộ mặt ( FacePrint ) đại diện cho khuôn mặt trong cơ sở dữ liệu. Hình 2: Phần mềm nhận dạng so sánh FacePrint với những hình ảnh khác trong cơ sở dữ liệu Trước đây, phần mềm nhận diện khuôn mặt dựa trên hình ảnh 2D để so sánh hoặc nhận diện một hình ảnh 2D khác từ cơ sở dữ liệu. Và để có được tính chính xác và hiệu quả cao nhất, hình ảnh nhận diện cần phải là một khuôn mặt nhìn trực diện vào camera, với góc độ ánh sáng và những biểu hiện trên nét mặt không khác lắm so với hình ảnh trong cơ sở dữ liệu. Đìều này gây ra nhiều rắc rối. Trong phần lớn trường hợp, các hình ảnh thường không được ghi trong một môi trường ổn định. Thậm chí cả những thay đổi nhỏ nhất trong góc độ ánh sáng hay độ nghiêng của khuôn mặt cũng đủ để làm giảm tính hiệu quả của hệ thống, vì thế các khuôn mặt này thường không khớp với bất kỳ khuôn mặt nào trong cơ sở dữ liệu. Trong phần tiếp theo, chúng ta sẽ cùng tìm hiểu các cách giải quyết vấn đề này. 2. Nhận diện khuôn mặt 3D Một xu hướng mới nổi lên trong công nghệ nhận diện khuôn mặt là việc sử dụng các mẫu 3D, giúp cho việc nhận dạng được chính xác hơn. Một phần mềm nhận diện khuôn mặt 3D sẽ ghi lại một khuôn mặt thực tế của một người, rồi dùng các điểm nổi bật trên khuôn mặt – nơi những mô cứng và xương nhìn thấy rõ nhất như đường cong của hốc mắt, mũi và cằm -- để nhận ra đối tượng. Các đặc điểm này là độc nhất đối với mỗi khuôn mặt và không thay đổi theo thời gian. Cách thức sử dụng độ sâu và trục của các phần trên khuôn mặt không bị ảnh hưởng bởi ánh sáng, vì thế việc nhận dạng khuôn mặt 3D có thể được sử dụng cả trong bóng tối và có thể nhận ra khuôn mặt từ nhiều góc độ khác nhau với độ chênh lệch lên tới 90 độ. Bằng cách sử dụng phần mềm 3D, hệ thống nhận diện này cần trải qua một loạt bước để nhận diện một đối tượng. Nhận dạng Việc ghi lại một hình ảnh có thể thực hiện bằng cách quét một tấm ảnh 2D sẵn có, hoặc sử dụng video để có được một hình ảnh 3D sống của đối tượng. Liên kết Sau khi đã ghi lại một khuôn mặt, hệ thống này sẽ tính toán vị trí, kích cỡ và tư thế của đầu. Như đã đề cập từ trước, hệ thống có thể nhận ra một khuôn mặt ở góc lệch lên tới 90 độ, trong khi với hình ảnh 2D, khuôn mặt của đối tượng phải nghiêng ít nhất là 35 độ về phía camera. Đo đạc Sau đó, hệ thống này sẽ đo đạc những đường cong trên khuôn mặt với độ chính xác lên tới dưới 1 milimet, rồi tạo một khuôn mẫu. Hình 3: Tái hiện Sau đó, hệ thống sẽ chuyển khuôn mẫu này thành một mã độc nhất với từng người. Với mỗi khuôn mẫu, mã này có dạng một nhóm các con số đại diện cho khuôn mặt của một đối tượng. So sánh Nếu như hình ảnh này có dạng 3D và cơ sở dữ liệu cũng chứa các hình ảnh 3D, thì việc đối chiếu có thể tiến hành mà không phải thực hiện bất kỳ thay đổi nào đối với hình ảnh đó. Tuy vậy, nếu như hình ảnh vẫn ở dạng 2D thì sẽ có đôi chút khó khăn hơn, bởi công nghệ 3D đem lại hình ảnh thực và sống động hơn so với một hình ảnh 2D phẳng lì, bất động. Nhưng công nghệ mới có thể giải quyết được khó khăn này. Ví dụ, phần bên ngoài và bên trong của con mắt cùng với phần đỉnh mũi sẽ được lấy ra đo đạc. Sau khi việc đo đạc này hoàn tất, một thuật toán sẽ được áp dụng để chuyển hình ảnh trong cơ sở dữ liệu sang dạng 2D. Sau khi chuyển đổi, phần mềm sẽ so sánh hai hình ảnh 2D này với nhau để tìm ra đối tượng. Xác minh hay nhận diện Xác minh có nghĩa là một hình ảnh sẽ được đối chiếu với chỉ 1 hình ảnh trong cơ sở dữ liệu (tỉ lệ 1:1). Ví dụ như, một hình ảnh của một đối tượng nào đó sẽ được đối chiếu với một hình ảnh trong cơ sở dữ liệu của Uỷ ban phương tiện giao thông để xác minh xem đối tượng đó là ai. Còn nhận diện có nghĩa là một hình ảnh sẽ được đối chiếu với tất cả các hình ảnh trong cơ sở dữ liệu để tìm ra đối tượng (tỉ lệ 1:N). Khi đó, bạn phải ghi lại hình ảnh đối tượng và so sánh với toàn bộ cơ sở dữ liệu để biết được đối tượng đó là ai. Tiếp theo, chúng ta sẽ tìm hiểu xem công nghệ sinh trắc học về da giúp ích gì trong việc nhận dạng này. 3. Phân tích cấu trúc bề mặt (STA – Surface Texture Analysis ) Nhiều khi hình ảnh không thể được xác minh hay nhận đạng chỉ bằng công nghệ nhận dạng nét mặt. Identix® đã tạo ra một sản phẩm mới để giúp cho việc nhận diện chính xác hơn. Phần mềm FaceIt®Argus của họ sử dụng công nghệ sinh trắc học về da, dựa trên cấu trúc da độc nhất của mỗi người, giúp đem lại kết quả còn chính xác hơn nữa. Hình 4: Thuật toán STA cho phép kết quả thu được đạt độ chính xác cao nhất. STA tạo thành những Dấu da ( SkinPrint ) và đối chiếu theo tỉ lệ 1:1 hoặc 1:N phụ thuộc vào kiểu tìm kiếm . Quá trình này được gọi là Phân tích cấu trúc bề mặt, cũng hoạt động giống như hệ thống nhận diện khuôn mặt. Đầu tiên, một mảng da, gọi là dấu da ( SkinPrint ) , sẽ được chụp thành hình ảnh . Sau đó, mảng da này được chia nhỏ ra thành nhiều khối. Bằng cách sử dụng thuật toán để chuyển mảng da thành một không gian toán học có thể đo đạc được, công nghệ này sau đó sẽ phân biệt từng đường nét, từng lỗ chân lông, và cấu trúc thực của bề mặt da. Điều này giúp phân biệt được cả một cặp song sinh giống hệt nhau mà một mình phần mềm nhận dạng khuôn mặt không thể thực hiện được. Theo Identix, bằng cách kết hợp công nghệ nhận dạng khuôn mặt với công nghệ phân tích cấu trúc da, độ chính xác có thể tăng thêm từ 20 đến 25%. Hiện tại, FaceIt đang sử dụng ba khuôn mẫu khác nhau để xác minh hay nhận dạng đối tượng: vector, phân tích đặc điểm vùng, và phân tích cấu trúc bề mặt. Khuôn mẫu vector rất nhỏ và được sử dụng để nhận diện nhanh qua toàn bộ cơ sở dữ liệu ban đầu cho bước đầu của nhiều công đoạn tìm kiếm. Khuôn mẫu phân tích đặc điểm vùng (LFA – Local Feature Analysis ) tìm kiếm ở cấp độ cao hơn hoặc để đối chiếu khuôn mặt theo khuôn mẫu Vector. Khuôn phân tích cấu trúc bề mặt (STA) là khuôn mẫu lớn nhất trong ba loại. Nó là bước cuối cùng sau bước tìm kiếm dựa vào khuôn LFA, dựa trên đặc điểm da của đối tượng và đưa ra thông tin chi tiết nhất. Bằng cách kết hợp cả ba loại khuôn mẫu trên, FaceIt® có lợi thế hơn hẳn các hệ thống nhận diện khuôn mặt khác. Nó ít bị ảnh hưởng bởi sự thay đổi trong nét mặt, bao gồm những hành động như nháy mắt, cau mày, hoặc mỉm cười, và có khả năng nhận diện ngay cả khi đối tượng có thêm râu, ria mép, hay đeo kính râm. Hệ thống này cũng phân biệt được các chủng tộc và giới tính khác nhau. Hình 5 : Ánh sáng yếu có thể làm cho chương trình nhận dạng gặp khó khăn để kiểm tra nhận dạng của một người nào đó. Tuy vậy, không công nghệ nào là hoàn hảo. Và công nghệ này cũng có thể bị ảnh hưởng bởi một số nhân tố sau đây: Ánh sáng chói trên kính mắt hoặc kính râm Tóc dài che phần chính giữa khuôn mặt Ánh sáng yếu khiến khuôn mặt bị mờ đi Độ phân giải thấp (ảnh được ghi lại từ quá xa) Identix không phải là công ty duy nhất phát triển công nghệ nhận diện khuôn mặt. Mặc dù phần lớn sản phẩm của các công ty khác đều hoạt động tương tự như FaceIt, chúng cũng có một số khác biệt. Ví dụ như sản phẩm FACEngine ID® SetLight của một công ty có tên là Animetrix có khả năng chỉnh độ sáng, giúp giảm tỉ lệ nhận diện sai, hay sản phẩm của Sensible Vision có thể bảo mật cho một máy tính bằng cách sử dụng công nghệ nhận diện khuôn mặt. Máy tính sẽ chỉ hoạt động khi người chủ thực sự của nó điều hành. Còn khi người chủ ra khỏi khu vực nhận diện, máy tính sẽ tự động bảo mật tránh những người dùng khác. Nhờ vào những bước tiến mạnh mẽ trong công nghệ, hệ thống nhận diện da và khuôn mặt đang được sử dụng nhiều hơn so với chỉ vài năm trước đây. Trong phần tiếp theo, chúng ta sẽ tìm hiểu xem những công nghệ này đang được sử dụng ở đâu và như thế nào, và điều gì đang hứa hẹn ở phía trước. 4. Hiện tại và tương lai của công nghệ nhận dạng khuôn mặt Trong quá khứ, đối tượng sử dụng chính của phần mềm nhận diện khuôn mặt là các cơ quan pháp luật để nhận diện các khuôn mặt trong đám đông. Một số tổ chức chính phủ cũng sử dụng hệ thống này trong công tác an ninh và để loại trừ việc gian lận trong bầu cử. Gần đây chính phủ Mỹ đã sử dụng một chương trình có tên US-VISIT (Công nghệ quản lý tình trạng nhập cư và di trú Hoa Kỳ), nhằm vào những người nước ngoài nhập cảnh vào Mỹ. Khi một người nước ngoài nhận được visa, người đó sẽ phải lăn dấu vân tay và chụp ảnh. Sau đó, vân tay và ảnh của người này được kiểm tra và đối chiếu với cơ sở dữ liệu về những tên tội phạm và những kẻ khủng bố. Và khi người này đến nước Mỹ, dấu vân tay và ảnh của anh ta sẽ được sử dụng để xác minh xem đó có đúng là người đã nhận được visa hay không. Tuy vậy, hiện nay có nhiều lý do để phần mềm này ngày càng trở nên phổ biến. Hiện chúng đã trở nên rẻ hơn và trở nên hữu dụng hơn. Chúng được kết nối với camera và máy tính sẵn có tại các nhà băng và sân bay. TSA cũng đang nghiên cứu và thử nghiệm chương trình Khách hàng đã đăng ký của họ. Chương trình này sẽ nhanh chóng thiết lập cơ sở dữ liệu an ninh đối với các khách hàng tự nguyện cung cấp thông tin và hoàn tất bài đánh giá về mức độ đe doạ an ninh. Tại sân bay này sẽ có đường đi riêng dành cho các khách hàng đã đăng ký giúp họ di chuyển nhanh hơn và nhận diện từng khách hàng qua các đặc điểm trên khuôn mặt của họ. Những ứng dụng tiềm năng khác của công nghệ này bao gồm việc bảo đảm an ninh cho việc rút tiền tại các máy ATM. Phần mềm này có thể nhận diện được khuôn mặt của một khách hàng. Sau khi được sự đồng ý của khách hàng, máy ATM sẽ ghi lại hình ảnh số của khách hàng đó, rồi thiết lập dấu mặt trên ảnh để bảo vệ khách hàng khỏi nạn ăn cắp nhân dạng và trộm tiền. Bằng cách sử dụng phần mềm nhận dạng khuôn mặt, sẽ không cần dùng đến giấy chứng minh thư, thử nhà băng hay mã số nhận diện cá nhân (PIN) để xác định danh tính của khách hàng, nhờ đó các công ty có thể ngăn chặn nạn lừa đảo. Trong khi tất cả các ví dụ trên đều được thực hiện với sự đồng ý của đối tượng, thì không phải tất cả đều được phép của mọi người. Trong phần đầu tiên, chúng ta đã biết hệ thống trên đã được cảnh sát Tâmp sử dụng tại trận chung kết bóng bầu dục quốc gia Mỹ Super Bowl và tại quận Ybor City. Hệ thống này đã ghi lại hình ảnh của tất cả những khách đến thăm mà họ không hề biết hoặc không hề cho phép. Những người ủng hộ hệ thống này cho rằng nó giúp đảm bảo an ninh ở một mức độ nào đó, và không hề vượt quá tự do của mỗi người. Tuy nhiên, nhiều người lại lo lắng rằng việc sử dụng hệ thống này xâm phạm tự do cá nhân, ngoài ra, nó còn dẫn đến nguy cơ ăn cắp nhân dạng. Thậm chí ngay cả những công ty cung cấp hệ thống nhận diện khuôn mặt cũng thừa nhận rằng, công nghệ càng cao thì nguy cơ đánh cắp hoặc lừa đảo nhân dạng càng lớn. Với công nghệ ngày càng phát triển như hiện nay, việc nhận diện khuôn mặt cũng gặp một số nhược điểm. Tuy nhiên, các nhà sản xuất đang cố gắng để tăng cường hiệu quả và độ chính xác của hệ thống này.

Các file đính kèm theo tài liệu này:

  • pdfTimh hiểu hệ thống nhận dạng khuôn mặt.pdf
Tài liệu liên quan