Monday, March 2, 2009

Rút trích thông tin từ khuôn mặt (bản phát thảo)

(Bản phát thảo)

Keywords: face recognition, asm, svm, facial features extraction, locating facial features, face detection, adaboost, gabor filter, biometrics; geometric invariants.

Tóm tắt:

Ngày nay, với sự phát triển của những hệ thống webcam thì nhu cầu của việc ứng dụng thông minh vào hệ thống an ninh trở nên cấp thiết. Điều này giúp chúng ta dễ dàng nhận ra các đối tượng ở một vị trí nhất định một cách dễ dàng tự động những người sử dụng trong toà nhà. ‎[‎Fei Zuo et al., 2005]
‎[Daniel Riccio et al., 2007] Trong thập kỷ qua, về lĩnh vực an ninh như sinh trắc học đã trở thành một trong những chủ đề trung tâm nhiều nhất đối với các chính phủ cũng như những nhà nghiên cứu, trong khi ngày càng nhiều những kỷ thuật tiên tiến sẵn sàng với một chi phí thấp hơn, cũng như khả năng ứng dụng tốt trong việc phân tích những bức ảnh và video được xem xét. Đặc biệt, khuôn mặt được xem xét nhiều hơn những sinh trắc học khác như mống mắt, vân tay. Mặc dù, những sinh trắc học này đưa ra được giải pháp có độ chính xác cao hơn, nhưng cần sự hợp tác từ phía người sử dụng và trong một vài trường hợp đã xâm phạm nhiều thứ khác (invasive). Việc phân tích khuôn mặt cung cấp một sự thoả hiệp có lợi giữa sự chấp nhận và độ tin cậy của công chúng (trong một môi trường có thể kiểm soát được).
Mặc khác, tương lai trong việc xây dựng những engine tìm kiếm hình ảnh, video đáp ứng được nhu cầu thực tế trở thành một thách thức lớn. Nếu như các engine tìm kiếm hiện nay, dữ liệu đầu vào là chuỗi các keyword để tìm kiếm, thì tìm kiếm multimedia cần những keywork trong hình ảnh (thỉnh thoảng có người gọi là visual words). Do đó, thách thức này liên quan đến hiểu nội dung hình ảnh, TRECVID - high level feature extraction task (hay còn gọi là concept detection) chính là một trong những nhiệm vụ giải quyết vấn đề này. Nhưng kết quả còn khá xa, vì vậy chúng ta có thể tập trung ở phạm vi hẹp, đó là con người, xây dựng bài toán do tìm/nhận dạng khuôn mặt. ‎[Lê Đình Duy, 2006]
‎[Jeremy N. Bailensona et al., 2007] Với việc rút trích thông tin từ khuôn mặt, đây là bước cơ bản cho nhiều ứng dụng thực tế.
Cũng như trong một khảo sát của ‎[P. Campadelli, 2007] đã chỉ ra việc định vị mắt
[Minh Hoai Nguyen et al, 2008] Định vị đặc tính trên khuôn mặt tự động đã được thử thách lâu dài trong lĩnh vực tầm nhìn máy tính trong nhiều thập kỷ qua. Điều này có thể được giải thích bởi khả năng rộng lớn, một khuôn mặt trong một bức hình có thể có được là nhờ những yếu tố như vị trí, biểu cảm, tư thế, độ chiếu sáng và nền lộn xộn.
Sự xuất hiện của khuôn mặt thay đổi quyết liệt do biểu cảm, tư thế, độ chiếu sáng, (expression [Peter et al., 1997], pose [Georghiades et al., 2001] and illumination [Adini et al., 1997]) tuổi tác, và những thay đổi hình tượng (chẳng hạn râu, kính). Sự biến đổi lớn trong sự xuất hiện của khuôn mặt làm những thuật toán nhận dạng trên những bức hình và video trở thành một thách thức.  Cần xây dựng một phương pháp nhanh để giải quyết những vấn đề khó khăn này.
Và đây là cơ hội để tiếp tục nghiên cứu trong lĩnh vực xử lý hình ảnh này. Từ những thông tin rút trích được, có thể ứng dụng trong lĩnh vực an ninh (chẳng hạn tìm ra những tên trộm trong hồ sơ lưu trữ thông tin con người), nén ảnh, và những tương tác giữa con người và máy tính.
Trong luận văn này, tôi tập trung vào vấn đề rút Để rút trích được những thông tin trên khuôn mặt, chúng tôi đưa ra một phương pháp gồm nhiều giai đoạn để giảm thời gian dò tìm trong khi vẫn đảm bảo tỷ lệ dò tìm cao. Đầu tiên chúng ta cần phải xem xét phương pháp dò tìm khuôn mặt nhanh, để giới hạn lại vùng cần rút trích. Tiếp đến, chúng ta áp dụng một phương pháp rút trích trên vùng vừa dò tìm để xác định được những điểm cần quan tâm trên khuôn mặt như mắt, mũi, miệng.
Trong giai đoạn dò tìm khuôn mặt, tôi chỉ xem xét những khuôn mặt ở phía trước (frontal view) và tôi đề xuất phương pháp Adaboost [Paul Viola et al, 2001], bởi phương pháp này cho kết quả nhanh. Và giai đoạn sau, tôi sẽ tập trung vào xem xét một trong hai phương pháp SVM hay Gabor cho quá trình rút trích những thông tin trên khuôn mặt.

Giới thiệu:

Những thách thức trong những năm qua đó là xây dựng những ứng dụng tìm kiếm những dữ liệu đa phương tiện sẵn sàng cho người dùng. Việc xử lý khuôn mặt, cũng như rút trích thông tin từ khuôn mặt đóng vai trò quan trọng. Bởi lẽ, hiện nay vấn đề tìm kiếm thông tin từ dữ liệu video vẫn còn bỏ ngõ, và một trong những hướng tiếp cận đó là tìm kiếm dựa trên khuôn mặt. [Lê Đình Duy, 2006, tr. 1] Trong công trình này, tác giả đã đưa ra những phương pháp để rút trích tự động và tổ chức số lượng lớn những khuôn mặt cho quá trình lập chỉ mục, đạt lấy dữ liệu video.
Hiện nay, Adaboost là một phương pháp phổ biến cho việc dò tìm khuôn mặt. Nó cũng đã được OpenCV sử dụng.
[Nguyễn Thành Thái, 2006] đã kết hợp giữa SVM và mạng nơron để nhận dạng khuôn mặt.
‎[Zeeshan Ejaz Bhatti, 2008] đã xây dựng một chương trình dò tìm khuôn mặt và mắt dựa trên thư viện mở OpenCV. Nhưng độ chính xác vẫn không cao.



Thách thức:
Rút trích thông tin đặt ra nhiều thách thức:
- Sự thay đổi ánh sáng chiếu vào khuôn mặt




Vấn đề:

- Việc định vị mắt cũng gặp khó khăn như sự có mặt của kính cũng là một thách thức lớn cho việc nghiên cứu.
- Chúng ta cần xác định mũi trước không?
- ASM có thể dò tìm những điểm rút trích nhanh, nhưng AAM thì sao?


more

Mong được trao đổi thêm?

Trịnh Đình Duy (James)

No comments:

Post a Comment