Enciclopedia/Diccionario de Psicología y Neurociencias:
ıllı Sistema de reconocimiento facial wiki: info, libros pdf y vídeos
- Detalles
- Categoría: PSICOLOGIA (WIKINFO)
Sistema de reconocimiento facial
El reconocimiento facial se ha transformado en los últimos tiempos en un área de investigación activa que engloba diferentes disciplinas, como procesado de imágenes, reconocimiento de patrones, visión por PC y redes neuronales. Implica tanto a estudiosos del área de informática como a neurocientíficos y sicólogos. Se podría estimar asimismo en el campo de reconocimiento de objetos, donde la cara es un objeto tridimensional sujeto a alteraciones de iluminación, pose, etcétera, y debe ser identificada basada en su proyección 2D (salvo cuando se emplean técnicas 3D). El objetivo de un sistema de reconocimiento facial es, en general, el siguiente: dada una imagen de una cara "ignota", o bien imagen de test, localizar una imagen de exactamente la misma cara en un conjunto de imágenes "conocidas", o bien imágenes de adiestramiento. La enorme complejidad añadida es la de lograr que este proceso se pueda efectuar en tiempo real. El sistema identificará las caras presentes en imágenes o bien vídeos de manera automática. Puede operar en 2 modos: Por su naturaleza afable, esta clase de sistemas prosiguen siendo atractivos pese a la existencia de otros métodos muy fiables de identificación personal biométricos, como el análisis de huellas digitales y el reconocimiento del iris. Se emplea primordialmente en sistemas de seguridad para el reconocimiento de usuarios. En estos sistemas se usa un lector que define las peculiaridades del semblante, y cuando este pide el acceso, se comprueba equiparando los datos conseguidos con la base de datos. No obstante, estos sistemas no son útiles en un largo plazo puesto que, conforme pasan los años, los rasgos faciales cambian y al pedir el acceso ya no coinciden con la imagen en la base de datos. Para solventar este inconveniente se puede emplear un algoritmo que interprete el paso de los años, si bien del mismo modo prosigue sin ser completamente fiable), o, renovar a menudo la base de datos. También se usa en aplicaciones de interacción persona-PC, en administración multimedia, y en software como Google's Picasa, Apple iPhoto, Sony's Picture Motion Browser (PMB), Fb y Asus Smart Logon. Una aplicación de reconocimiento facial futura se fundamenta en establecer esta técnica a nivel de usuario. Por servirnos de un ejemplo, en un súper o bien en un establecimiento pequeño se podría realizar un control sobre quien abre la caja registradora a través de un reconocimiento facial anterior, de esta forma asimismo se pueden eludir intentos de hurto puesto que, al no reconocer el semblante, la caja continuaría cerrada. Un caso más extremo sería en los cajeros donde, para poder operar, fuera preciso un reconocimiento facial en lugar del actual PIN. Los métodos de reconocimiento facial tradicional se pueden dividir en 2 grandes grupos: Reconocen conforme toda la imagen facial. Son métodos basados en relación. El esquema de clasificación más simple, donde se emplean modelos de comparación para el reconocimiento, es el template matching. El inconveniente del template matching es que debe equiparar muchas peculiaridades (para él, un pixel es una característica), y si tomamos en cuenta que en la base de datos hallamos M personas, con N imágenes por persona, observamos que este procedimiento no se puede incorporar en tiempo real. Por consiguiente, se trabaja con otros métodos que decorrelacionan las peculiaridades entre sí para lograr reducir el espacio facial en un número menor de factores, que tengan un alto poder discriminatorio entre las personas. Es lo que se llama subespacio facial. Ejemplos de métodos que trabajan desde subespacios son el Análisis de Componentes Primordiales (PCA - Primordial Component Analysis) desde eigenfaces, el Análisis Linear Discriminant (LDA - Linear Discriminant Analysis) o bien el Discriminante Linear de Fisher (FLD - Fisher Linear Discriminant) desde fisherfaces. La técnica PCA se considera una de las que da un mayor desempeño. Marcha proyectando las imágenes faciales sobre un espacio de facciones que abarca las alteraciones significativas entre las imágenes faciales conocidas. Las facciones significativas se llaman eigenfaces, en tanto que son los eigenvectors, o bien componentes primordiales, del conjunto de caras. La proyección caracteriza la imagen facial de un individuo como la suma de los diferentes pesos de todas y cada una de las facciones y, de exactamente la misma forma, para reconocer una imagen facial determinada solo va a hacer falta cotejar estos pesos con aquellos de los individuos conocidos anteriormente. No tiene presente la información de qué imágenes pertenecen a un mismo individuo.Es altamente sensible a cambios en las condiciones de iluminación en diferentes imágenes de una misma persona. El procedimiento LDA deja usar la información entre miembros de exactamente la misma clase (imágenes de exactamente la misma persona) para desarrollar un conjunto de vectores de peculiaridades donde las alteraciones entre las distintas caras se resaltan al paso que los cambios debidos a la iluminación, expresión facial y orientación de la cara no. Esto es, maximiza la variancia de las muestras entre clases, y la minimiza entre muestras de exactamente la misma clase. La técnica FLD es equivalente al LDA. Los resultados conseguidos con FLD son bastante mejores que los que podemos conseguir con PCA, especialmente cuando las condiciones luminosas cambian entre el conjunto de imágenes de adiestramiento y de test, y asimismo con cambios de expresión facial, dando más peso a zonas como los ojos, la nariz o bien las mejillas que a la boca, por el hecho de que son zonas más constantes en las distintas expresiones que puede tener una persona. Otros métodos, en lugar de usar subespacios faciales, prosiguen una clasificación por redes neuronales y plantillas alterables, como EGM - Elastic graph matching. Se equiparan diferentes peculiaridades geométricas de las caras. Existen 2 divisiones, la basada en los vectores propios extraídos del perfil, y la basada en los extraídos desde una vista frontal. Se usaba mucho previamente mas sus resultados no son perfectos. Últimamente ha aumentado la tendencia del reconocimiento facial tridimensional, donde se usan imágenes 3D tanto en el adiestramiento como en el reconocimiento. Esta técnica usa sensores en 3D para captar información sobre la manera de la cara. Esta información se usa más tarde para identificar rasgos propios del semblante como por servirnos de un ejemplo la barbilla, el contorno de los ojos, la nariz o bien los pómulos, y reteniendo información espacial, a una parte de la textura y la profundidad. Una ventaja del reconocimiento facial en 3D es que no les afectan los cambios de iluminación, como pasa en el caso de otras técnicas. Además de esto, otro punto a favor es que pueden reconocer una cara en diferentes ángulos, aun de perfil. El inconveniente es que es bastante difícil conseguir imágenes 3D fieles en la fase de reconocimiento, en tanto que los sensores 3D deben estar realmente bien calibrados y acompasados para adquirir la información adecuadamente. De ahí que que se usa el procedimiento de Anàlisi de Components Principals Parcial (P2CA - Partial Primordial Component Analysis), derivado del PCA, donde se emplean imágenes en 3D en la fase de adiestramiento y en la base de datos, mas en la fase de test puede emplear tanto imágenes en 2D como en 3D. La técnica procura reconstruir modelos faciales en 3D desde múltiples imágenes de exactamente la misma persona adquiridas a través de un sistema multicámara o bien desde aparatos 3D. Las imágenes 3D son imágenes de 180º en coordenadas cilíndricas. Otros ejemplos de técnicas 3D son tres-D Morphable Model i tres-D Face Recognition. Esta tendencia emplea los detalles visuales de la piel. Examina las líneas únicas, patrones y detalles evidentes como máculas y/o cicatrices del semblante del sujeto. Al usar este algoritmo nos ahorramos tener que recorrer toda la base de datos en tanto que podemos descartar imágenes de forma fácil. Existen estudios que prueban que usando esta técnica, conjuntamente con el reconocimiento facial, el desempeño puede acrecentar hasta un veinticinco por ciento.[1]? Se han desarrollado ciertos sistemas de reconocimiento facial basados en vídeo,[2]? por poner un ejemplo, salas inteligentes que pueden reconocer a las personas y también comenzar de manera automática las acciones apropiadas. Otro ejemplo son los sistemas que advierten la fatiga de un conductor, controlando las expresiones de la cara y los movimientos de cabeza. Mas en aplicaciones de videovigilancia, el reconocimiento y la identificación facial aún es una labor bastante difícil debido a: Hay aplicaciones en las que da buenos resultados, como en sistemas de control de acceso y en cajeros, donde el vídeo se adquiere en un entorno parcialmente controlado y el tamaño de la cara es admisible. En estos casos, el reconocimiento basado en vídeo ofrece ciertas ventajas respecto el basado en imágenes: El sistema de reconocimiento facial no es perfecto y en ocasiones bastante difícil de incorporar en determinadas condiciones. Una de las primordiales debilidades de este sistema se debe a el ángulo en el que se halla el semblante que deseamos reconocer. Estudios han confirmado que el reconocimiento actúa adecuadamente hasta los 20º,[1]? una vez superado este ángulo empiezan a surgir inconvenientes. Es por esta razón que se está estudiando el reconocimiento en 3D con el que este inconveniente desaparecería.Otro inconveniente es el mal funcionamiento en situaciones de poca luz, además de esto, llevar el pelo largo, lentes de sol o bien otros objetos que cubran una parte del semblante complica mucho la labor. El algoritmo no siempre y en todo momento es capaz de distinguir los semblantes si la expresión de este es diferente a la guardada en la base de datos. Para solventar ciertos de estos inconvenientes, a una parte de hacer el reconocimiento sobre vídeo, asimismo se pueden emplear técnicas multimodales[3]? donde, a una parte de la imagen de la persona, se incorpora asimismo información de voz y audio, si esta se halla en el contenido. Principalmente, podemos distinguir 2 inconvenientes que ocasionan una seria humillación del desempeño en la mayor parte de los sistemas existentes: Los cambios provocados por la iluminación son por norma general más grandes que las diferencias entre personas, ocasionando a los sistemas basados en comparación a confundirse al clasificar las imágenes de entrada. Se han propuesto ciertas soluciones basadas en el conocimiento, particularmente teniendo presente que todas y cada una de las caras pertenecen a una misma clase. Estas técnicas están divididas en cuatro tipos: El desempeño de un sistema de reconocimiento facial asimismo baja significativamente cuando hay presentes cambios en la pose. Hay diferentes métodos propuestos para solucionarlo: Según una investigación reciente, el reconocimiento facial automático da mejores resultados que en los humanos, mas aún no hay una técnica que dé una solución robusta para todo género de situaciones y para las distintas aplicaciones que lo puedan precisar.Según la gaceta 'Science', emplear imágenes compuestas por múltiples fotografías adquiridas en diferentes ángulos de una misma persona deja que el desempeño del algoritmo llegue hasta un cien por ciento en el mejor caso. Este es el resultado de estudios de sicólogos de la Universidad de Glasgow, donde se trata el tema y se ha llegado a la conclusión de que este nuevo sistema emula una de las claves de la capacidad humana para reconocer semblantes. Incluso de este modo prosigue sin poder distinguir entre diferentes expresiones faciales. Aunque esta tecnología nos aporta importantes beneficios, se cuestiona éticamente la privacidad del sujeto. Lo que a simple vista se considera como un avance en tecnología se puede transformar en un arma. En dependencia de su empleo se puede supervisar una sociedad entera sabiendo en todo instante donde se hallan y qué hacen. Dada la enorme cantidad de teorías y técnicas aplicables a el reconocimiento facial, son precisas una clara evaluación y una comparativa para estos algoritmos. A fin de que sean viables, se tienen que emplear grandes cantidades de imágenes para una evaluación conveniente. Asimismo es fundamental que la muestra sea estadísticamente lo más afín posible a las imágenes que brotan en la aplicación que se está considerando. La puntuación debe efectuarse de forma que refleje el costo de los fallos de reconocimiento. Recordemos que los resultados dependen mucho de la aplicación que tratamos, con lo que no podemos extrapolar los resultados para otras aplicaciones. Existen extensas bases de datos públicas libres, como protocolos de test, para probar las aplicaciones del reconocimiento facial. Uno de ellos es el protocolo FERET, cuyo objetivo es administrar un marco de actuación que modele una configuración en tiempo real y reunir una extensa base de datos con imágenes de caras para poder desarrollar algoritmos y valorarlos. Es el que se usa en el FRVT (Face Recognition Vendor Test). En la próxima tabla se muestran una serie de bases de datos libres en nuestros días, donde se puede observar el número de elementos empleados y el tiempo de reconocimiento: A mediados del dos mil seis, en el Face Recognition Grand Challenge (FRGC) se valoraron los últimos algoritmos de reconocimiento facial. Escanners faciales 3D, imágenes de semblantes de alta definición y del iris fueron empleadas en los tests. Los resultados señalaron que estos nuevos algoritmos tienen diez veces más precisión que los algoritmos con data precedente a dos mil dos, y cien veces más que los de mil novecientos noventa y cinco. Estos algoritmos son tan precisos que son capaces de reconocer a 2 gemelos idénticos. Otra mejora reciente es que las imágenes de baja resolución hoy día ya no son un inconveniente por el hecho de que pueden ser tratadas desde la superresolución del semblante, conocido como Face Hallucination. Del mismo modo, la instalación de cámaras de alta definición está en proceso.Aplicaciones Actuales
Posibles aplicaciones futuras
Técnicas Tradicionales
Locales o bien geométricos
Técnicas de análisis de la textura de la piel
Problema de iluminación
Problema del cambio de pose