Un nuevo dispositivo, consistente en una cámara de adquisición de imágenes digitales conectada a un sistema de procesamiento de imágenes, permite a un ordenador identificar si el usuario es un hombre o una mujer. El dispositivo, que ha sido objeto de concesión de una patente, permite construir dispositivos de medición de audiencia de televisión o videos publicitarios, entre otras aplicaciones industriales.
Los investigadores Juan Bekios-Calfa, José M. Buenaposada y Luis Baumela, del Computational Intelligence Group de la Facultad de Informática de la Universidad Politécnica de Madrid, han desarrollado un sistema que analiza en tiempo real una señal de vídeo y calcula el género de los rostros que aparecen en las imágenes.
De esta forma, el ordenador puede determinar si los rostros aparecidos en imágenes o videos pertenecen a un hombre o una mujer. El dispositivo ha sido objeto de concesión de una patente (ES 2 339 100 B2) por parte de la Oficina Española de Patentes y Marcas a favor de la Universidad Politécnica de Madrid y de la Universidad Rey Juan Carlos.
Gracias al nuevo algoritmo, es posible construir dispositivos de medición de audiencia de televisión o de vídeos publicitarios (“márketing dinámico”) que necesitan obtener información demográfica sobre los espectadores. Asimismo, el nuevo dispositivo permite estudios de mercado en centros comerciales, tiendas, bancos o cualquier otro comercio mediante el uso de cámaras para contar personas y extraer información demográfica. También posibilita la creación de quioscos interactivos con un vendedor virtual, ya que consigue información sobre el usuario extraída automáticamente, como puede ser el género de la persona, para mejorar la interacción.
Nuevo paso en el reconocimiento del género de imágenes del rostro
Este trabajo, cuyos resultados han sido publicados en IEEE Transactions on Pattern Analysis and Machine Intelligence, demuestra que las técnicas lineales son igual de buenas que las Máquinas de Soporte Vectorial (SVM) en el problema del reconocimiento de género. La técnica desarrollada permite su utilización en dispositivos de bajos recursos computacionales como teléfonos o cámaras inteligentes.
El estudio concluye que los métodos lineales permiten el entrenamiento con bases de datos con un número reducido de imágenes así como la obtención de clasificadores de género tan rápidos como los basados en Boosting. Sin embargo, los métodos basados en Boosting o SVM necesitarán más imágenes de entrenamiento para obtener buenos resultados. Por último, los basados en SVM serán los clasificadores más lentos de todos. Además, la evidencia experimental apoya la existencia de una dependencia entre distintas variables demográficas como género, edad o etnia.
Dispositivo para la clasificación demográfica del rostro
La invención consiste en un dispositivo con una cámara de adquisición de imágenes digitales conectada a un sistema de procesamiento de imágenes en el que para cada imagen capturada se detectan los posibles rostros, se recortan al tamaño de 25x25 píxeles, se coloca una máscara elíptica (para eliminar la influencia del fondo), se ecualiza y se clasifica.
El dispositivo resuelve los problemas existentes hasta ahora en el estado de la técnica mediante el uso de un clasificador basado en uno de los métodos más eficientes de clasificación lineal: el Análisis de Componentes Principales (PCA), seguido del Análisis Discriminante Lineal de Fisher (LDA) utilizando un clasificador Bayesiano en el espacio de dimensión reducida que se obtiene del LDA. El paso crucial para que el PCA+LDA sea competitivo es la selección de las características de PCA más discriminantes antes del paso LDA.
Una de las áreas de investigación de mayor relevancia en informática es el desarrollo de máquinas que interactúen con sus usuarios de la misma manera que los humanos lo hacen entre sí. Este trabajo es un paso más en el camino que hay que recorrer para llegar a esa meta.
Referencia
Juan Bekios-Calfa, José M. Buenaposada, Luis Baumela. Revisiting Linear Discriminant Techniques in Gender Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 33, N. 4, pp. 858-864, abril 2011.