Una nueva base de datos perfecciona los resultados de distintos sistemas de reconocimiento facial anteriores

El Grupo de investigación FRAV, de la Universidad Rey Juan Carlos (URJC), diseña una nueva base de datos destinada al reconocimiento facial, a través de datos 2D, 3D o 2.5D llamada FRAV3D, y que está disponible para toda la comunidad científica.

Una nueva base de datos perfecciona los resultados de distintos sistemas de reconocimiento facial anteriores
Reconocimiento facial

La creación de una base de datos destinada al reconocimiento facial es una tarea compleja, ya que la gran cantidad de factores que influyen en las condiciones de adquisición de datos requiere una estricta aplicación de un protocolo para conseguir que todas las imágenes de los individuos sean comparables. Prueba de esta complejidad es la gran variedad de bases de datos faciales bidimensionales existentes y la no existencia de una homogeneidad entre ellas.

En el caso de las bases de datos tridimensionales, existen muy pocas disponibles actualmente. La gran mayoría de ellas representan la información tridimensional como mapas de profundidad (imagen en escala de grises donde la intensidad indica la profundidad) y no como mallados (o nubes de puntos en el espacio 3D). Es decir, proporcionan información tridimensional, pero en forma de imagen bidimensional, con la consiguiente reducción de información. Otra limitación de las bases de datos disponibles es la cantidad de imágenes por individuo. Habitualmente, se opta por crear bases de datos con muchos individuos, pero el número de imágenes de cada individuo es bajo. Por estas razones, se decidió adquirir una base de datos propia que cubriera todas estas necesidades: la base de datos FRAV3D.

En la actualidad, pueden adquirirse principalmente dos tipos de datos faciales (en referencia a su aspecto externo): las imágenes de intensidad, donde se representa la textura de la cara, y los datos tridimensionales, que recogen la estructura geométrica facial. A su vez, la información tridimensional puede representarse de modos diferentes: mediante una imagen de rango: se trata de una imagen en niveles de gris, donde la intensidad de cada pixel representa la profundidad del objeto en ese punto; o mediante una nube de puntos en el espacio. Por su parte la representación mediante imágenes de rango se trata de una imagen 2D, donde se han proyectado los puntos 3D sobre un plano. Como se trata de una representación bidimensional de información tridimensional, se denomina habitualmente imagen 2.5D. No obstante, la principal limitación de los sistemas basados en una representación facial de textura es su dependencia de las condiciones de iluminación y de la posición de la cara. Por el contrario, la representación 3D, por su propia definición, no depende de la iluminación, y además permite la normalización de la cara en posición. De este modo, el grupo de investigadores encabezado por Cristina Conde y Enrique Cabello, ha realizado un estudio exhaustivo de la capacidad verificadora de cada uno de los tipos de datos y de las condiciones de adquisición que ofrecen mejores resultados, y para ello, han creado esta nueva base de datos, puesto que las diferentes evaluaciones y competiciones realizadas en los últimos años, evidencian que el estado actual de las técnicas de reconocimiento facial no es lo suficientemente maduro como para dar respuesta a la gran demanda social y comercial existente.

Lo novedoso de FRAV3D es que puede combinar dos tipos de información: información bidimensional o de textura, e información tridimensional. Fue adquirida mediante un escáner láser de Minolta modelo VIVID-700. Como uno de los objetivos de esta base de datos es que fueran datos reales, se ha optado por no manipular los datos durante la fase de adquisición, dejando esta tarea para una posible etapa de preprocesado. Este escáner proporciona también información de textura registrada con información 3D. Asimismo, la base de datos consta de imágenes de 105 individuos (81 mujeres y 24 hombres), voluntarios con 16 capturas por individuo: cuatro imágenes frontales, ocho giros en diferentes sentidos y grados, dos gestos y dos iluminaciones diferentes. Los voluntarios para posar en la base de datos se obtuvieron entre alumnos, profesores y personal que trabaja en la Universidad Rey Juan Carlos, de ahí las diferencias en edad y género que aparecen en la base de datos. Y como se adelante en el encabezado de la noticia, la base de datos FRAV3D está actualmente disponible para la comunidad científica (sólo para fines de investigación, no comerciales), bajo demanda a través de la página Web del grupo de investigación www.frav.es. En definitiva, esta se considera una importante contribución, ya que puede permitir la comparación de diferentes algoritmos mediante una misma base de datos, estandarizando los resultados de diferentes sistemas de reconocimiento facial. Actualmente está siendo ya utilizada por más de 50 instituciones por todo el mundo, y las peticiones para su utilización siguen aumentando.

Fuente: URJC
Derechos: Creative Commons

Solo para medios:

Si eres periodista y quieres el contacto con los investigadores, regístrate en SINC como periodista.

Artículos relacionados