Una tecnología, diseñada por científicos de la Universidad Rey Juan Carlos, es capaz de reconocer actividades y gestos humanos en imágenes grabadas. El desarrollo se podrá aplicar para detectar actidades sospechosas en los sistemas automáticos de videovigilancia y en el reconocimiento de las acciones de una persona en un videojuego.
Un equipo de la Universidad Rey Juan Carlos (URJC) ha desarrollado un sistema que reconoce de manera automática actividades humanas y gestos de la mano, como atrapar, en imágenes grabadas con cámaras de profundidad.
Los resultados obtenidos, publicados en la revista Pattern Recognition, son un paso más para conseguir que las máquinas entiendan mejor el comportamiento humano. “Las grabaciones, realizadas con cámaras tipo Kinect de Microsoft, nos proporcionan información 3D de la posición de las articulaciones de nuestro esqueleto”, explica Juan Carlos Nuñez, uno de los autores del estudio.
Esta nueva tecnología puede encontrar múltiples aplicaciones en a detección de actividades sospechosas en los sistemas automáticos de videovigilancia, en el etiquetado de la actividad que realiza un atleta en un evento deportivo o en el reconocimiento de la acción que está realizando una persona en un videojuego.
Este trabajo forma parte de una línea de investigación en la que colaboran científicos de los grupos GAVAB (Grupo de Algoritmia aplicada a la Visión Artificial y Biometría) y CAPO (Computación de Altas Prestaciones y Optimización) de la URJC. Los avances logrados superan en algunos casos métodos ya existentes, alcanzando tasas de éxito que se aproximan al 100%. “Hemos realizado experimentos sobre las principales bases de prueba disponibles públicamente, como MSR Action3D, o UTKinect-Action3D, obteniendo un 95,7 y un 99% de acierto, respectivamente”, señala Nuñez.
Modelos matemáticos para emular redes neuronales
Las herramientas empleadas para el diseño de esta nueva tecnología se basan en el uso de redes de neuronas artificiales. Estos sistemas consisten en modelos matemáticos que simulan algunos comportamientos de las redes neuronales biológicas como, por ejemplo, su capacidad de aprendizaje.
Según el investigador, “con los recientes avances en las técnicas de aprendizaje sobre redes neuronales artificiales, se ha conseguido crear redes profundas, que constan de muchas capas de neuronas apiladas. Además, por su gran capacidad, están siendo aplicadas con mucho éxito a multitud de problemas que clásicamente se consideraban difíciles, como reconocer objetos en fotografías o reconocer el habla”.
El trabajo realizado por los investigadores de la URJC también presenta una nueva estrategia de aumentado de datos, que les ha permitido extender el limitado número de ejemplos disponibles para el proceso de aprendizaje de la red. “Esta estrategia ha sido fundamental, debido a que las redes neuronales profundas requieren de una gran cantidad de ejemplos para aprender”, explican los autores de artículo.
El estudio se enmarca en varios proyectos, dentro de las convocatorias del Plan Nacional de I+D+i, y cuenta con financiación del programa para la excelencia en la investigación del Banco Santander y la URJC para el grupo Computer Vision and Image Processing (CVIP).
Referencia bibliográfica
Juan C. Núñez, Raúl Cabido, Juan J. Pantrigo, Antonio S. Montemayor, José F.Vélez. "Convolutional Neural Networks and Long Short-Term Memory for skeleton-based human activity and hand gesture recognition". Pattern Recognition, Vol.76 (abril 2018), pags 80-94 https://doi.org/10.1016/j.patcog.2017.10.033