Proyectos
169-Fondecyt-2015

Fuente de financiamiento: Programa Nacional de Innovaciónpara la Competitividad y Productividad (Innóvate Perú)

Redes Neuronales Convolucionales 3D para el Reconocimiento de Actividad Humana en Videos Digitales

Redes neuronales convolucionales (ó ‘convolutional neural networks’, CNN), es una metodología en ‘neural networks’ (NN) en la que los datos crudos son utilizados como entrada, obteniendo resultados ampliamente superiores a aquellos obtenidos con NN clásicas.

En NN clásicas, los datos (imágenes o vídeos en el presente contexto) son prepocesados siguiendo alguna metodología ad-hoc; como resultado se obtienen vectores con los que la NN (clasificador) es entrenada. Dado que los datos de entrenamiento presentan variabilidades (traslaciones y distorsiones locales), el pre-procesamiento tiene que estandarizar dichos problemas.

Debido a su estructura, inspirada en modelos biológicos para reconocimiento visual, CNN es robusta ante traslaciones y distorsiones locales, evitando la etapa de pre-procesamiento manual asociada a NN. CNN tienen una performance (clasificación) muy superior a NN clásicas; sin embargo, su costo computacional es mucho mayor, por lo cual su utilidad se ha visto restringida, en la mayoría de los casos, a análisis de datos 2D.

El presente proyecto plantea el desarrollo de un nuevo algoritmo progresivo computacionalmente eficiente, a ser implementado en tecnología CUDA, para analizar vídeos digitales (datos 3D) vía CNN, enfocándose en aplicaciones orientadas al reconocimiento de actividades humanas (uso de teléfono celular, dejar/guardar un objeto, apuntar, etc.) lo cual tiene alta relevancia en seguridad ciudadana.

Resultados — A la fecha (Marzo 2017)

Publicaciones — Conference papers

Ponencias internacionales

Fecha de inicio: 05/01/2016
Estado DGI: En proceso
Instituciones Investigadoras:
PUCP
Instituciones Financiadoras:
Programa Nacional de Innovaciónpara la Competitividad y Productividad (Innóvate Perú)