Nueva técnica de visión por computador para contar aglomeraciones de personas

Contar el número de personas en grandes aglomeraciones en espacios abiertos no resulta fácil y según las metodologías empleadas las cifras pueden variar sustancialmente. Ahora, los investigadores Xialei Liu y Joost Van de Weijin, del Centro de Visión por Computador, en un estudio conjunto con la Universidad de Florencia, han desarrollado un algoritmo que utiliza técnicas de visión artificial para poder estimar el número de personas en imágenes con una franja de error de un 10 a 20%, la más baja conseguida hasta la fecha dentro de este ámbito. La nueva técnica la han dado a conocer en el marco del Mobile World Congress, en Barcelona.

Un software de este estilo puede ser imprescindible dentro del área de la video seguridad, monitorización o análisis de comportamiento. Hasta ahora, la problemática científica era evidente: distorsiones de perspectiva, distribución desigual, e iluminación compleja, variación de escaleras, y un largo etcétera, hacían que los algoritmos de visión artificial no pudieran ser capaces de contar números de cabezas dentro de una imagen. Los investigadores del Centro de Visión por Computador han conseguido un algoritmo estable haciendo uso de mapas de densidad, que ayuda a eliminar la mayoría de estas distorsiones.

Además, la técnica elimina la mayor problemática: la necesidad de imágenes previamente procesadas para entrenar a los algoritmos de visión. Enseñar a los ordenadores a contar grandes aglomeraciones necesita imágenes que hayan sido tratadas por un humano. Este es el que le dice al ordenador que hay dentro de cada píxel (como un maestro cuando enseña a un niño una materia que nunca ha cursado). El Dr. Van de Weijin y su equipo eliminan esta variable, haciendo el proceso mucho más rápido y económico. ¿Cómo? Enseñando a los ordenadores a comparar imágenes.

El proceso es sencillo en esencia, pero complejo en la práctica: se le da en el ordenador una primera imagen, y luego se le dan recortes de ésta. Entonces, el ordenador debe aprender que hay menos gente en la segunda fotografía (el recorte) que en la primera (el original). Esta técnica, afinada, es la base del aprendizaje de este nuevo algoritmo.

La visión artificial necesita una ingente cantidad de imágenes para poder aprender. Estas imágenes son difíciles de obtener, especialmente las que deben ser anotadas y procesadas por humanos para conseguir que el ordenador lo entienda. Con este algoritmo, Van de Weijin y su equipo abren las puertas a posibilidades inmensas en el ámbito de seguridad y vigilancia, y pueden ayudar en el debate abierto sobre la cantidad de personas en diferentes movilizaciones ciudadanas alrededor del mundo. Los investigadores presentarán su nueva técnica en el prestigioso CVPR (Computer Vision & Pattern Recognition Conference) de este año que tendrá lugar en Salt Lake City, Utah, el próximo mes de junio.
 

volver al listado de noticias

Este sitio web utiliza cookies propias y de terceros para mejorar nuestros servicios y mostrarle publicidad relacionada con sus preferencias mediante el análisis de sus hábitos de navegación. Si continua navegando, consideramos que acepta su uso. Puede saber más sobre nuestra política de cookies aquí

Acepto
Top