Investigadores de las universidades de Washington y Cornell (EEUU) y de Microsoft Research diseñaron un sistema para rastrear y descargar las fotografías que han colgado los turistas en el sitio de imágenes Flickr.com. El buscador estaba programado para coger sólo las etiquetadas con las palabras Roma o Rome. Consiguieron 150.000 tomadas por miles de turistas con cámaras de decenas de marcas y modelos, a diferentes horas y con pericia desigual.
Para dar orden a este enorme puzzle de imágenes usaron una serie de algoritmos matemáticos con los que manipularon la información EXIF de cada fotografía. Esta incluye un conjunto de datos que, a modo de ADN de la imagen, recogen detalles como la marca y modelo de la cámara, dimensiones de la fotografía, fecha y hora de la exposición, distancia focal, etc. El objetivo era encontrar las más parecidas entre sí en función de su fotometría y combinarlas hasta crear un esqueleto de los paisajes más característicos de la ciudad, como la Basílica de San Pedro, el Panteón o la Fontana de Trevi. Como reconoce el profesor de informática de la Universidad de Washington y coautor del trabajo, Sameer Agarwal, "lo que queríamos era avanzar en la reconstrucción de grandes colecciones de imágenes de Internet organizadas según su parecido".
Los investigadores se encontraron con un dilema. "Si una localización se haya escasamente representada en la base de datos, más difícil será hallar fotos contiguas o similares con las que construir un modelo 3D", explica Agarwal. Pero, "si hay demasiadas del mismo sitio, subirán las necesidades de computación", aclara. Lo que hizo el equipo, que cuenta con la financiación de la Fundación Nacional de Ciencias de EEUU, fue modificar su programa para que el sistema dejara de buscar imágenes de un lugar concreto tras superar un umbral mínimo.
Este programa es una versión mejorada de Photo Tourism, una tecnología que licenciaron a Microsoft hace tres años para que la compañía lanzara su herramienta Photosynth. Con ambas se pueden crear vistas panorámicas, pero la ambición de los investigadores es recrear una ciudad entera. Para destripar las fotografías, el sistema empezó por pasarlas a escala de grises. Aunque el sistema intentó que los pares de imágenes parecidas estuvieran en el mismo disco duro, el tráfico entre los 496 ordenadores fue continuo hasta tener una enorme matriz con los datos esenciales de las 150.00 imágenes agrupadas por similitud.
En la actualidad ya existen sistemas de vistas panorámicas como Google Earth o Virtual Earth de Microsoft, pero ambos usan colecciones sistemáticas de fotografías aéreas o a pie de calle. El proceso para recrear Roma es diferente. Además de que las imágenes no están organizadas, este proyecto desintegra las fotografías para recombinarlas, y no pegando una junto a la otra.
El siguiente paso fue extraer de la matriz generada las coordenadas y el píxel de color de cada punto. Con ellos se puede hacer un render o imagen partiendo de un modelo. El efecto de la profundidad 3D se consiguió aplicando la estructura a partir del movimiento, un sistema que calcula geometría 3D a partir del movimiento 2D. La recreación es aún una ciudad a medio hacer, pero los impulsores del proyecto confían en que con más imágenes y ordenadores para procesarlas se pueda algún día volar sobre una Roma virtual completa.
Noticia publicada en Público (España)