|
¿Dónde estoy? Esta es la pregunta que se podría hacer un robot (si no tuviera un móvil con GPS). El objetivo de este trabajo es abordar el problema de la localización utilizando imágenes omnidireccionales captadas por un sistema de visión catadióptrico montado en el robot. Este sistema de visión permite obtener una vista de 360º alrededor del robot. Para resolver este problema, exploramos el potencial de las Redes Neuronales Siamesas para modelar entornos interiores utilizando imágenes panorámicas como única fuente de información. Las Redes Neuronales Siamesas se caracterizan por su capacidad para generar una función de similitud entre dos datos de entrada, en este caso, entre dos imágenes panorámicas. Ambas redes Siamesas se entrenan mostrándole ejemplos de imágenes similares (de la misma zona) e imágenes diferentes (correspondientes a zonas diferentes). En este estudio se utilizan Redes Neuronales Siamesas compuestas por dos Redes Neuronales Convolucionales (CNNs). La salida de cada CNN es un descriptor que se utiliza para caracterizar cada imagen. La diferencia de las imágenes se calcula midiendo la distancia entre estos descriptores.
|