Instituto de Investigación en Ingeniería de Elche (I3E)

SLAM Visual en el Espacio 2-1/2D con Imágenes Omnidireccionales e Información de Puntos Característicos
Dr. David Valiente García

Actualmente dentro del campo de la robótica móvil se ha experimentado una importante

proliferación de aplicaciones. Encontramos una gran variedad de robots móviles

presentes en diversos sectores de nuestra sociedad, muchos de los cuales son aceptados

como autónomos. Este término implica que el robot es capaz de operar por sí mismo,

sin ningún tipo de supervisión especial. Para tal efecto, el robot debe ser habilitado para

recoger información del entorno, de modo que pueda construir su propio entendimiento

del mismo, tal como es una estimación de un mapa. El ámbito de esta tesis se concentra

en este aspecto: el proceso de construcción de mapas con información visual

del entorno. Este proceso implica una tarea de resolución no trivial, ya que plantea un

reto en lo que se refiere a la obtención simultánea de la localización del robot, pero

además del mapa. Esto último dirige hacia uno de los paradigmas más esenciales en

este contexto: el problema de SLAM (Simultaneous Localization And Mapping).

Distintos tipos de información pueden adquirirse mediante un conjunto bien conocido

de sensores embarcados en el robot, tales como láser, sónar, GPS, etc. Sin

embargo, las cámaras digitales emergen como una prometedora alternativa. Proporcionan

bajo consumo, bajo coste y ligereza. Además, estos sensores visuales suponen

una potencial herramienta para codificar grandes cantidades de información en una

única imagen. Así, en este trabajo proponemos un nuevo modelo de mapa, embebido

dentro de una propuesta de SLAM visual, la cual está basada únicamente en el uso de

imágenes omnidireccionales, adquiridas con una cámanra monocular. Una importante

fortaleza de esta cámara radica en su particular amplio campo de visión. Además,

procesamos la información extraída de puntos característicos, entendidos como marcas

físicas, los cuales son detectadas visualmente sobre las imágenes. Esta idea difiere de

las propuestas tradicionales, cuyo objeto se concentra en un esquema acumulativo para

la reestimación de todas las marcas del mapa.

En cuanto al algoritmo núcleo dentro de este contexto de SLAM visual, esta tesis

propone varias mejoras para la robustez de los modelos de algoritmos estándar. En

particular, presentamos un modelo personalizado de tipo offline, el cual es capaz de

reducir los efectos perjudiciales asociados con el ruido no lineal, tales como los introducidos

por las cámaras catadióptricas. Muchas de las propuestas más aceptadas

son altamente sentibles a estos efectos, y no logran asegurar la convergencia de la

estimación final.

Por otra parte, otro de los inconvenientes reconocidos de las primeras propuestas es

la gestión de la incertidumbre del sistema. Normalmente esto es debido a las mismas

fuentes no lineales. Consecuentemente, la estimación puede verse severamente dañada,

puesto que compromete dramáticamente su convergencia. En este sentido, esta tesis

contribuye a la consecución de un modelo robusto para la reducción de la incertidumbre,

la cual es concebida dinámicamente.

Como un compromiso general a lo largo de toda esta tesis, establecemos un marco

experimental para todas las propuestas y contribuciones surgidas de los resultados de

las investigaciones en este ámbito. De este modo, se presentan experimentos repetidamente

a lo largo de este documento, tanto con conjuntos de datos simulados como

reales.