SLAM Visual en el Espacio 2-1/2D con Imágenes Omnidireccionales e Información de Puntos Característicos
Dr. David Valiente García

Actualmente dentro del campo de la robótica móvil se ha experimentado una importante
proliferación de aplicaciones. Encontramos una gran variedad de robots móviles
presentes en diversos sectores de nuestra sociedad, muchos de los cuales son aceptados
como autónomos. Este término implica que el robot es capaz de operar por sí mismo,
sin ningún tipo de supervisión especial. Para tal efecto, el robot debe ser habilitado para
recoger información del entorno, de modo que pueda construir su propio entendimiento
del mismo, tal como es una estimación de un mapa. El ámbito de esta tesis se concentra
en este aspecto: el proceso de construcción de mapas con información visual
del entorno. Este proceso implica una tarea de resolución no trivial, ya que plantea un
reto en lo que se refiere a la obtención simultánea de la localización del robot, pero
además del mapa. Esto último dirige hacia uno de los paradigmas más esenciales en
este contexto: el problema de SLAM (Simultaneous Localization And Mapping).
Distintos tipos de información pueden adquirirse mediante un conjunto bien conocido
de sensores embarcados en el robot, tales como láser, sónar, GPS, etc. Sin
embargo, las cámaras digitales emergen como una prometedora alternativa. Proporcionan
bajo consumo, bajo coste y ligereza. Además, estos sensores visuales suponen
una potencial herramienta para codificar grandes cantidades de información en una
única imagen. Así, en este trabajo proponemos un nuevo modelo de mapa, embebido
dentro de una propuesta de SLAM visual, la cual está basada únicamente en el uso de
imágenes omnidireccionales, adquiridas con una cámanra monocular. Una importante
fortaleza de esta cámara radica en su particular amplio campo de visión. Además,
procesamos la información extraída de puntos característicos, entendidos como marcas
físicas, los cuales son detectadas visualmente sobre las imágenes. Esta idea difiere de
las propuestas tradicionales, cuyo objeto se concentra en un esquema acumulativo para
la reestimación de todas las marcas del mapa.
En cuanto al algoritmo núcleo dentro de este contexto de SLAM visual, esta tesis
propone varias mejoras para la robustez de los modelos de algoritmos estándar. En
particular, presentamos un modelo personalizado de tipo offline, el cual es capaz de
reducir los efectos perjudiciales asociados con el ruido no lineal, tales como los introducidos
por las cámaras catadióptricas. Muchas de las propuestas más aceptadas
son altamente sentibles a estos efectos, y no logran asegurar la convergencia de la
estimación final.
Por otra parte, otro de los inconvenientes reconocidos de las primeras propuestas es
la gestión de la incertidumbre del sistema. Normalmente esto es debido a las mismas
fuentes no lineales. Consecuentemente, la estimación puede verse severamente dañada,
puesto que compromete dramáticamente su convergencia. En este sentido, esta tesis
contribuye a la consecución de un modelo robusto para la reducción de la incertidumbre,
la cual es concebida dinámicamente.
Como un compromiso general a lo largo de toda esta tesis, establecemos un marco
experimental para todas las propuestas y contribuciones surgidas de los resultados de
las investigaciones en este ámbito. De este modo, se presentan experimentos repetidamente
a lo largo de este documento, tanto con conjuntos de datos simulados como
reales.