04 out 2021
10:00 Defesa de Mestrado Integralmente a distância
Tema
Descritores Convolucionais Profundos para Registro Esparço e Denso em SLAM RGB-D
Aluno
Otávio Basso Gomes
Orientador / Docente
Gerberth Adín Ramírez Rivera
Breve resumo
Uma solução eficiente para corrigir desvios na estimação da trajetória da câmera em sistemas de Mapeamento e Localização Simultânea Visual (Visual Simultaneous Localization and Mapping - Visual SLAM) é usar a Otimização de Gráfico de Poses (Pose Graph Optimization - PGO) com submapas da cena gerados a partir de subconjuntos dos quadros do vídeo de entrada. Embora o PGO sozinho consiga oferecer alinhamento global consistente, ainda é necessário um estágio extra para alinhar os submapas de maneira pareada usando todas as suas superfícies tridimensionais, a fim de obter uma reconstrução ainda mais fina. No entanto, construir um gráfico de pose com fechamentos de loops adequados e realizar os alinhamentos pareados finais ainda são desafiadores quando a cena, e conseqüentemente os submapas, apresentam alterações fotométricas ao longo dos quadros do vídeo. Para resolver esse problema, investigamos a adição de descritores densos aprendidos por uma Rede Neural Convolucional (Convolutional Neural Network - CNN) aos elementos das superfícies dos submapas para melhorar a robustez na detecção de fechamento de loops e alinhamento pareado. Partimos do pressuposto que os descritores aprendidos capturam contexto semântico para além de informações estruturais ou fotométricas, e assim, melhorando essas duas tarefas. Outra vantagem de aplicar descritores densos de CNNs no Visual SLAM é um potencial ganho de desempenho em sistemas robóticos que também realizam análise semântica do ambiente, quando possível reutilizar o processamento de CNNs. Além disso, construímos um sistema de Visual SLAM para sensores RGB-D que inclui os descritores aprendidos de imagens como qualquer outra propriedades das superfícies, como suas cores ou normais. Nossos experimentos demonstram as possíveis vantagens desses descritores, produzindo resultados equivalentes às técnicas padrões para Visual SLAM.
Banca examinadora
Titulares:
Gerberth Adín Ramírez Rivera IC/UNICAMP
Esther Luna Colombini IC/UNICAMP
Valdir Grassi Junior EESC/USP
Suplentes:
Hélio Pedrini IC/UNICAMP
Eric Rohmer FEEC/UNICAMP