22 abr 2020
14:00 Defesa de Mestrado Integralmente em distância
Tema
Imitation Learning for Mobile Robots Control
Aluno
Gabriel Moraes Barros
Orientador / Docente
Esther Luna Colombini
Breve resumo
Na robótica, o objetivo final do aprendizado é dotar robôs da habilidade de aprender, melhorar, adaptar e reproduzir tarefas com restrições que mudam dinamicamente baseados na exploração e no aprendizado autônomo. O Aprendizado por Reforço (AR) procura resolver este problema ao permitir que robôs aprendam por tentativa-e-erro.Entretanto, como o espaço de estados e ações deste problema é, geralmente, contínuo e de alta dimensionalidade, aproximadores de função não lineares são utilizados para encontrar representações de baixa dimensionalidade. Redes Neurais (RN) estão sendo empregadas com relativo sucesso em tarefas de controle e são os aproximadores de funções mais utilizados em publicações recentes quando associados à AR. Com AR, uma Rede Neural pode ser treinada para diretamente mapear o estado do robô para comandos dos atuadores, tornando qualquer estrutura de controle pré-definida desnecessária para o treinamento.No entanto, como este conhecimento é geralmente construído do zero, a fase de aprendizado pode levar muito tempo e a definição de uma função de reforço capaz de levar à solução adequada do problema pode ser uma tarefa não-trivial. Para mitigar estes problemas, o Aprendizado por Imitação (AI) tem sido empregado para replicar ou imitar o comportamento de outro agente quando uma função de recompensa explícita não está disponível ou quando se deseja trabalhar sobre supervisão fornecida por um expert. Neste trabalho, o algoritmo Soft Actor-Critic (SAC) é utilizado para treinar uma política de referência em um robô que será empregada como base para geração de trajetórias mais gerais que aquelas treinadas. A partir desta política de referência, um algoritmo de Aprendizado por Imitação– GAIL- aprende a imitar o comportamento das demonstrações do agente expert de forma a extrapolar a política original aprendida.
Banca examinadora
Titulares:
Esther Luna Colombini IC/UNICAMP
Reinaldo Augusto da Costa Bianchi DEE/FEI
Hélio Pedrini IC/UNICAMP
Suplentes:
Leonardo Montecchi IC/UNICAMP
Alexandre da Silva Simões ICTS/UNESP