Defesa de Mestrado de Gabriel Moraes Barros

22 abr 2020

14:00 Defesa de Mestrado Integralmente em distância

Relacionado

Tema

Imitation Learning for Mobile Robots Control

Aluno

Gabriel Moraes Barros

Orientador / Docente

Esther Luna Colombini

Breve resumo

Na robótica, o objetivo final do aprendizado é dotar robôs da habilidade de aprender, melhorar, adaptar e reproduzir tarefas com restrições que mudam dinamicamente baseados na exploração e no aprendizado autônomo. O Aprendizado por Reforço (AR) procura resolver este problema ao permitir que robôs aprendam por tentativa-e-erro.Entretanto, como o espaço de estados e ações deste problema é, geralmente, contínuo e de alta dimensionalidade, aproximadores de função não lineares são utilizados para encontrar representações de baixa dimensionalidade. Redes Neurais (RN) estão sendo empregadas com relativo sucesso em tarefas de controle e são os aproximadores de funções mais utilizados em publicações recentes quando associados à AR. Com AR, uma Rede Neural pode ser treinada para diretamente mapear o estado do robô para comandos dos atuadores, tornando qualquer estrutura de controle pré-definida desnecessária para o treinamento.No entanto, como este conhecimento é geralmente construído do zero, a fase de aprendizado pode levar muito tempo e a definição de uma função de reforço capaz de levar à solução adequada do problema pode ser uma tarefa não-trivial. Para mitigar estes problemas, o Aprendizado por Imitação (AI) tem sido empregado para replicar ou imitar o comportamento de outro agente quando uma função de recompensa explícita não está disponível ou quando se deseja trabalhar sobre supervisão fornecida por um expert. Neste trabalho, o algoritmo Soft Actor-Critic (SAC) é utilizado para treinar uma política de referência em um robô que será empregada como base para geração de trajetórias mais gerais que aquelas treinadas. A partir desta política de referência, um algoritmo de Aprendizado por Imitação– GAIL- aprende a imitar o comportamento das demonstrações do agente expert de forma a extrapolar a política original aprendida.

Banca examinadora

Titulares:

Esther Luna Colombini	IC/UNICAMP
Reinaldo Augusto da Costa Bianchi	DEE/FEI
Hélio Pedrini	IC/UNICAMP

Suplentes:

Leonardo Montecchi	IC/UNICAMP
Alexandre da Silva Simões	ICTS/UNESP

Defesa de Mestrado de Gabriel Moraes Barros

Relacionado

Notícias

IC divulga o selecionado para PPPD – 3º Edital 2024

Concurso público de provas e títulos na área Arquitetura de Computadores tem data divulgada.

Laboratório de Sistemas de Computação (LSC) do IC-UNICAMP tem vaga para Pós-Doutor

Parceiros