A+A-ContrastAcessibilidade
EnglishPortuguese
Buscar

Defesa de Mestrado de Yuri Corrêa Pinto Soares

28 Fev
10:00 Defesa de Mestrado Auditório 1 - IC 3
Tema
A Framework for Reinforcement Learning in Bipedal Robotics
Aluno
Yuri Corrêa Pinto Soares
Orientador / Docente
Esther Luna Colombini
Breve resumo
A robótica e seus aplicações de serviço com robôs bípedes têm enfrentado um aumento significativo ultimamente uma vez que essa categoria de robôs é muito adequada para os ambientes originalmente projetados para operação humana. No entanto, a locomoção bípede provou ser um desafio na teoria e na prática devido à alta dimensionalidade do problema, já que a caminhada bípede normalmente requer um controle preciso em tempo real de vários atuadores e sensores acoplados a sistemas dinâmicos complexos. Concomitantemente, o aprendizado por reforço (AR) e sua versão profunda (DRL) estão se tornando uma abordagem proeminente na solução de problemas de controle tão desafiadores devido à sua capacidade de trabalhar com processos contínuos e livres de modelo. Neste trabalho, desenvolvemos um framework para integrar o simulador de alta fidelidade (V-REP) com a interface padrão usualmente empregada para o aprendizado por reforço (OpenAI Gym). Nosso framework, mesmo em seus estágios iniciais, já foi usado espontaneamente pela comunidade internacional durante seu desenvolvimento. Com base neste framework, aplicamos o DRL para aprender políticas diferentes em robôs simulados, bem como comparar os algoritmos relevantes. As políticas de locomoção na simulação foram obtidas usando algoritmos livres de modelos do estado da arte, propostos durante o desenvolvimento deste trabalho.
Banca examinadora
Titulares:
Esther Luna Colombini IC/UNICAMP
Marcos Ricardo Omena de Albuquerque Máximo ITA
Alexandre da Silva Simões ICTS/UNESP
Suplentes:
Leandro Aparecido Villas IC/UNICAMP
Eric Rohmer FEEC/Unicamp