23 out 2020
15:00 Defesa de Mestrado Integralmente a distância
Tema
Deep Reinforcement Learning for BipedalLocomotion
Aluno
Yuri Corrêa Pinto Soares
Orientador / Docente
Esther Luna Colombini
Breve resumo
Robótica e suas aplicações de serviço com robôs bípedes tem se expandido recentementedevido a possibilidade de se usar robôs desta categoria em ambientes originalmente plane-jados para operação humana. No entanto, locomoção bípede tem se mostrado um desafioteórico e prático devido a alta dimensionalidade do problema, visto que a ação de andartipicamente envolve o controle preciso em tempo-real de múltiplos atuadores e sensoresem conjunto com sistemas dinâmicos complexos. Concomitantemente, aprendizado porreforço (RL) e sua versão com redes neurais profundas (DRL) estão se tornando uma abor-dagem prominente para solucionar tais problemas, devido a sua capacidade de lidar comprocessos contínuos e livres de modelo. Neste trabalho, modelamos o problema de loco-moção como aprendizagem por reforço, propondo uma representação prática baseada emMDPs e múltiplas estratégias genéricas para funções de reforço. Em seguida, prossegui-mos desenvolvendo um framework para integrar nosso simulador de escolha (CoppeliaSim) com a interface corrente padrão para aprendizagem por reforço (OpenAI Gym).Finalmente, nós aplicamos algoritmos do estado-da-arte em aprendizado por reforço pro-fundo com nosso framework em experimentos configuráveis para validar nossa modelageme aprender uma política de caminhada estável em simulação para o robô da Marta, umsofisticado robô humanóide com 25 graus de liberdade.
Banca examinadora
Titulares:
Esther Luna Colombini IC/UNICAMP
Marcos Ricardo Omena de Albuquerque Maximo ITA
Eric Rohmer FEEC/UNICAMP
Suplentes:
Leandro Aparecido Villas IC/UNICAMP
Alexandre da Silva Simões ICTS/UNESP