17 mar 2025
09:00 Defesa de Doutorado Auditório do IC3
Tema
A Motivation-Driven Incremental Learning Framework for Robotics
Aluno
Letícia Mara Berto
Orientador / Docente
Esther Luna Colombini - Coorientador: Ricardo Ribeiro Gudwin
Breve resumo
A integração de robôs nas atividades diárias está crescendo, exigindo sua adaptação a ambientes cada vez mais complexos. Essa adaptação requer o desenvolvimento de capacidades de aprendizado por meio da interação com o ambiente e outros agentes, permitindo a execução de tarefas além das instruções programadas. No centro desse processo está a cognição, a capacidade de transformar informações de diversas fontes em conhecimento prático por meio de funções cognitivas interconectadas. %Essas funções devem atuar de forma coesa, mas sua emergência provavelmente depende de condições fundamentais. Nossa pesquisa está fundamentada na robótica cognitiva e de desenvolvimento, inspirada nos processos de desenvolvimento humano, e contribui para o entendimento de como robôs integram motivação, tomada de decisão e adaptabilidade para operar de forma autônoma e interagir significativamente com humanos e outros robôs em ambientes dinâmicos. Experimentos iniciais focaram na interação do robô com o ambiente, enquanto estudos posteriores incorporaram interação social. Um dos desafios centrais na robótica é replicar a tomada de decisão. Então adaptamos um experimento humano, envolvendo incertezas, recompensas e punições, para o contexto robótico. Utilizando aprendizado por reforço, treinamos robôs simulados para manter a homeostase. Os resultados indicaram que robôs que adotaram estratégias de longo prazo não apenas sobrevivem por mais tempo, mas também satisfizem melhor diversas necessidades. Além de atender às necessidades básicas, os humanos desenvolvem preferências influenciadas pelo prazer percebido, adicionando complexidade à tomada de decisão. Para modelar isso, estendemos a teoria motivacional de Hull, incorporando dimensões hedônicas que permitem aos robôs equilibrar necessidades e preferências de acordo com o contexto. Treinamos três agentes com taxas metabólicas distintas em ambientes variados. Nossos resultados mostraram que os agentes se adaptaram de forma mais eficaz quando as condições ambientais estavam alinhadas às suas necessidades metabólicas. Além disso, a introdução do prazer no modelo motivacional influenciou o comportamento, especialmente em agentes com taxas metabólicas moderadas. Sob pressões de sobrevivência, os agentes priorizaram necessidades imediatas em detrimento do prazer, destacando a interação dinâmica entre motivação, prazer e contexto ambiental na tomada de decisão. Para explorar a interação humano-robô, desenvolvemos uma arquitetura cognitiva inspirada nas necessidades de crianças pequenas, incorporando três necessidades: aprendizado, interação e recarga. Ajustando a importância dessas necessidades, criamos dois perfis de robôs: Playful e Social. Experimentos demonstraram que mudanças na importância das necessidades resultaram em comportamentos distintos nos robôs e nas percepções humanas. Os participantes adaptaram suas interações aos comportamentos dos robôs, atribuindo características alinhadas aos perfis, mesmo sem conhecimento prévio. Por fim, examinamos interações entre dois agentes robóticos com necessidades variadas, utilizando teoria da mente para estimar e responder às demandas do outro. Os agentes equilibraram ações em benefício próprio ou do parceiro com base em preferências e urgências, revelando insights sobre a tomada de decisão colaborativa.
Banca examinadora
Titulares:
Esther Luna Colombini IC/UNICAMP
João Eduardo Kogler Junior PSI/USP
Diana Francisca Adamatti C3/FURG
Sandra Eliza Fontes de Avila IC/UNICAMP
Carlos Henrique Costa Ribeiro COMP/ITA
Suplentes:
Julio Cesar dos Reis IC/UNICAMP
Rodrigo da Silva Guerra C3/FURG
Reinaldo Augusto da Costa Bianchi FEI