18 dez 2025
14:00 Defesa de Mestrado integralmente à distância
Tema
Roteamento inteligente, explicável e adaptável em Redes Definidas por Software
Aluno
Yeison Stiven Murcia Calvo
Orientador / Docente
Nelson Luis Saldanha da Fonseca - Coorientador: Oscar Mauricio Caicedo Rendon
Breve resumo
A gestão de redes de comunicação entrou em uma nova era, impulsionada por paradigmas como as Redes Definidas por Software, do inglês Software-Defined Networks (SDN), e a aplicação da Inteligência Artificial, do inglês Artificial Intelligence (AI). Em particular, o Aprendizado por Reforço, do inglês Reinforcement Learning (RL), e o Aprendizado por Reforço Profundo, do inglês Deep Reinforcement Learning (DRL), foram adotados como soluções poderosas para automatizar o roteamento de tráfego. No entanto, a natureza “caixa preta” desses modelos representa um obstáculo crítico para sua implantação em ambientes de produção, uma vez que a falta de transparência dificulta a confiança do operador, a depuração de comportamentos anômalos e a otimização informada do sistema. Esta dissertação aborda esse desafio em duas etapas, progredindo da interpretabilidade para uma adaptação dinâmica e inteligente. A primeira etapa apresenta o eXplaNet, um pipeline sistemático, que utiliza a Inteligência Artificial Explicável, do inglês Explainable Artificial Intelligence (XAI), não apenas para interpretar, mas também para melhorar ativamente as políticas de roteamento. Aplicado rigorosamente a dois modelos de roteamento inteligente, RSIR e DRSIR, o eXplaNet utiliza modelos substitutos e técnicas de relevância de características para identificar as métricas de rede mais influentes. Esse processo gerou as variantes estáticas aprimoradas, XRSIR e XDRSIR, que evidenciaram melhorias significativas e quantificáveis em métricas críticas como vazão, atraso, estiramento e perda de pacotes. Embora a otimização estática represente um avanço significativo, as redes reais são inerentemente dinâmicas, o que torna qualquer configuração fixa subótima. Para superar essa limitação, a segunda etapa da pesquisa introduz o LARO (LLM-driven Adaptive Reward Optimizer), uma arquitetura inovadora que integra um Modelo de Linguagem Grande, do inglês Large Language Model (LLM), como um módulo de controle de segundo nível. O LARO converte a função de recompensa estática em um mecanismo adaptativo, analisando o estado da rede em tempo real e ajustando continuamente os pesos da função de recompensa do agente DRL. A avaliação experimental demonstrou que o sistema adaptativo LARO supera consistentemente não apenas o modelo básico, mas também as melhores configurações estáticas otimizadas. A chave do seu sucesso reside na sua capacidade de realizar um “compromisso inteligente” (smart trade-off ): o sistema aceita rotas marginalmente mais longas para evitar ligações congestionadas, o que se traduz em melhorias significativas nas métricas mais críticas da Qualidade de Serviço do inglês Quality of Service (QoS), incluindo a redução do atraso e da perda de pacotes e o aumento da vazão. Em conjunto, esta dissertação traça um percurso desde a otimização estática até a adaptação dinâmica, demonstrando como a sinergia entre DRL, XAI e LLMs pode resolver problemas complexos na gestão de redes, transformando modelos opacos em sistemas de roteamento transparentes, otimizados e adaptativos.
Banca examinadora
Titulares:
Nelson Luis Saldanha da Fonseca IC/UNICAMP
Jussara Marques de Almeida DCC/UFMG
Marcelo da Silva Reis IC/UNICAMP
Suplentes:
Julio Cesar dos Reis IC/UNICAMP
Juliana de Santi DAINF/UTFPR