29abr2026
09:00 Defesa de Mestrado Auditório do IC3
Tema
DMCR: Datamodels para Redução de Contexto em Geração Aumentada por Recuperação
Aluno
Caio Emanuel Rhoden
Orientador / Docente
Marcos Medeiros Raimundo
Breve resumo
Embora a Geração Aumentada por Recuperação (RAG) aprimore os Grandes Modelos de Linguagem (LLMs) em tarefas com uso intensivo de conhecimento, o desempenho é frequentemente prejudicado por documentos irrelevantes ou que causam distração dentro da janela de contexto. As mitigações atuais dependem fortemente de re-rankers pré-treinados computacionalmente caros que, muitas vezes, carecem de transparência. Neste trabalho, propomos o Datamodels for Context Reduction (DMCR), um framework de re-ranqueamento do tipo "caixa-preta" que utiliza os pesos de surrogate models para destilar as informações mais relevantes. Ao treinar datamodels em subconjuntos de contextos amostrados e avaliados por LLM-as-a-judge, DMCR identifica as combinações específicas de documentos que maximizam a qualidade da geração. Além disso, nosso método oferece resultados competitivos em comparação a re-rankers pré-treinados, proporcionando interpretabilidade inerente para a tarefa de re-ranqueamento em RAG.
Banca examinadora
Titulares:
Marcos Medeiros Raimundo IC/UNICAMP
Jayr Alencar Pereira IISCA/UFCA
Washington Luiz Miranda da Cunha ICEx/UFMG
Suplentes:
Sandra Eliza Fontes de Avila IC/UNICAMP
Rodrigo Frassetto Nogueira Maritaca AI
Thiago Alexandre Salgueiro Pardo ICMC/USP