29abr2026
09:00 Defesa de Mestrado Auditório do IC3
Tema
DMCR: Datamodels para Redução de Contexto em Geração Aumentada por Recuperação
Aluno
Caio Emanuel Rhoden
Orientador / Docente
Marcos Medeiros Raimundo
Breve resumo
Embora a Geração Aumentada por Recuperação (RAG) aprimore os Grandes Modelos de Linguagem (LLMs) em tarefas com uso intensivo de conhecimento, o desempenho é frequentemente prejudicado por documentos irrelevantes ou que causam distração dentro da janela de contexto. As mitigações atuais dependem fortemente de re-rankers pré-treinados computacionalmente caros que, muitas vezes, carecem de transparência. Neste trabalho, propomos o Datamodels for Context Reduction (DMCR), um framework de re-ranqueamento do tipo "caixa-preta" que utiliza os pesos de surrogate models para destilar as informações mais relevantes. Ao treinar datamodels em subconjuntos de contextos amostrados e avaliados por LLM-as-a-judge, DMCR identifica as combinações específicas de documentos que maximizam a qualidade da geração. Além disso, nosso método oferece resultados competitivos em comparação a re-rankers pré-treinados, proporcionando interpretabilidade inerente para a tarefa de re-ranqueamento em RAG.
Banca examinadora
Titulares:
| Marcos Medeiros Raimundo | IC/UNICAMP |
| Jayr Alencar Pereira | IISCA/UFCA |
| Washington Luiz Miranda da Cunha | ICEx/UFMG |
Suplentes:
| Sandra Eliza Fontes de Avila | IC/UNICAMP |
| Rodrigo Frassetto Nogueira | Maritaca AI |
| Thiago Alexandre Salgueiro Pardo | ICMC/USP |