20fev2026
10:00 Defesa de Mestrado Sala 85 do IC, híbrida em meet.google.com/yxi-mria-apc
Tema
Recuperação de Informação baseada em LLM para Matchmaking B2B: Explorando Representações Compostas de Múltiplos Documentos Não Estruturados (MUd)
Aluno
Bruno Nogueira Renzo
Orientador / Docente
Marcelo da Silva Reis
Breve resumo
E-marketplaces B2B são plataformas onde compradores e vendedores se encontram para transacionar bens e serviços. Essas plataformas têm crescido de maneira substancial nos últimos anos, com e-commerce B2B, de forma mais geral, alcançando um tamanho de mercado aproximadamente duas vezes o de e-commerce B2C. Matchmaking B2B (isto é, o pareamento de entidades empresariais) é um componente essencial dessas plataformas. Por exemplo, um matchmaking robusto reduz o custo de busca do mercado e aumenta a sua eficiência. Uma das abordagens comuns na literatura é de formular esse pareamento como uma tarefa de recuperação de informação, na qual um conjunto de vendedores relevantes deve ser retornado para um dado comprador. Além disso, frequentemente cada uma dessas entidades empresariais é representada utilizando um único documento estruturado ou um único documento semiestruturado. Isto é, cada comprador e vendedor têm sua representação construída a partir de um conjunto de atributos predefinidos, como ‘nome da empresa’, ‘tamanho da empresa’, ‘indústria da empresa’, etc. Nós argumentamos, contudo, que essas representações restringem e simplificam os verdadeiros perfis, demandas e ofertas dessas entidades empresariais, e que documentos não estruturados deveriam ser usados em vez disso. Ademais, particularmente para vendedores, nós deveríamos usar, não um único, mas múltiplos documentos não estruturados (MUd), explorando o grande volume de dados que essas empresas já possuem disponíveis na internet (seus websites, postagens em blogs, podcasts, apresentações de pitches, etc.). Muito provavelmente, representações de documentos não estruturados não foram exploradas de maneira ampla na literatura dadas as limitações das tecnologias anteriores. Contudo, nós entendemos que com os constantes avanços nas capacidades de LLMs, essas representações podem ser utilizadas agora de maneira efetiva. Por isso, nesta dissertação, nós propomos uma nova arquitetura de recuperação de informação baseada em LLMs na qual cada comprador é representado através de um único documento não estruturado, e cada vendedor é representado através de múltiplos documentos não estruturados. Nós conduzimos três conjuntos principais de experimentos com resultados empíricos mostrando a eficiência superior de nossa arquitetura proposta, sua utilidade prática em aplicações B2B, e o valor/propriedades de cada um dos principais componentes dessa arquitetura.
Banca examinadora
Titulares:
| Marcelo da Silva Reis | IC/UNICAMP |
| Hélio Pedrini | IC/UNICAMP |
| Thiago Alexandre Salgueiro Pardo | ICMC/USP |
Suplentes:
| André Santanchè | IC/UNICAMP |
| Ronaldo Cristiano Prati | CMCC/UFABC |