25 abr 2025
14:00 Defesa de Doutorado Sala 85 do IC 2
Tema
Aprimorando Grafos de Conhecimento com Modelos de Linguagem de Grande Escala: Contribuições para Sistemas de Respostas a Perguntas em E-commerce
Aluno
André Gomes Regino
Orientador / Docente
Julio Cesar dos Reis
Breve resumo
Plataformas de e-commerce tornaram-se uma parte fundamental da economia global, facilitando milhões de transações diariamente. Um componente essencial dessas plataformas são os sistemas de Perguntas e Respostas (Q&A), que auxiliam os clientes a tomarem decisões de compra mais informadas. No entanto, garantir respostas precisas, contextualizadas e humanizadas continua sendo um grande desafio. Os Grafos de Conhecimento (KGs) surgiram como uma solução para estruturar e recuperar informações relevantes em sistemas de Q&A, mas sua criação e manutenção são complexas e exigem muitos recursos. A natureza dinâmica do e-commerce agrava esse desafio, demandando atualizações contínuas no KG com informações novas e verificadas. Esta tese de doutorado tem como objetivo projetar, avaliar e analisar novos métodos para aprimorar grafos de conhecimento existentes em sistemas de Q&A para e-commerce, utilizando Modelos de Linguagem de Grande Escala (LLMs). A abordagem proposta segue três etapas principais: (1) simplificação de sentenças para transformar textos de Q\&A em declarações factuais, (2) geração de triplas RDF a partir das declarações factuais usando LLMs e (3) validação das triplas geradas antes de integrá-las a um KG existente. Avaliamos sistematicamente diversas configurações de LLMs, incluindo idioma, tamanho do modelo, configurações de temperatura e variações de tarefas. As contribuições desta pesquisa são: primeiro, propomos um método para gerar triplas RDF a partir de texto e incorporá-las a um KG existente, utilizando especificações ontológicas e LLMs; segundo, apresentamos uma revisão sistemática da literatura que examina as abordagens mais avançadas para geração de triplas RDF a partir de linguagem natural, destacando o papel crescente dos transformers e redes neurais na construção de KGs. Terceiro, demonstramos como as triplas geradas podem ser utilizadas para humanizar respostas em sistemas de Q&A no e-commerce, melhorando a experiência do cliente por meio de respostas mais naturais. Quarto, exploramos o potencial dessas triplas na melhoria de sistemas de recomendação de produtos dentro de plataformas de e-commerce. Nosso estudo é baseado em conjuntos de dados do mundo real, garantindo relevância prática e aplicabilidade. Os resultados indicam que os LLMs podem ser uma ferramenta valiosa na engenharia de KGs, apoiando de forma eficaz as três etapas críticas: simplificação de sentenças, geração de triplas RDF e validação do conhecimento. Esta pesquisa fornece um framework abrangente para a integração de LLMs em fluxos de trabalho de KGs, avançando o campo da representação automatizada do conhecimento no e-commerce. Por fim, nossas descobertas contribuem para o desenvolvimento de sistemas de Q&A mais inteligentes, responsivos e intuitivos, aprimorando a experiência geral de e-commerce tanto para empresas quanto para consumidores.
Banca examinadora
Titulares:
Julio Cesar dos Reis IC/UNICAMP
Luiz Celso Gomes Junior DAINF/UTFPR
Cristina Dutra de Aguiar ICMC/USP
Nádia Félix Felipe da Silva INF/UFG
Allan Mariano de Souza IC/UNICAMP
Suplentes:
Seyed Jamalaldin Haddadi IC/UNICAMP
Frances Albert Santos Sinch BR
Veruska Carretta Zamborlini CT/Ufes