24 mai 2024
09:00 Defesa de Doutorado Sala 85 do IC2
Tema
Evolução de Entidades em Grafos de Conhecimento Temporais
Aluno
Anderson Rossanez
Orientador / Docente
Julio Cesar dos Reis - Coorientador: Ricardo da Silva Torres
Breve resumo
Considerando-se corpora de textos temporais, como artigos que documentam conhecimento produzido em pesquisas científicas, uma representação de conhecimento temporal adequada, assim como a análise de sua evolução, potencialmente beneficiarão pesquisadores, a comunidade científica e a sociedade em geral. Analisar a evolução de conhecimento é um problema de pesquisa desafiador, demandando a identificação e organização de entidades representando conceitos encontrados em documentos. Entidades são referenciadas geralmente em sentenças longas e complexas, apresentando relações implícitas, abreviaturas e correferências. Identificar entidades requer conhecimento prévio no domínio do texto, dificultando a realização automática da tarefa. Codificar a relevância das entidades em representações temporais de conhecimento requer técnicas de processamento computacional adicionais. Analisar a quantidade imensa de dados temporais resultante impõe dificuldades, demandando técnicas de visualização adequadas. Esta tese visa conceber, desenvolver e avaliar métodos inéditos para representação de conhecimento difundido em textos não-estruturados em língua natural, via geração semiautomática de grafos de conhecimento. A pesquisa visa assistir a análise da evolução de conhecimento, específica à variação de relevância de entidades. Desenvolvemos o conceito de grafos de conhecimento temporal na modelagem da evolução de conhecimento, em corpora de textos não-estruturados. Em nossa abordagem, aplicamos medidas de redes complexas em grafos de conhecimento temporais, para codificar a relevância de suas entidades. Adicionalmente, pesquisamos representações visuais inéditas para esta evolução, fomentando análises baseadas em evolução de conhecimento. Nossas contribuições incluem (1) um método de geração de grafos de conhecimento temporais a partir de corpora} de textos não-estruturados usando técnicas de processamento de língua natural; (2) introdução de medidas de centralidade fundamentadas em grafos de conhecimento, codificando a relevância de entidades, apoiadas por (3) um estudo que caracteriza propriedades de redes complexas em grafos de conhecimento, o que garante a aplicabilidade de medidas de redes complexas em análises de grafos de conhecimento; métodos de visualização para (4) representar e navegar através a estrutura de grafos de conhecimento temporal, e (5) representar variações de relevância de entidades através do tempo. Esta investigação também contribui com a implementação de ferramentas de software que instanciam os métodos originais desenvolvidos. Essas ferramentas foram utilizadas na avaliação dos métodos, utilizando documentos de textos reais, obtidos de fontes científicas, nos domínios da Ciência da Computação e Neurologia. Os resultados demonstram a efetividade dos métodos desenvolvidos, na geração de representações temporais de conhecimento, na codificação de relevância de entidades e nas visualizações da representação temporal, bem como variação de relevância das entidades.
Banca examinadora
Titulares:
Julio Cesar dos Reis IC/UNICAMP
Andre Santanche IC/UNICAMP
Solange Oliveira Rezende ICMC/USP
Damires Yluska de Souza Fernandes IFPB
Fernando Vieira Paulovich TU/e/Países Baixos
Suplentes:
Jacques Wainer IC/UNICAMP
Renata Wassermann IME/USP
Daniel dos Santos Kaster CCE/UEL