Defesa de Mestrado de Vandalis Giansante

Título do Trabalho
Um Arcabouço Baseado em Anotações para Enriquecimento Semântico de Documentos Textuais
Candidato(a)
Vandalis Giansante
Nível
Mestrado
Data
31/08/20172017-08-30 21:00:00 2017-08-30 21:00:00 Defesa de Mestrado de Vandalis Giansante Um Arcabouço Baseado em Anotações para Enriquecimento Semântico de Documentos Textuais Auditório do IC 2 - Sala 85 INSTITUTO DE COMPUTAÇÃO mauroesc@ic.unicamp.br America/Sao_Paulo public
Horário
14:00
Local
Auditório do IC 2 - Sala 85
Orientador(a)
Ricardo da Silva Torres
Banca Examinadora
Banca Examinadora
Titulares (Professores Doutores) Unidade / Instituição
Ricardo da Silva Torres  IC/UNICAMP
Carla Geovana do Nascimento Macario  EMBRAPA
Joana Esther Gonzales Malaverri  IC/UNICAMP
Suplentes (Professores Doutores) Unidade / Instituição
André Santanchè  IC/UNICAMP
Luiz Celso Gomes Junior  UTFPR
Resumo

Executar tarefas analíticas, como agrupamento e classificação, em coleções de dados textuais são objeto de estudo constante em diversas áreas e, em especial, na área de Recuperação de Informação. O enriquecimento semântico é uma forma típica usada para tornar mais representativo a descrição de documentos textuais, visando obter melhores resultados em tarefas de mineração de texto. Este trabalho propõe um arcabouço baseado no uso de workflows para a execução de tarefas de classificação de coleções de texto enriquecidas semanticamente. Umworkflow típico do arcabouço é composto de (i) um extrator de grafos como forma de representação das amostras da coleção, (ii) um enriquecedor semântico dos grafos obtidos a partir do uso de ontologias (por exemplo, a ontologia Wordnet), (iii) do uso do framework Bag of Textual Graphs (BoTG) para representação de grafos em vetores visando permitir a classificação dosgrafos enriquecidos. Os componentes permitem diferentes parametrizações com o objetivo de obter bons resultados em tarefas de classificação de texto. Os resultados obtidos confirmam os benefícios do uso de workflows na especificação e implementação de procedimentos de anotação e classificação de documentos textuais e apontam para resultados promissores na utilização de ontologias em determinados cenários de classificação deste tipo de documento.