30 nov 2020
14:00 Defesa de Doutorado Integralmente a distância
Tema
Cross-domain emotion detection in tweets
Aluno
Fernando José Vieira da Silva
Orientador / Docente
Ariadne Maria Brito Rizzoni Carvalho
Breve resumo
Emoções são de extrema importância para o ser humano, sendo foco de extensos estudos em diversas áreas da Ciência há muitos anos. Já na Ciência da Computação, o tema vem recebendo interesse cada vez maior, especialmente na detecção de emoções de forma automática. Esta tese aborda a tarefa de detecção automática de emoções em tweets -- textos curtos publicados em rede social -- escritos em Português. Em particular, ela estuda o problema de adaptação de domínio, em que um algoritmo de aprendizado de máquina é treinado com um conjunto de dados extraído de um corpus de um domínio de origem, mas é testado em amostras obtidas de um corpus de outro domínio "alvo". A tese defende que um algoritmo que utiliza a estrutura de árvore sintática dos tweets para aprender a identificar as emoções expressas neles obtém melhor performance para adaptação de domínio que um algoritmo similar que se baseia apenas na frequência de palavras. Para validar esta tese, dois corpora foram construídos e anotados com emoções: um corpus de tweets anotados automaticamente, tratando de diversos assuntos, e um corpus com tweets anotados manualmente, relacionados à bolsa de valores. O primeiro foi utilizado para treinar os algoritmos e o segundo foi utilizado apenas para teste, com o objetivo de comparar os algoritmos para adaptação de domínio. Ao final, a tese conclui que o algoritmo que utiliza a estrutura de árvore sintática de fato obtém melhores resultados apenas para a emoção "surpresa". Além disso, também apresenta resultados melhores para outras 4 emoções (num total de 8 avaliadas), porém sem suporte de teste estatístico. Contudo, a metodologia utilizada não se mostrou eficaz para discriminar tweets neutros -- que não expressam nenhuma emoção, havendo a necessidade de estudos futuros nessa direção. Além dessa conclusão, o trabalho apresentado nesta tese também mostrou que a metodologia proposta obteve melhores resultados na detecção de emoções de uma forma geral, ignorando o problema de adaptação de domínio. Todavia, esses resultados, quando comparados com trabalhos relacionados, ainda são inferiores aos apresentados por técnicas de Aprendizado Profundo, com exceção da emoção "antecipação", que obteve os melhores resultados entre todos os trabalhos anteriores revisados. No entanto, comparações com trabalhos anteriores devem ser vistas com ressalvas, uma vez que cada um deles se utilizou de corpora diferentes.
Banca examinadora
Titulares:
Ariadne Maria Brito Rizzoni Carvalho IC/UNICAMP
Thiago Alexandre Salgueiro Pardo ICMC/USP
Ivandré Paraboni EACH/USP
Tomasz Kowaltowski IC/UNICAMP
Julio Cesar dos Reis IC/UNICAMP
Suplentes:
Anderson de Rezende Rocha IC/UNICAMP
Jacques Wainer IC/UNICAMP
Clodoaldo Aparecido de Moraes Lima EACH/USP