30 nov 2020
14:00 Defesa de Doutorado Integralmente a distância
Tema
Cross-domain emotion detection in tweets
Aluno
Fernando José Vieira da Silva
Orientador / Docente
Ariadne Maria Brito Rizzoni Carvalho
Breve resumo
Emoções são de extrema importância para o ser humano, sendo foco de extensos
estudos em diversas áreas da Ciência há muitos anos. Já na Ciência da
Computação, o tema vem recebendo interesse cada vez maior, especialmente na
detecção de emoções de forma automática.
Esta tese aborda a tarefa de detecção automática de emoções em tweets -- textos
curtos publicados em rede social -- escritos em Português. Em particular, ela
estuda o problema de adaptação de domínio, em que um algoritmo de
aprendizado de máquina é treinado com um conjunto de dados extraído de um
corpus de um domínio de origem, mas é testado em amostras obtidas de um
corpus de outro domínio "alvo". A tese defende que um algoritmo que utiliza a
estrutura de árvore sintática dos tweets para aprender a identificar as emoções
expressas neles obtém melhor performance para adaptação de domínio que um
algoritmo similar que se baseia apenas na frequência de palavras.
Para validar esta tese, dois corpora foram construídos e anotados com emoções:
um corpus de tweets anotados automaticamente, tratando de diversos assuntos, e
um corpus com tweets anotados manualmente, relacionados à bolsa de valores. O
primeiro foi utilizado para treinar os algoritmos e o segundo foi utilizado apenas
para teste, com o objetivo de comparar os algoritmos para adaptação de domínio.
Ao final, a tese conclui que o algoritmo que utiliza a estrutura de árvore sintática de
fato obtém melhores resultados apenas para a emoção "surpresa". Além disso,
também apresenta resultados melhores para outras 4 emoções (num total de 8
avaliadas), porém sem suporte de teste estatístico. Contudo, a metodologia
utilizada não se mostrou eficaz para discriminar tweets neutros -- que não
expressam nenhuma emoção, havendo a necessidade de estudos futuros nessa
direção.
Além dessa conclusão, o trabalho apresentado nesta tese também mostrou que a
metodologia proposta obteve melhores resultados na detecção de emoções de
uma forma geral, ignorando o problema de adaptação de domínio. Todavia, esses
resultados, quando comparados com trabalhos relacionados, ainda são inferiores
aos apresentados por técnicas de Aprendizado Profundo, com exceção da
emoção "antecipação", que obteve os melhores resultados entre todos os
trabalhos anteriores revisados. No entanto, comparações com trabalhos anteriores
devem ser vistas com ressalvas, uma vez que cada um deles se utilizou de corpora
diferentes.
Banca examinadora
Titulares:
Ariadne Maria Brito Rizzoni Carvalho | IC/UNICAMP |
Thiago Alexandre Salgueiro Pardo | ICMC/USP |
Ivandré Paraboni | EACH/USP |
Tomasz Kowaltowski | IC/UNICAMP |
Julio Cesar dos Reis | IC/UNICAMP |
Suplentes:
Anderson de Rezende Rocha | IC/UNICAMP |
Jacques Wainer | IC/UNICAMP |
Clodoaldo Aparecido de Moraes Lima | EACH/USP |