25 abr 2024
10:00 Defesa de Mestrado Auditório do IC3
Tema
Adaptando autoencoders para reduzir dimensionalidade e preservar informação no contexto de reconhecimento de atividades humanas
Aluno
Darlinne Hubert Palo Soto
Orientador / Docente
Edson Borin
Breve resumo
Este trabalho estuda se diferentes redutores de dimensionalidade podem descobrir automaticamente (sem intervenção humana) uma representação de dados boa e compacta o suficiente para preservar a maior parte das informações em dados de séries temporais obtidos de sensores de movimento (acelerômetro e giroscópio), tudo no contexto da tarefa de Reconhecimento de Atividade Humana (HAR). Dessa forma, não são permitidas transformações na natureza dos dados, como a transformada de Fourier ou similares. Os redutores estudados foram duas variantes de autoencoder, e UMAP. A adição de características topológicas como um termo de regularização é uma nova estratégia, enquanto a adição de convoluções é uma estratégia comum em vários trabalhos. Por outro lado, UMAP apresentou bons resultados quando foi previamente testado com representações de dados no domínio da frequência. Uma representação de dados com uma pequena perda de informação deveria permitir que modelos de classificação simples (como Random Forest, Support Vector Machines e K-Nearest Neighbors) alcancem resultados semelhantes ou melhores do que usando a representação de dados original. Consequentemente, essas melhorias também deveriam mostrar a capacidade ou não do redutor de produzir boas representações de dados. Para garantir o desempenho máximo de todos os redutores (e assim a imparcialidade no processo de comparação), foi realizada uma busca de hiperparâmetros para cada um e, em seguida, foram contrastados com dados não vistos. Os resultados confirmam que os autoencoders genéricos têm problemas para descobrir boas representações, enquanto os autoencoders convolucionais são mais adequados para a tarefa. Além disso, adicionar topologia aos autoencoders geralmente resultou em acurácias mais baixas. Mas mesmo essa variante topológica foi superior ao UMAP. Por outro lado, olhar para as dimensionalidades na busca de hiperparâmetros revelou que melhorias na precisão não estavam necessariamente ligadas a dimensionalidades altas. Em vez disso, uma pequena porcentagem das dimensões originais foi suficiente para alcançar o desempenho máximo dos redutores.
Banca examinadora
Titulares:
Edson Borin IC/UNICAMP
Flavia Cristina Bernardini IC/UFF
Paula Dornhofer Paro Costa FEEC/UNICAMP
Suplentes:
Hélio Pedrini IC/UNICAMP
Daniel Carlos Guimarães Pedronette IGCE/UNESP
Pedro Mário Cruz e Silva NVIDIA