10 nov 2023
09:00 Defesa de Mestrado Auditório do IC3
Tema
Aprendizado por Poucas Amostras Baseado em Transformers para Classificação de Cenas em Imagens de Abuso Sexual Infantil
Aluno
Thamiris Florindo Coelho
Orientador / Docente
Sandra Eliza Fontes de Avila - Coorientador: Jefersson Alex dos Santos
Breve resumo
O abuso sexual é um crime que afeta muitas crianças ao redor do mundo. Infelizmente, o volume de material multimídia produzido diariamente é muito maior do que a capacidade de análise visual feita por profissionais da aplicação da lei. Nesse contexto, ter uma ferramenta confiável que classifique automaticamente o material de abuso sexual infantil é essencial. Métodos de Aprendizado Profundo, estado da arte para problemas de classificação de imagem, demandam grandes quantidades de dados para treinamento. Mesmo com um grande volume de dados disponíveis, a anotação dessas imagens é muito custosa. Além disso, devido a barreiras legais e éticas, esses dados sensíveis só podem ser acessados por agentes da polícia. Para lidar com isso, alguns métodos tentam ajudar as investigações resolvendo um problema relacionado. A classificação de cenas internas pode ajudar a detectar ambientes nos quais esse tipo de conteúdo é tipicamente composto. No entanto, nesses ambientes, a presença de um objeto pode mudar completamente a classificação. Módulos de atenção da arquitetura Transformers podem dar atenção às partes essenciais dos dados para resolver algumas tarefas. Assim, para focar em objetos presentes em cenas, esse trabalho propõe o uso de modelos baseados em Transformers. Além disso, para lidar com o desafio de anotar os dados, utilizamos aprendizagem com poucas amostras (few-shot learning), uma técnica de aprendizado supervisionado que aprende com poucas amostras anotadas. Analisamos alguns modelos de few-shot learning clássicos e comparamos modelos baseados em Transformers. Nossos resultados indicam que o uso de Transformers é benéfico no contexto de classificação de cenas internas. Observamos também que a maioria dos trabalhos analisados utiliza um mesmo método de agrupamento de vetores de características, portanto, nesse sentido investigamos o uso de diferentes métodos, concluindo que agregar os vetores utilizando a média é o melhor para o conjunto de cenas internas.
Banca examinadora
Titulares:
Sandra Eliza Fontes de Avila IC/UNICAMP
Moacir Antonelli Ponti ICMC/USP
Esther Luna Colombini IC/UNICAMP
Suplentes:
Helena de Almeida Maia IC/UNICAMP
Daniel Henriques Moreira Loyola University Chicago