28 jul 2025
09:00 Defesa de Doutorado sala 85 do IC2
Tema
Building Flyweight CNNs for Salient Object Detection
Aluno
Leonardo de Mélo João
Orientador / Docente
Alexandre Xavier Falcão - Coorientadores: Ewa Kijak e Jancarlo Ferreira Gomes
Breve resumo
A Detecção de Objetos Salientes (SOD) frequentemente depende de redes neurais profundas que demandam muitos recursos computacionais, exigem treinamento caro, e grandes conjuntos de dados anotados-–o que impõe desafios na análise de imagens biomédicas, onde a anotação especializada é difícil. Além disso, a interpretabilidade é crucial para diagnósticos automatizados. Esta tese de doutorado aborda essas questões desenvolvendo \textbf{modelos de SOD compactos e explicáveis} como Redes Neurais Convolucionais (CNNs) que necessitem de poucas anotações e baixo poder computacional. A hipótese é que modelos leves podem obter resultados equivalentes a modelos complexos do estado-da-arte quando ajustados para aplicações específicas com dados rotulados limitados. Para atingir esse objetivo, aproveitou-se \textbf{conhecimento específico do domínio} dentro do arcabouço \textbf{Feature Learning by Image Marker (FLIM)}, que permite que as CNNs aprendam a partir de regiões discriminativas de imagens representativas, indicadas por especialistas. Uma contribuição significativa é a introdução de \textbf{decodificadores adaptativos não supervisionados}, eliminando a necessidade de dados anotados e retropropagação. Esses decodificadores estimam a importância das características de forma dinâmica, auxiliando na visualização durante o treinamento. Uma \textbf{nova formulação do FLIM} também separa os conjuntos de marcadores utilizados no aprendizado dos filtros e na Normalização Baseada em Marcadores (MBN), possibilitando uma análise mais profunda dos efeitos do MBN. Foram introduzidos \textbf{marker bots e marcadores estendidos por superpixel} para controlar as taxas de amostragem. Kernels \textbf{separáveis com multi-dilatação} foram implementados sem retropropagação para otimizar ainda mais a eficiência, permitindo que decodificadores adaptativos de camada única capturem informações em múltiplas escalas. Também foi desenvolvido um \textbf{algoritmo de poda} específico para o FLIM, com o objetivo de eliminar kernels redundantes. A validação em conjuntos de dados biomédicos--ovos de Schistosoma mansoni em microscopia óptica e tumores cerebrais em ressonância magnética-–demonstrou que as \textbf{CNNs peso-mosca superam as redes FLIM padrão} enquanto competem com modelos pesados em cenários com escassez de dados. Este trabalho estabelece uma base para a detecção de objetos baseada em saliência, como tarefa preliminar para a identificação de objetos, e amplia a metodologia de aprendizado de peso-mosca para futuras investigações em tarefas de classificação.
Banca examinadora
Titulares:
Alexandre Xavier Falcão IC/UNICAMP
David Menotti Gomes DInf/UFPR
Laurent Najman ESIEE Paris
Marcelo da Silva Reis IC/UNICAMP
Wallace Correa de Oliveira Casaca IBILCE/UNESP
Suplentes:
Marcos Medeiros Raimundo IC/UNICAMP
Nina Sumiko Tomita Hirata IME/USP
Luciano Rebouças de Oliveira DCC/UFBA