20 jan 2026
14:00 Defesa de Doutorado sala 85 do IC2
Tema
From Consensus to Curriculum: Advancing Deep Semi-Supervised Learning via Meta-Pseudo-Labeling on 2D Projections
Aluno
David Aparco Cardenas
Orientador / Docente
Pedro Jussieu de Rezende - Coorientador: Alexandre Xavier Falcão
Breve resumo
O aprendizado profundo tem obtido éxito na classificação de imagens, porém sua dependência de grandes volumes de dados rotulados continua sendo uma barreira crítica, especialmente em áreas como análise de imagens médicas e biológicas, onde a anotação de dados é cara, demorada e exige expertise. Embora os métodos atuais de aprendizado semi-supervisionado (SSL) tenham mostrado avanços na solução desse problema, eles dependem de codificadores pré-treinados em larga escala e de conjuntos extensos de validação, o que restringe a arquitetura das redes, introduz vieses indesejados e exige mais dados rotulados na validação. Visando contornar esses desafios, esta tese apresenta quatro contribuições baseadas na metodologia Deep Feature Annotation (DeepFA), que explora a estrutura subjacente dos embeddings de características profundas por meio da propagação de rótulos baseada em grafos sobre projeções bidimensionais. Cada contribuição expande a anterior, abordando limitações específicas do aprendizado profundo semi-supervisionado (DSSL) e propondo estratégias direcionadas para simultaneamente reduzir o esforço de anotação e melhorar a capacidade de generalização. A primeira contribuição introduz uma abordagem que aproveita marcadores desenhados por usuários para inicializar do zero os pesos de redes neurais convolucionais (CNNs), por meio da metodologia Feature Learning from Image Markers (FLIM). Incorporando um mecanismo de consenso em várias iterações de pseudo-rotulágem, essa abordagem melhora a confiabilidade dos rótulos sem depender de codificadores pré-treinados ou conjuntos de validação extensos. A segunda contribuição explora o aprendizado contrastivo supervisionado em um esquema iterativo de co-treinamento, no qual duas redes colaborativas trocam pseudo-rótulos confiáveis. Essa estratégia aprimora a qualidade das representações e mitiga o viés de confirmação por meio de treinamento cruzado iterativo e ajuste adaptativo da função de perda. A terceira contribuição integra aprendizado ativo em um esquema de co-treinameto de execução única, permitindo a seleção das amostras mais incertas para anotação. Essa abordagem melhora a generalização enquanto minimiza o esforço de anotação, combinando aprendizado contrastivo supervisionado, aprendizado ativo e pseudo-rotulagem em um processo de otimização unificado. A quarta e última contribuição propõe uma seleção de pseudo-rótulos baseada em currículo, incorporando gradualmente dados não rotulados com base em limiares adaptativos de confiança. Essa abordagem simplifica a configuração anterior para uma única rede e combina aprendizado contrastivo não supervisionado, aprendizado contrastivo supervisionado e rotulagem ativa para melhorar a estabilidade e a robustez do treinamento. Em conjunto, essas contribuições abordam desafios centrais do DSSL, incluindo o treinamento do zero de arquiteturas CNN customizadas, a redução da dependência de conjuntos de validação, a melhoria das representações de características, a mitigação de viés de confirmação e a otimização da eficiência de anotação. Avaliadas em diversos datasets desafiadores de imagens biológicas, cada abordagem demonstrou desempenho comparável ou superior ao estado da arte, oferecendo soluções práticas para cenários reais em que dados rotulados são escassos e caros de obter.
Banca examinadora
Titulares:
Pedro Jussieu de Rezende IC/UNICAMP
David Menotti Gomes DInf/UFPR
Nina Sumiko Tomita Hirata IME/USP
Marcelo da Silva Reis IC/UNICAMP
Marcos Medeiros Raimundo IC/UNICAMP
Suplentes:
Priscila Tiemi Maeda Saito DC/UFSCar
Moacir Antonelli Ponti ICMC/USP
Roberto Hirata Junior IME/USP