11 dez 2025
14:00 Defesa de Mestrado sala 85 do IC2
Tema
Anti-Spoofing Facial Leve, Robusto e Open-Set para cénarios de computação móvel
Aluno
Jadson Crislan Santos Costa
Orientador / Docente
Anderson de Rezende Rocha
Breve resumo
A autenticação biométrica, especialmente o Reconhecimento Facial (FRT), tornou-se onipresente em dispositivos móveis. No entanto, sua confiabilidade é ameaçada por Ataques de Apresentação (PAs), como o uso de fotos e vídeos, que visam enganar os sistemas. A Detecção de Ataques de Apresentação (PAD) busca mitigar esse risco, mas enfrenta três desafios principais no contexto móvel: a necessidade de eficiência computacional (modelos leves), a capacidade de generalizar para ataques desconhecidos (open-set), e a robustez a diferentes domínios, como câmeras e iluminações distintas (cross-domain). Muitos métodos estado da arte (SOTA) são computacionalmente pesados ou falham nesses cenários de generalização.Esta dissertação propõe e avalia um novo framework de PAD leve (∼5M de parâmetros), eficiente e robusto. O método utiliza arquiteturas modernas – um Transformer (DeiT-Tiny) e uma CNN (ConvNeXtV2-Femto) – como extratores de características. Argumentamos que o pré-treinamento com métodos de Self-Supervised Learning (SSL) da família Masked Image Modeling (MAE/FCMAE), que preservam artefatos de spoofing (como texturas de impressão ou padrões Moiré), é mais adequado para PAD do que métodos contrastivos que destroem esses sinais através de augmentations de cor (ex: color jitter).Após o pré-treinamento, realizamos um fine-tuning supervisionado investigando duas novas formulações de perda baseadas em similaridade de cosseno, projetadas para o cenário binário de PAD: (1) uma abordagem Closed-Set (A1) que utiliza k-centers (k=10) e soft-labels (gerados via Mixup/CutMix) para modelar a alta variância intra-classe dos ataques; e (2) uma abordagem Open-Set (A2) que usa uma perda de margem binária customizada para forçar uma separação estrita entre amostras bona fide e ataques. Avaliamos exaustivamente nosso framework nos datasets RECOD-MPAD e Echoface-Spoof (RGB-only), comparando-o com baselines relevantes (ResNet-18, M³FASvisual, SSAN) em protocolos intra-dataset, cross-device, cross-attack e cross-dataset. Os resultados demonstram que, em cenários intra-dataset, nossos métodos atingem desempenho quase perfeito (ex: 0.04% ACER). Mais importante, em tarefas de generalização (cross-device e cross-attack), nossas abordagens leves, especialmente o ConvNeXtV2 com ambas as perdas propostas, superam consistentemente os baselines mais pesados, como o SSAN. A generalização cross-dataset provou ser o desafio mais difícil para todos os métodos, embora nossas abordagens tenham permanecido competitivas. Esta pesquisa demonstra que é viável criar modelos de PAD que são simultaneamente leves, eficientes e robustos para generalização, tornando-os adequados para implantação em dispositivos móveis.
Banca examinadora
Titulares:
Anderson de Rezende Rocha IC/UNICAMP
Giovani Chiachia SAFFE
Hélio Pedrini IC/UNICAMP
Suplentes:
Marcos Medeiros Raimundo IC/UNICAMP
David Menotti Gomes DInf/UFPR