18 mar 2021
09:00 Defesa de Doutorado Integralmente a distância
Tema
Reconhecimento de Faces Explorando Representações Baseadas em Partes
Aluno
Marcus de Assis Angeloni
Orientador / Docente
Hélio Pedrini
Breve resumo
Nos últimos anos, observa-se um crescente uso de biometria em nosso dia a dia, como no desbloqueio de telefones celulares, comércio eletrônico e autenticação bancária. Reconhecimento de face tem várias vantagens sobre outras modalidades biométricas, visto que é natural, não intrusiva e é uma tarefa que as pessoas realizam rotineiramente e sem esforço. Apesar dos significativos avanços recentes no reconhecimento de faces, ainda existem desafios em aberto, como em situações com oclusão em parte do rosto, diferentes poses, borramentos na imagem, expressões faciais, diferentes iluminações e uso de maquiagem. Essas situações são corriqueiras em aplicações de vigilância e imagens capturadas por dispositivos móveis. Conforme demonstrado pela literatura de ciência cognitiva, há uma grande probabilidade de que o processamento baseado em partes possa existir na percepção do rosto por humanos. No entanto, apesar dessa evidência, a literatura de reconhecimento facial ainda se concentra no processamento holístico e nas representações derivadas de alinhamentos globais de imagens de rosto. Nesta tese, investigamos a adoção de partes faciais na tarefa de reconhecimento biométrico de faces inspirados por essa observação, propondo diferentes estratégias para recortar essas partes, escolher representações adequadas para cada uma delas e como combinar os seus resultados. Abordamos a adoção das partes faciais como um trabalho incremental, cuja metodologia e ideia foram sendo refinadas, uma vez que o reconhecimento facial é bem pesquisado e evolui rapidamente. Primeiramente, exploramos representações tradicionais de partes faciais (sobrancelhas, olhos, nariz e boca) para cobrir cenários controlados e não controlados, usando quatro bases de dados públicas. Os resultados dos experimentos de fusão mostram que características e classificadores específicos para cada parte facial podem melhorar a precisão dos sistemas biométricos. Em segundo lugar, propomos uma arquitetura de rede neural convolucional (CNN) multi-entrada compacta para explorar um aprendizado de ponta a ponta desde as partes faciais até a estimativa da idade a partir de uma única imagem capturada em um cenário do mundo real. Experimentos conduzidos em uma base de dados pública mostram que nosso método tem uma precisão competitiva com um número reduzido de parâmetros e tamanho de entrada. Por fim, focamos no problema desafiador da verificação facial com maquiagem. Propomos duas estratégias para recortar as partes faciais (em torno de pontos fiduciais ou terços faciais), extraímos representações usando modelos CNN de última geração e fundimos suas pontuações com a pontuação holística. Experimentos realizados em quatro bases de dados e também em um protocolo cruzado mostram que melhorias foram alcançadas nas métricas de avaliação, mesmo sem retreinamento ou ajuste fino dos modelos CNN. Uma vez que disponibilizamos o código-fonte das abordagens propostas, os experimentos podem ser reproduzidos para regerar e estender os resultados obtidos. Além disso, os resultados obtidos indicam alguns novos rumos e tópicos de pesquisa em reconhecimento facial. Finalmente, é importante notar que a abordagem baseada em partes pode ser estendida a outros problemas relacionados, como reconhecimento de face sob oclusão, indexação de banco de dados, identificação biométrica e estimativa de gênero.
Banca examinadora
Titulares:
Hélio Pedrini | IC/UNICAMP |
Erickson Rangel do Nascimento | DCC/UFMG |
Ronaldo Cristiano Prati | CMCC/UFABC |
Esther Luna Colombini | IC/UNICAMP |
Alexandre Mello Ferreira | IC/UNICAMP |
Suplentes:
Gerberth Adín Ramírez Rivera | IC/UNICAMP |
João Paulo Papa | FC/UNESP |
Moacir Antonelli Ponti | ICMC/USP |