27 abr 2022
09:00 Defesa de Mestrado Integralmente a distancia
Tema
Segmentação Semântica com Mistura Global de Priors Gaussianas
Aluno
Rodrigo Fumihiro de Azevedo Kanehisa
Orientador / Docente
Gerberth Adín Ramírez Rivera
Breve resumo
A segmentação semântica é um dos grandes problemas em aberto na visão computacional. Este problema consiste em classificar cada pixel presente em uma imagem, delimitando um objeto. As redes neurais convolucionais são eficientes na detecção, identificação e segmentação de objetos em imagens. No entanto, durante o processo de segmentação, surgem alguns problemas, como perda de informações espaciais e baixa resolução dos mapas de características. Esses problemas levam a segmentações grosseiras ou ruidosas devido às incertezas nos dados. Uma maneira de combater esses problemas é usar métodos estatísticos em conjunto com redes neurais. Este artigo propõe redes neurais combinadas com uma mistura de Gaussianas como representações para segmentação semântica. Os modelos de mistura gaussiana apresentam uma solução para mapear o conteúdo da imagem em distribuições mais representativas no espaço latente dos dados. Assim, permitindo que a rede lide com a incerteza e modele informações mais complexas. Avaliamos nossas propostas em bancos de dados existentes e as comparamos com métodos existentes em benchmarks padrão para segmentação semântica. Essa arquitetura modelará cada componente das classes como uma Gaussiana individual, garantindo que o processo de amostragem sempre traga informações relevantes para serem injetadas na rede. Um modelo U-Net mais complexo será mais expressivo, permitindo que a rede reconstrua melhor as informações perdidas durante as operações de downsampling e stride.
Banca examinadora
Titulares:
Gerberth Adín Ramírez Rivera IC/UNICAMP
Hélio Pedrini IC/UNICAMP
Roberto de Alencar Lotufo FEEC/UNICAMP
Suplentes:
Sandra Eliza Fontes de Avila IC/UNICAMP
Roberto Hirata Junior IME/USP