20 mar 2024
14:00 Defesa de Doutorado Auditório do IC3
Tema
Construindo Redes Neurais Convolucionais a partir de Marcadores
Aluno
Italos Estilon da Silva de Souza
Orientador / Docente
Alexandre Xavier Falcão
Breve resumo
O Aprendizado Profundo (Deep Learning) revolucionou a área de aprendizado de máquina, viabilizando e melhorando as aplicações em diversos domínios. Visão computacional é um desses domínios que foi drasticamente transformado com técnicas de aprendizado profundo a partir de grandes volumes de dados -- anotados ou não. No entanto, a dependência de grandes volumes de dados e, para alguns domínios, a dificuldade de aquisição, curadoria e/ou anotação desses dados são limitações que comprometem o custo e o uso das técnicas de aprendizado profundo. Outro aspecto negativo é a ausência de transparência no processo de treinamento dos modelos que compromete a explicabilidade e a interpretabilidade deles. Para abordar esses problemas com modelos de aprendizado profundo, especificamente redes neurais convolucionais (CNNs), esta tese de doutorado propõe métodos de aprendizado dos filtros das camadas convolucionais guiados pelo ser humano. A metodologia que encompassa esses métodos é denominada Aprendizado de Características por Marcadores de Imagem (Feature Learning from Image Markers -- FLIM) e utiliza marcadores de imagem indicados pelo ser humano em regiões relevantes para uma tarefa de interesse -- classificação ou segmentação de imagens. FLIM é eficaz em criar extratores de características de imagem simples (poucos pesos e poucas camadas) a partir dos marcadores (um conjunto bastante reduzido de dados) que atingem ou superam o desempenho de modelos mais complexos e treinados com mais dados anotados. FLIM também pode ser utilizada para construir modelos para anotação de imagens em domínios nos quais a anotação é trabalhosa e susceptível a erros humanos por cansaço, como segmentação de imagens de sensoriamento remoto. Assim, FLIM pode ser usada para construir um modelo simples que aprende a partir de um conjunto reduzido de imagens anotadas e esse modelo pode anotar o restante das imagens com pseudo rótulos que, por sua vez, podem ser utilizados para treinar um modelo mais complexo (profundo) usando os rótulos mais confiantes. Desta forma, modelos baseados em FLIM podem reduzir o esforço humano em anotar grandes volumes de dados para treinar modelos mais complexos.
Banca examinadora
Titulares:
Alexandre Xavier Falcão IC/UNICAMP
João Paulo Papa FC/UNESP
Hélio Pedrini IC/UNICAMP
Esther Luna Colombini IC/UNICAMP
Thales Sehn Körting INPE
Suplentes:
Fabio Augusto Faria ICT/UNIFESP
Luiz Marcos Garcia Gonçalves CT/UFRN
Anderson de Rezende Rocha IC/UNICAMP
Sandra Eliza Fontes de Avila IC/UNICAMP