27 jun 2025
09:00 Defesa de Doutorado Integralmente à distância
Tema
Machine Learning Techniques for Image-Based Rock Classification
Aluno
Soroor Salavati
Orientador / Docente
Anderson de Rezende Rocha - Coorientador: Alexandre Mello Ferreira
Breve resumo
A classificação precisa de imagens de rochas é essencial para uma análise litológica confiável nas geociências. No entanto, essa tarefa continua desafiadora devido às sutis similaridades visuais entre classes, ao desbalanceamento de dados e à escassez de anotações. Esta tese apresenta uma estrutura abrangente e em múltiplas fases que evolui sistematicamente desde métodos tradicionais de aprendizado de máquina até arquiteturas avançadas de aprendizado profundo para enfrentar essas dificuldades. Na primeira fase, estabelecemos uma linha de base utilizando modelos de classificação convencionais em conjuntos de dados heterogêneos de rochas. Embora simples e interpretáveis, esses métodos apresentam limitações para capturar as texturas e estruturas complexas das amostras geológicas. Para superar essas limitações, propomos uma função de custo híbrida que combina entropia cruzada categórica com a técnica OHEM, a qual enfatiza amostras difíceis, reduz o desbalanceamento de classes e melhora a capacidade do modelo em distinguir características sutis. Com base nos aprendizados das fases anteriores, utilizamos uma arquitetura baseada em transformadores (DINOv2) para extração de características globais, combinada com uma rede CDC para capturar detalhes locais refinados. Essa mudança arquitetônica representa um avanço estratégico em relação ao projeto anterior. Para aumentar a separabilidade entre classes e a robustez do modelo, introduzimos uma função de custo conjunta que combina Focal Loss e Center Loss — uma combinação refinada que promove a compactação intra-classe e direciona o aprendizado para exemplos mais difíceis. Experimentos extensivos demonstram que esse modelo aprimorado supera abordagens anteriores e generaliza bem em conjuntos de dados geológicos desbalanceados. Para melhorar ainda mais o desempenho, incorporamos uma estratégia de aumento de dados baseada em difusão, que expande sinteticamente os dados de treinamento ao mesmo tempo em que preserva a integridade estrutural. Essa etapa final reforça a capacidade de generalização do modelo ao lidar com a escassez de dados durante o treinamento. De forma geral, esta tese propõe uma solução robusta e de ponta a ponta para a classificação de imagens de rochas, integrando paradigmas tradicionais e modernos de aprendizado. A metodologia tem implicações significativas para a caracterização de reservatórios na indústria de petróleo e gás e pode ser estendida a outros domínios com restrições de dados semelhantes, como imagens médicas ou sensoriamento remoto.
Banca examinadora
Titulares:
Anderson de Rezende Rocha IC/UNICAMP
Diego Nunes Brandão CEFET/RJ
George Darmiton da Cunha Cavalcanti CIn/UFPE
Marcelo da Silva Reis IC/UNICAMP
Levy Boccato FEEC/UNICAMP
Suplentes:
Helena de Almeida Maia IC/UNICAMP
Siovani Cintra Felipussi DComp-So/UFSCar
João Paulo Papa FC/UNESP