31 ago 2022
10:00 Defesa de Mestrado Auditório - IC 3
Tema
Modelagens para Segmentação de Imagens 3D da Densidade Eletrônica de Ligantes em Classes Químicas com Aprendizado Profundo
Aluno
Cristina Freitas Bazzano
Orientador / Docente
Orientador: Guilherme Pimentel Telles/ Coorientador: Daniela Barretto Barbosa Trivella
Breve resumo
A megadiversidade biológica brasileira, resultante de ecossistemas únicos manipulados e conservados por meio de um manejo agroflorestal milenar de diversos povos tradicionais do Brasil, têm um grande potencial para acelerar a descoberta de novos fármacos nacionais e representa importante fonte de inovação. Produtos naturais (PN) são a principal fonte de novos fármacos, historicamente inspirando mais de 60% dos fármacos hoje disponíveis. Os PN são moléculas orgânicas produzidas por qualquer ser vivo como decorrência de seu metabolismo secundário. Porém, a descoberta de novos fármacos a partir de PNs é muito desafiadora, os métodos convencionais para isolar o composto ativo consomem tempo, dinheiro e precisam de quilogramas do extrato do PN, o que pode ser inviável algumas vezes. Nesse contexto surge a necessidade de novas técnicas e análises que aceleram e facilitam o processo de elucidação da estrutura molecular de moléculas bioativas desconhecidas. Atividades recentes do grupo de pesquisa deste trabalho e alguns poucos outros no mundo mostram que a cristalografia de proteínas em larga escala é uma alternativa para esse cenário. Esta técnica permite obter uma imagem 3D do contorno da molécula desconhecida em um menor tempo e a partir de poucos microgramas do extrato do PN. A incubação do cristal de uma proteína alvo com o extrato natural bioativo - que é representado por uma mistura de centenas de produtos naturais inicialmente desconhecidos - é uma técnica promissora na descoberta de novos fármacos e a interpretação da imagem 3D da densidade eletrônica é uma abordagem central neste processo. As soluções existentes resolvem o problema da interpretação da densidade eletrônica de moléculas já conhecidas e comumente encontradas nos bancos de dados de cristalografia de proteínas, o que não abrange o universo de moléculas de PNs, muitas das quais desconhecidas e com estrutura complexa pouco comum. Este trabalho fornece uma solução para o problema da reconstrução da estrutura molecular de ligantes (moléculas bioativas) desconhecidos a partir de uma modelagem com aprendizado profundo para interpretação automatizada da imagem 3D da densidade eletrônica dos dados de cristalografia de proteínas. Diversas modelagens baseadas em subestruturas químicas dos ligantes foram avaliadas para criação de bancos de dados de imagens em nuvens de pontos 3D da densidade eletrônica de ligantes rotuladas e os modelos de segmentação semântica obtidos apresentaram bom desempenho, com acurácias mIoU no teste entre 49.8% e 77.4%. As contribuições deste trabalho incluem: a primeira aplicação de aprendizado profundo 3D para imagens da densidade eletrônica de ligantes; um arcabouço de funções para implementação de outras modelagens na criação de imagens 3D da densidade eletrônica de ligantes; os bancos de dados de imagens rotuladas criados; os modelos treinados; e uma aplicação automatizada para detecção de ligantes na densidade eletrônica e interpretação das suas imagens 3D utilizando os modelos obtidos.
Banca examinadora
Titulares:
Guilherme Pimentel Telles IC/UNICAMP
Paulo Sergio Lopes de Oliveira LNBio/CNPEM
Hélio Pedrini IC/UNICAMP
Suplentes:
Marcelo da Silva Reis IC/UNICAMP
José Geraldo de Carvalho Pereira LNBio/CNPEM