11 mar 2021
14:00 Defesa de Mestrado Integralmente a distância
Tema
Predição de Estruturas Secundárias de Proteínas usando Aprendizado de Máquina e BLAST
Aluno
Gabriel Bianchin de Oliveira
Orientador / Docente
Zanoni Dias - orientador / Hélio Pedrini - coorientador
Breve resumo
Proteínas, que são sequências de aminoácidos, são fundamentais em diversos processos biológicos dos seres vivos. Devido às interações físicas e químicas entre os aminoácidos que formam as proteínas, estruturas tridimensionais locais e globais são formadas. Com os avanços tecnológicos na área biológica, o sequenciamento de proteínas se tornou simples e rápido de ser feito. Por outro lado, a definição de estruturas tridimensionais locais, chamadas de estruturas secundárias, e globais, chamadas de estruturas terciárias, continua custosa. Estruturas tridimensionais tem alto impacto na definição de funções de proteínas e no auxílio de desenvolvimento de aplicações, como remédios e biossensores. Como opção para a definição de estruturas globais das proteínas a partir da sequência de aminoácidos, a análise de estruturas secundárias se tornou o principal método intermediário na literatura. Para realizar a predição de estruturas secundárias, duas abordagens são mais comumente utilizadas, sendo elas métodos baseados em modelo, que usam ferramentas que encontram proteínas similares, e métodos livres de modelo, que usam classificadores de aprendizado de máquina. Nos trabalhos recentes, diversas metodologias foram propostas para predizer estruturas secundárias, porém este problema continua em aberto. Outro ponto importante nos métodos atuais é que a maioria das abordagens utiliza informações evolutivas além da sequência de aminoácidos que formam as proteínas, sendo incapazes de predizer estruturas secundárias utilizando apenas a cadeia de aminoácidos. Nesta pesquisa, propomos diversos classificadores baseados em modelo e livres de modelo para realizar a classificação de estruturas secundárias das proteínas. Além da análise individual dos classificadores, investigamos a fusão entre os preditores baseados em modelo e preditores livres de modelo, assim como a fusão entre todos os classificadores. Nossos preditores são capazes de classificar estruturas secundárias a partir de sequências de aminoácidos com ou sem informações evolutivas, o que não é possível para a maioria dos métodos disponíveis na literatura. Os resultados obtidos em três bases de dados diferentes mostram que nossos classificadores são competitivos comparados com as abordagens da literatura.
Banca examinadora
Titulares:
Zanoni Dias IC/UNICAMP
Ricardo Cerri DC/UFSCar
Guilherme Pimentel Telles IC/UNICAMP
Suplentes:
Esther Luna Colombini IC/UNICAMP
Felipe Rodrigues da Silva Embrapa