Redigido por Bruno Dilly.
Inicialmente, um dos colegas resolveu a questão utilizando a equação ut = -3/4 ln(1- 4/3p). Sendo que ut é a variável que representa a distância procurada. Esta equação se encontrava no próprio manual do fdnadist, texto lido para esta aula.
Como, de 41 caracteres, 6 variavam, o estudante concluiu que a probabilidade de 2 sequências diferirem em uma determinada posição, representada pela variável p da equação, seria de 6/41. Portanto, resolvendo a equação, a distância de Jukes-Cantor entre as sequências seria de 0.1628
Dois colegas haviam encontrado valores diferentes para a distância, porém o motivo foi logo esclarecido. Um utilizou a probabilidade com poucas casas decimais, e outro havia digitado a equação incorretamente na planília eletrônica, maneira que utilizou para resolver o exercício.
Um dos estudantes então resolveu, perante a sala, o exercício utilizando a planília eletrônica, e o valor encontrado foi o mesmo que fora encontrado pela maioria, 0.1628. E assim, todos disseram estar esclarecidos a respeito da questão.
Uma das colegas se dirigiu a lousa e iniciou a procura pela taxa de transversão partindo da seguinte equação, retirada do texto : J. A. A. Quitzau. Um consenso completamente resolvido entre árvores filogenéticas completamente resolvidas. Master's thesis, Institute of Computing, University of Campinas, 2005.
Finalmente obteve-se a taxa de transversões: 0.063917
A probabilidade de transições é de 9/100, e segundo o manual do software Mega, a distância de Kimura é dada pela equação: D = -1/2 ln(-1 -2p - q) - 1/4 ln(1- 2q), sendo p probabilidade de transições(9/100), q a probabilidade de transversões(6/100), e d a distância.
Além disso, lá se encontrava a equação referente a taxa de transições: v = -ln(1 - 2q)/2, que ao ser resolvida dava v = 0,063917
Para responder a última pergunta da questão, bastava olhar o manual do Mega, pois nele estava escrita a equação utilizada pelo programa para encontrar a distância, escrita acima, e encontrar a equação utilizada pelo software fdnadist. Porém observou-se que os dois não retornavam o mesmo resultado dadas 2 sequencias. E não foi encontrado material que explicitasse o funcionamento do software fdnadist durante a resolução do exercício.
CTAGGCTTACGATTACGAGGATCCAAATGGCACCAATGCT
CTACGCTTACGACAACGAGGATCCGAATGGCACCATTGCT
Um dos alunos entrou com as sequências no programa fdnadist, e obteve as seguintes respostas:
Outro colega, que havia resolvido o exercício aplicando as equações estudadas na aula anterior, baseada na tese de mestrado de J. A. A. Quitzau, que detalhava os metódos de encontrar distâncias de Jukes-Cantor e Kimuta, obteve resultado diferente para o segundo método. Foram feitos alguns testes com os parâmetros adicionais do programa fdnadist para verificar se não estava havendo interferência, porém a turma não chegou a uma conclusão sobre o motivo do programa estar respondendo um valor ligeiramente diferente. Ficou a sugestão de leitura do código do programa.
© 2006 João Meidanis