MO640 - Solução dos Exercícios - Sobre a aula de 2006-03-27

Redigido por Bruno Dilly.

  1. Duas seqüências de DNA de 41 caracteres diferem em 6 posições. Admitindo que sua evolução segue o modelo de Jukes-Cantor, qual é a distância de Jukes-Cantor entre elas?

    Inicialmente, um dos colegas resolveu a questão utilizando a equação ut = -3/4 ln(1- 4/3p). Sendo que ut é a variável que representa a distância procurada. Esta equação se encontrava no próprio manual do fdnadist, texto lido para esta aula.

    Como, de 41 caracteres, 6 variavam, o estudante concluiu que a probabilidade de 2 sequências diferirem em uma determinada posição, representada pela variável p da equação, seria de 6/41. Portanto, resolvendo a equação, a distância de Jukes-Cantor entre as sequências seria de 0.1628

    Dois colegas haviam encontrado valores diferentes para a distância, porém o motivo foi logo esclarecido. Um utilizou a probabilidade com poucas casas decimais, e outro havia digitado a equação incorretamente na planília eletrônica, maneira que utilizou para resolver o exercício.

    Um dos estudantes então resolveu, perante a sala, o exercício utilizando a planília eletrônica, e o valor encontrado foi o mesmo que fora encontrado pela maioria, 0.1628. E assim, todos disseram estar esclarecidos a respeito da questão.

  2. Duas seqüências de DNA de 100 caracteres diferem entre si em 6 transversões e 9 transições. Admitindo que sua evolução segue o modelo de dois parâmetros de Kimura, calcule as taxas de transições e transversões multiplicadas pelo tempo transcorrido. Como estes números são usados pelo software fdnadist para calcular a distância de Kimura entre as duas seqüências? É a mesma fórmula usada pelo software Mega http://evolgen.biol.metro-u.ac.jp/MEGA/manual/Distance.html?

    Uma das colegas se dirigiu a lousa e iniciou a procura pela taxa de transversão partindo da seguinte equação, retirada do texto : J. A. A. Quitzau. Um consenso completamente resolvido entre árvores filogenéticas completamente resolvidas. Master's thesis, Institute of Computing, University of Campinas, 2005.

    E assim, encontrou uma equação em que a distâcia (vt) é encontrada se soubermos Z(t), que é a probabilidade de tranversões ocorrerem. Houve uma breve discussão à respeito de qual seria o valor de Z(t), já que as transversões podem resultar em 2 nucleotídeos diferentes, e concluiu-se que o valor seria 0.03. Pois o número total de transversões foi 6, logo a probabilidade é de 6/100, porém, a probabilidade para cada um dos 2 possíveis nucleotídeos é a metade, 3/100.

    Finalmente obteve-se a taxa de transversões: 0.063917

    A probabilidade de transições é de 9/100, e segundo o manual do software Mega, a distância de Kimura é dada pela equação: D = -1/2 ln(-1 -2p - q) - 1/4 ln(1- 2q), sendo p probabilidade de transições(9/100), q a probabilidade de transversões(6/100), e d a distância.

    Além disso, lá se encontrava a equação referente a taxa de transições: v = -ln(1 - 2q)/2, que ao ser resolvida dava v = 0,063917

    Para responder a última pergunta da questão, bastava olhar o manual do Mega, pois nele estava escrita a equação utilizada pelo programa para encontrar a distância, escrita acima, e encontrar a equação utilizada pelo software fdnadist. Porém observou-se que os dois não retornavam o mesmo resultado dadas 2 sequencias. E não foi encontrado material que explicitasse o funcionamento do software fdnadist durante a resolução do exercício.

  3. Calcule as distâncias de Jukes-Cantor e de Kimura entre as seqüências abaixo:

    CTAGGCTTACGATTACGAGGATCCAAATGGCACCAATGCT
    CTACGCTTACGACAACGAGGATCCGAATGGCACCATTGCT

    Um dos alunos entrou com as sequências no programa fdnadist, e obteve as seguintes respostas:

    Outro colega, que havia resolvido o exercício aplicando as equações estudadas na aula anterior, baseada na tese de mestrado de J. A. A. Quitzau, que detalhava os metódos de encontrar distâncias de Jukes-Cantor e Kimuta, obteve resultado diferente para o segundo método. Foram feitos alguns testes com os parâmetros adicionais do programa fdnadist para verificar se não estava havendo interferência, porém a turma não chegou a uma conclusão sobre o motivo do programa estar respondendo um valor ligeiramente diferente. Ficou a sugestão de leitura do código do programa.


MO640 Home

© 2006 João Meidanis