MO640 - Ata dos Exercícios - Sobre a aula de 2008-09-18

  1. Aplique o algoritmo de Clark para inferência de haplótipos no conjunto de genótipos abaixo. Consegue resolver todos os genótipos?

    00121
    01210
    22110
    21020

    Resposta:

    Para aplicar o algoritmo de Clark, primeiro vamos localizar onde estão as ambiguidades nos genótipos dados:

    00121
    01210
    22110
    21020

    Agora vamos considerar apenas os genótipos que possuem 1 ou nenhuma ambiguidade, já que esses genótipos podem ser resolvidos de uma única forma. Assim, vamos obter os seguintes haplótipos inicialmente resolvidos:

    00121 -> 00111, 00101
    01210 -> 01110, 01010
    22110
    21020

    Para o genótipo 22110, temos a terceira, quarta e quinta posições conhecidas. Então vamos procurar um haplótipo já resolvido cujas posições sejam idênticas a esta:

    22110
    01110

    Os valores das posições ambíguas serão opostos aos valores da outra sequência. Assim, vamos inferir 10110 a partir de 22110 e de 01110 e adicioná-lo ao conjunto de haplótipos resolvidos:

    00121 -> 00111, 00101
    01210 -> 01110, 01010
    22110 -> 10110
    21020

    Da mesma forma, resolveremos 21020 a partir de 01010. Conseguimos resolver todos as ambiguidades obtendo os haplótipos abaixo:

    00121 -> 00111, 00101
    01210 -> 01110, 01010
    22110 -> 10110
    21020 -> 11000

  2. Considere os genótipos abaixo. Dê uma solução para o problema da inferência de haplótipos por parcimônia pura para esta entrada.

    22000
    02200
    00220
    00022

    Resposta:

    A solução para o problema de inferência de haplótipos por parcimônia pura é aquela que minimiza o número total de haplótipos distintos usados. Este é um problema NP-difícil, mas vamos tentar encontrar uma solução mais parcimoniosa para os genótipos dados.

    Para encontrá-la, primeiro vamos gerar todos os possíveis pares de haplótipos que podem ser obtidos a partir de cada genoma. Sabendo que cada "2" pode assumir valor "0" ou "1", iremos substitui-los nos genomas dados:

    22000 -> (11000, 00000), (10000, 01000)
    02200 -> (01100, 00000), (01000, 01000)
    00220 -> (00110, 00000), (00100, 00010)
    00022 -> (00011, 00000), (00010, 00001)

    Agora que temos o conjunto de todos os possíveis pares de haplótipos, podemos ver que não existe um par que explique mais de um dos genótipos dados. Por exemplo, o par de haplótipos (11000, 00000) pode ser obtido apenas por 22000. Portanto, vamos precisar de no mínimo 5 haplótipos distintos, sendo o melhor caso aquele em que gastamos dois haplótipos novos para explicar o primeiro genótipo, e daí pra frente apenas um haplótipo adicional para cada genótipo adicional.

    Uma forma de resolver o problema seria escolher os seguintes haplótipos:

    22000 -> (11000, 00000)
    02200 -> (01100, 00000)
    00220 -> (00110, 00000)
    00022 -> (00011, 00000)

    Também podemos explicar o primeiro genótipo de outra forma, gerando a seguinte solução:

    22000 -> (10000, 01000)
    02200 -> (01000, 01000)
    00220 -> (00100, 00010)
    00022 -> (00010, 00001)

  3. Decida se o conjunto de genótipos abaixo admite uma explicação por haplótipos que formam uma filogenia perfeita. Explique sua conclusão.

    012212
    021210
    202212
    101021

  4. Resposta:

    Não há como formar uma filogenia perfeita a partir dos haplótipos dados. Para provarmos isto, vamos escolher 2 características e, a partir delas, mostrar que independente da raíz (sequência ancestral) que escolhermos, não é possível construir uma árvore sem homoplasias.

    Vamos escolher as características 2 e 6:

    012212
    021210
    202212
    101021

    Gerando todos os possíveis haplótipos (basta substituir "2" por "0" ou "1"):

    12 -> 11, 10
    20 -> 10, 00
    02 -> 01, 00
    01

    Os haplótipos obtidos serão as folhas da árvore. Se observarmos que existem as folhas 11, 10, 00 e 01, vemos que é impossível escolher uma raíz para a árvore que forme uma filogenia perfeita.