MO640 - Ata dos Exercícios - Sobre a aula de 2008-09-18

Aplique o algoritmo de Clark para inferência de haplótipos no conjunto de genótipos abaixo. Consegue resolver todos os genótipos?
00121
01210
22110
21020

Resposta:

Para aplicar o algoritmo de Clark, primeiro vamos localizar onde estão as ambiguidades nos genótipos dados:
00121
01210
22110
21020

Agora vamos considerar apenas os genótipos que possuem 1 ou nenhuma ambiguidade, já que esses genótipos podem ser resolvidos de uma única forma. Assim, vamos obter os seguintes haplótipos inicialmente resolvidos:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110
21020

Para o genótipo 22110, temos a terceira, quarta e quinta posições conhecidas. Então vamos procurar um haplótipo já resolvido cujas posições sejam idênticas a esta:
22110
01110

Os valores das posições ambíguas serão opostos aos valores da outra sequência. Assim, vamos inferir 10110 a partir de 22110 e de 01110 e adicioná-lo ao conjunto de haplótipos resolvidos:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110 -> 10110
21020

Da mesma forma, resolveremos 21020 a partir de 01010. Conseguimos resolver todos as ambiguidades obtendo os haplótipos abaixo:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110 -> 10110
21020 -> 11000
Considere os genótipos abaixo. Dê uma solução para o problema da inferência de haplótipos por parcimônia pura para esta entrada.
22000
02200
00220
00022

Resposta:

A solução para o problema de inferência de haplótipos por parcimônia pura é aquela que minimiza o número total de haplótipos distintos usados. Este é um problema NP-difícil, mas vamos tentar encontrar uma solução mais parcimoniosa para os genótipos dados.

Para encontrá-la, primeiro vamos gerar todos os possíveis pares de haplótipos que podem ser obtidos a partir de cada genoma. Sabendo que cada "2" pode assumir valor "0" ou "1", iremos substitui-los nos genomas dados:
22000 -> (11000, 00000), (10000, 01000)
02200 -> (01100, 00000), (01000, 01000)
00220 -> (00110, 00000), (00100, 00010)
00022 -> (00011, 00000), (00010, 00001)

Agora que temos o conjunto de todos os possíveis pares de haplótipos, podemos ver que não existe um par que explique mais de um dos genótipos dados. Por exemplo, o par de haplótipos (11000, 00000) pode ser obtido apenas por 22000. Portanto, vamos precisar de no mínimo 5 haplótipos distintos, sendo o melhor caso aquele em que gastamos dois haplótipos novos para explicar o primeiro genótipo, e daí pra frente apenas um haplótipo adicional para cada genótipo adicional.

Uma forma de resolver o problema seria escolher os seguintes haplótipos:
22000 -> (11000, 00000)
02200 -> (01100, 00000)
00220 -> (00110, 00000)
00022 -> (00011, 00000)

Também podemos explicar o primeiro genótipo de outra forma, gerando a seguinte solução:
22000 -> (10000, 01000)
02200 -> (01000, 01000)
00220 -> (00100, 00010)
00022 -> (00010, 00001)
Decida se o conjunto de genótipos abaixo admite uma explicação por haplótipos que formam uma filogenia perfeita. Explique sua conclusão.
012212
021210
202212
101021

Resposta:

012212
021210
202212
101021

12 -> 11, 10
20 -> 10, 00
02 -> 01, 00
01

11

10

00

01