- Aplique o algoritmo de Clark para inferência de haplótipos no
conjunto de genótipos abaixo. Consegue resolver todos os genótipos?
00121
01210
22110
21020
Resposta:
Para aplicar o algoritmo de Clark, primeiro vamos localizar onde estão as ambiguidades nos genótipos dados:
00121
01210
22110
21020
Agora vamos considerar apenas os genótipos que possuem 1 ou nenhuma ambiguidade, já que esses genótipos podem ser resolvidos de uma única forma. Assim, vamos obter os seguintes haplótipos inicialmente resolvidos:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110
21020
Para o genótipo 22110, temos a terceira, quarta e quinta posições conhecidas. Então vamos procurar um haplótipo já resolvido cujas posições sejam idênticas a esta:
22110
01110
Os valores das posições ambíguas serão opostos aos valores da outra sequência. Assim, vamos inferir 10110 a partir de 22110 e de 01110 e adicioná-lo ao conjunto de haplótipos resolvidos:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110 -> 10110
21020
Da mesma forma, resolveremos 21020 a partir de 01010. Conseguimos resolver todos as ambiguidades obtendo os haplótipos abaixo:
00121 -> 00111, 00101
01210 -> 01110, 01010
22110 -> 10110
21020 -> 11000
- Considere os genótipos abaixo. Dê uma solução para o problema da
inferência de haplótipos por parcimônia pura para esta entrada.
22000
02200
00220
00022
Resposta:
A solução para o problema de inferência de haplótipos por parcimônia pura é aquela que minimiza o número total de haplótipos distintos usados. Este é um problema NP-difícil, mas vamos tentar encontrar uma solução mais parcimoniosa para os genótipos dados.
Para encontrá-la, primeiro vamos gerar todos os possíveis pares de haplótipos que podem ser obtidos a partir de cada genoma. Sabendo que cada "2" pode assumir valor "0" ou "1", iremos substitui-los nos genomas dados:
22000 -> (11000, 00000), (10000, 01000)
02200 -> (01100, 00000), (01000, 01000)
00220 -> (00110, 00000), (00100, 00010)
00022 -> (00011, 00000), (00010, 00001)
Agora que temos o conjunto de todos os possíveis pares de haplótipos,
podemos ver que não existe um par que explique mais de um dos
genótipos dados. Por exemplo, o par de haplótipos
(11000, 00000) pode ser obtido apenas
por 22000. Portanto, vamos precisar de no mínimo 5
haplótipos distintos, sendo o melhor caso aquele em que gastamos dois
haplótipos novos para explicar o primeiro genótipo, e daí pra frente
apenas um haplótipo adicional para cada genótipo adicional.
Uma forma de resolver o problema seria escolher os seguintes haplótipos:
22000 -> (11000, 00000)
02200 -> (01100, 00000)
00220 -> (00110, 00000)
00022 -> (00011, 00000)
Também podemos explicar o primeiro genótipo de outra forma, gerando a seguinte solução:
22000 -> (10000, 01000)
02200 -> (01000, 01000)
00220 -> (00100, 00010)
00022 -> (00010, 00001)
- Decida se o conjunto de genótipos abaixo admite uma explicação por
haplótipos que formam uma filogenia perfeita. Explique sua conclusão.
012212
021210
202212
101021
Resposta:
Não há como formar uma filogenia perfeita a partir dos haplótipos dados. Para provarmos isto, vamos escolher 2 características e, a partir delas, mostrar que independente da raíz (sequência ancestral) que escolhermos, não é possível construir uma árvore sem homoplasias.
Vamos escolher as características 2 e 6:
012212
021210
202212
101021
Gerando todos os possíveis haplótipos (basta substituir "2" por "0" ou "1"):
12 -> 11, 10
20 -> 10, 00
02 -> 01, 00
01
Os haplótipos obtidos serão as folhas da árvore. Se observarmos que existem as folhas 11, 10, 00 e 01, vemos que é impossível escolher uma raíz para a árvore que forme uma filogenia perfeita.