- Aplique o algoritmo de Clark para inferência de haplótipos no
conjunto de genótipos abaixo. Consegue resolver todos os genótipos?
00121
01210
22110
21020
Resposta:
Para aplicar o algoritmo de Clark, primeiro vamos localizar onde estão as ambiguidades nos genótipos dados:
00121
01210
22110
21020
Agora vamos considerar apenas os genótipos que possuem 1 ou nenhuma ambiguidade, já que esses genótipos podem ser resolvidos de uma única forma. Assim, vamos obter os seguintes haplótipos inicialmente resolvidos:
00121
-> 00111
, 00101
01210
-> 01110
, 01010
22110
21020
Para o genótipo 22110
, temos a terceira, quarta e quinta posições conhecidas. Então vamos procurar um haplótipo já resolvido cujas posições sejam idênticas a esta:
22110
01110
Os valores das posições ambíguas serão opostos aos valores da outra sequência. Assim, vamos inferir 10110
a partir de 22110
e de 01110
e adicioná-lo ao conjunto de haplótipos resolvidos:
00121
-> 00111
, 00101
01210
-> 01110
, 01010
22110
-> 10110
21020
Da mesma forma, resolveremos 21020
a partir de 01010
. Conseguimos resolver todos as ambiguidades obtendo os haplótipos abaixo:
00121
-> 00111
, 00101
01210
-> 01110
, 01010
22110
-> 10110
21020
-> 11000
- Considere os genótipos abaixo. Dê uma solução para o problema da
inferência de haplótipos por parcimônia pura para esta entrada.
22000
02200
00220
00022
Resposta:
A solução para o problema de inferência de haplótipos por parcimônia pura é aquela que minimiza o número total de haplótipos distintos usados. Este é um problema NP-difícil, mas vamos tentar encontrar uma solução mais parcimoniosa para os genótipos dados.
Para encontrá-la, primeiro vamos gerar todos os possíveis pares de haplótipos que podem ser obtidos a partir de cada genoma. Sabendo que cada "2" pode assumir valor "0" ou "1", iremos substitui-los nos genomas dados:
22000
-> (11000
, 00000
), (10000
, 01000
)
02200
-> (01100
, 00000
), (01000
, 01000
)
00220
-> (00110
, 00000
), (00100
, 00010
)
00022
-> (00011
, 00000
), (00010
, 00001
)
Agora que temos o conjunto de todos os possíveis pares de haplótipos,
podemos ver que não existe um par que explique mais de um dos
genótipos dados. Por exemplo, o par de haplótipos
(11000
, 00000
) pode ser obtido apenas
por 22000
. Portanto, vamos precisar de no mínimo 5
haplótipos distintos, sendo o melhor caso aquele em que gastamos dois
haplótipos novos para explicar o primeiro genótipo, e daí pra frente
apenas um haplótipo adicional para cada genótipo adicional.
Uma forma de resolver o problema seria escolher os seguintes haplótipos:
22000
-> (11000
, 00000
)
02200
-> (01100
, 00000
)
00220
-> (00110
, 00000
)
00022
-> (00011
, 00000
)
Também podemos explicar o primeiro genótipo de outra forma, gerando a seguinte solução:
22000
-> (10000
, 01000
)
02200
-> (01000
, 01000
)
00220
-> (00100
, 00010
)
00022
-> (00010
, 00001
)
- Decida se o conjunto de genótipos abaixo admite uma explicação por
haplótipos que formam uma filogenia perfeita. Explique sua conclusão.
012212
021210
202212
101021
Resposta:
Não há como formar uma filogenia perfeita a partir dos haplótipos dados. Para provarmos isto, vamos escolher 2 características e, a partir delas, mostrar que independente da raíz (sequência ancestral) que escolhermos, não é possível construir uma árvore sem homoplasias.
Vamos escolher as características 2 e 6:
012212
021210
202212
101021
Gerando todos os possíveis haplótipos (basta substituir "2" por "0" ou "1"):
12
-> 11
, 10
20
-> 10
, 00
02
-> 01
, 00
01
Os haplótipos obtidos serão as folhas da árvore. Se observarmos que existem as folhas 11
, 10
, 00
e 01
, vemos que é impossível escolher uma raíz para a árvore que forme uma filogenia perfeita.