Exercício 1
Data de entrega 14/3 em aula
No arquivo dados1.csv cada linha é um
dados, cada coluna, chamadas A,B, C, e D sao atributos. Os valores
são numéricos usando "." como separador decimal. ";" separa um
valor do outro.
- leia o arquivo o mostre os 5 primeiros dados
- indique quais dados tem atributos faltantes. remova-os
- indique quais dados tem atributos que parecem claramente errados
pois são muito diferentes dos valores para os outros dados. Como vc
decobriu isso. Remova estes dados.
- plote um histograma do atributo A. Pelo histograma qual a
obliquidade (skewness) desse atributo (sinal).
- Calcule e imprima a matriz de covariancia dos dados
- Calcule o PCA dos dados. Quantas dimensões do PCA faz sentido
manter?
- Plote um grafico XY com as duas maiores dimensões do PCA.