Exercício 1
ATENCAO - havia um dado mal formado no arquivo dados1.csv - esse
dado esta corrigido na nova versao do arquivo (12/3 11h)
Data de entrega 18/3 em aula.
Entrega até 20/3 implica em
penalidade de 50% (a nota será dividida por 2). A tarefa não será
aceita depois de 20/3 (em aula).
No arquivo dados1.csv cada linha é um
dado, e cada coluna, chamadas A,B, C, e D sao os atributos. O arquivo
esta no formato genérico de "csv" mas "csv" não é
um padrão único!
- leia o arquivo o mostre os 5 primeiros dados
- indique quais dados tem atributos faltantes. Remova-os
- indique quais dados tem atributos que parecem erros ou outliers.Como voce
decobriu isso. Remova estes dados.
- plote um histograma do atributo A. Use 10 e 30 bins no
histograma. Qual parece mais informativo?
- Calcule e imprima a matriz de covariancia dos dados
- Calcule o PCA dos dados. Quantas dimensões do PCA faz sentido
manter?
- Plote um grafico XY com as duas maiores dimensões do PCA.