Exercício 2 versão 1

Data de entrega: 5/4, as 7:00 (da manha).

Gere um pdf que inclui seu código e respostas para as questões, e comentários que voce achar pertinentes. Submeta o pdf via Moodle.

Leia o arquivo abalone.csv 1. Pre-processamento

2. Regressão logística com C=1000000. Faca a regressão logística dos dados transformados, com um C alto (sem regularização). Imprima a acurácia do classificador nos dados de teste com 3 dígitos significativos. Rode o LogisticrRgression com random_state=1 para garantir que de o mesmo resultado toda vez que vc rodar (isso seta o valor da semente do gerador aleatório e portanto usará sempre o mesmo ponto inicial na otimização da regressão logística).

3. Regressão logística com regularização (C=1). Imprima com 3 dígitos a acurácia, e use random_state=1.

4. Regressão logística sem regularização e com estandardização dos dados. Use C=1000000 mas transforme os dados antes de aplicar a regressão logistica.

5. Aplique um PCA nos dados, de forma que pelo menos 90% da variância dos dados seja preservada.

6. Rode a regressão logística sem regularização nos dados do PCA

7. Rode a regressão logística com regularização (C=1) nos dados do PCA

8. Leia o arquivo abalone-missing.csv com dados faltantes na 2 a penúltima coluna. Faça o preprocessamento descrito em 1. e impute pela média os valores faltantes. Rode a regressão sem regularização, sem PCA e sem estandardização.


Last modified: Thu Mar 30 21:08:22 BRT 2017