Data de entrega: 5/4, as 7:00 (da manha).
Gere um pdf que inclui seu código e respostas para as questões, e comentários que voce achar pertinentes. Submeta o pdf via Moodle.
Leia o arquivo abalone.csv
2. Regressão logística com C=1000000. Faca a regressão logística
dos dados transformados, com um C alto (sem regularização). Imprima a
acurácia do classificador nos dados de teste com 3 dígitos significativos. Rode o
LogisticrRgression com random_state=1 para garantir que de o mesmo
resultado toda vez que vc rodar (isso seta o valor da semente do
gerador aleatório e portanto usará sempre o mesmo ponto inicial na
otimização da regressão logística).
3. Regressão logística com regularização (C=1). Imprima com 3
dígitos a acurácia, e use random_state=1.
4. Regressão logística sem regularização e com estandardização dos
dados. Use C=1000000 mas transforme os dados antes de aplicar a
regressão logistica.
5. Aplique um PCA nos dados, de forma que pelo menos 90% da
variância dos dados seja preservada.
6. Rode a regressão logística sem
regularização nos dados do PCA
7. Rode a regressão logística com regularização (C=1) nos dados do
PCA
8. Leia o arquivo abalone-missing.csv com dados
faltantes na 2 a penúltima coluna. Faça o preprocessamento descrito em
1. e impute pela média os valores faltantes. Rode a regressão
sem regularização, sem PCA e sem estandardização.
Last modified: Thu Mar 30 21:08:22 BRT 2017