Exercício 3 (versao 1)
- leia o arquivo abalone do exercicio 2
- faça o preprocessamento do atributo categorico e do atributo de saida como no exercicio 2
- estandardize todos os atributos numéricos. Voce pode estardartizar todo o arquivo de uma vez. Como discutimos em aula esse não é a coisa 100% certa, mas é um erro menor.
Logistic regression
- faça o logistic regression com $C=10^{-1,0,1,2,3}$. O loop externo deve ser um 5-fold CV estratificado. O loop interno para a escolha do hiperparametro deve ser um 3-fold estratificado.
- voce tem que fazer o loop interno explicitamente, usando StratifiedKFold e não funções como GridSearchCV
- qual a acurácia do LR com a melhore escolha de parametros (para cada fold)?
Linear SVM
- faça o LinearSVM com $C=10^{-1,0,1,2,3}$. O loop externo deve ser um 5-fold estratificado. O loop interno um 3-fold estratificado. Neste caso voce nao precisa fazer o 3 fold explicitamente, voce pode usar o GridSearchCV.
- qual a acurácia do LinearSVM com a melhor escolha de C?
LDA
- Faça o LDA. Reporte a acuracia
Classificador final
- qual o melhor classificador para esse problema?
- se não o LDA, calcule o hiperparametro C a ser usado
- gere o classificador final.