Data de entrega: 25/7 a meia noite, via email.
Objetivos: aplicar os vários classificadores visto em aula. Busca de hiperparametros
OS DADOS da versão 1 estavam errados.
Leia o arquivo dados3.csv. O arquivo é um banco de dados conhecido sobre credito bancario na Australia, mas com alguns dos atributos categóricos originais descrição dos dados
O atributo de saída é V15 (classes 1 e 2).
Faça a conversão dos atributos categóricos (V5, V6 e V12) para numéricos, usando one-hot-encoder/dummy variables. Faça o centering e scaling para todos os atributos.
Use 5-fold cross validation.
Use AUC como medida de erro
A busca de hiperparametros será aleatória. O problema especificará um intervalo para hiperparametro. Use uma distribuição uniforme para escolher valores neste intervalo.
Se houver mais de um hiperparametro, escolha 10 combinações aleatórias deles.
Reporte o AUC da melhor combinação de hiperparametros e o valor dos hiperparametros encontrados
Também reporte o AUC de usar os valores default do SKLearn para os hiperparametros que voce buscou.
Sem regularização (e portanto sem hiperparametros)
alpha: 10 números aleatórios entre 10^{-3} e 10^3: Uniforme no expoente,
Sem hiperparametros
Sem hiperparametros
Selecione 10 valores aleatórios ente:
Selecione 10 duplas aleatórias ente:
Use C entre 2^{-5} e 2^{15} uniforme no expoente
Use gamma entre 2^{-9} e 2^3 uniforme no expoente
Use o Gaussian NB. Sem hiperparametros.
Use prunning.
Use todas as combinações dos valores abaixo.
n_estimators: use os valores: 10, 100 e 1000
max_features: use os valores 5, 8 e 10
Selecione 10 trinca aleatórias ente:
n_estimators: de 5 a 100
learning_rate: de 0.01 a 0.3
max_depth: 2 ou 3