Exercício 6
Data de entrega 6/6 em aula
Use os dados do problema Computer Activity (versão 1) disponível
em http://www.dcc.fc.up.pt/~ltorgo/Regression/DataSets.html O
problema é "Predict usr, the portion of time that cpus run in user
mode, from all attributes 1-21."
Teste os seguintes algoritmos de regressão usando validação
cruzada de 5 folds. Reporte a média do erro quadrático médio para os
5 folds.
- regressão linear multipla
- regressão logistica multipla
- arvore de regressão (CART ou outra implementação)
- k-vizinhos para regressão (retorne a média dos valores dos
k-vizinhos mais proximos). Teste para valores do k em
[1,2,5,10,20,50]
- redes neurais de feed-forward de uma camada escondida e o
neuronio de saida com a função de transferencia normal
(logistica). Teste para o número de neuronios na camada escondida em
[1,2,5,10,20]. Para as redes neurais repita o experimento 10
vezes (com valores iniciais para as sinapses diferentes), e escolha
o melhor valor.
- SVM-R (SVM para regressão) Kernel Linear e RBF. Teste para os
valores de C e gamma no mesmo intervalo dos outros exercicios.