23 ago 2024
09:00 Defesa de Doutorado Integralmente à distância
Tema
Regressão baseada em Re-ranqueamento
Aluno
Filipe Marcel Fernandes Gonçalves
Orientador / Docente
Ricardo da Silva Torres - Coorientador: Daniel Carlos Guimarães Pedronette
Breve resumo
Diversas abordagens baseadas em regressão foram desenvolvidas nos últimos anos com o intuito de aperfeiçoar os resultados de predições, incluindo o uso de estratégias de ranqueamento. Algoritmos de ranqueamento são baseados principalmente no cálculo de funções de distância que comparam pares de pontos em um espaço de características de alta dimensão. No entanto, a análise aos pares falha muitas vezes ao considerar relações de similaridades mais globais. Uma linha de pesquisa promissora reflete o uso de abordagens não supervisionadas de re-ranqueamento, cujo objetivo principal é melhorar a eficácia dos ranques analisados. Tais métodos visam explorar informações codificadas sobre a estrutura intrínseca ao conjunto de dados. Os métodos de re-ranqueamento redefinem as distâncias entre os elementos de um conjunto de dados, levando a ranques mais eficazes, em que objetos relevantes são alocados nas primeiras posições. Métodos de re-ranqueamento são amplamente explorados e empregados com sucesso em diversas aplicações, aperfeiçoando os ranques através da codificação da estrutura dos dados e redefinindo distâncias entre os elementos de um conjunto. Geralmente implementados como procedimentos iterativos, os métodos de re-ranqueamento redefinem as distâncias entre objetos, levando a ranques mais eficazes, em que objetos mais relevantes são alocados nas primeiras posições. Apesar de resultados promissores observados, algoritmos de re-ranqueamento ainda não foram avaliados em tarefas de regressão. Esta tese introduz duas novas contribuições com o intuito de explorar métodos de re-ranqueamento para regressão, e tem como objetivo principal diminuir os erros de predição. A primeira contribuição é a proposta de um novo, genérico e personalizável arcabouço intitulado Regressão por Re-ranqueamento (Regression by Re-ranking -- RbR). Esta abordagem explora a capacidade de algoritmos de re-ranqueamento em determinar ranques relevantes aplicados a tarefas de predição. O arcabouço RbR é construído sob a integração de alguns fatores: um regressor base; técnicas de aprendizagem não supervisionadas de re-ranqueamento; e predições associadas aos vizinhos mais próximos ponderados de acordo com suas posições nos ranques. O RbR foi avaliado sob um protocolo experimental rigoroso incluindo 14 conjuntos de dados e 32 métodos baseados em regressão. O uso do RbR alcançou ganhos significativos (até 79%) quando comparado às abordagens do estado da arte. A segunda contribuição deste trabalho baseia-se na proposta de um novo método para a fusão de regressores, denominado Fusão de Regressores (Fusion Regression -- FuR) que também explora o contexto de vizinhança. FuR emprega o aprendizado conjunto (ensemble learning) que combina as predições de diferentes regressores. Primeiramente, diferentes regressores são treinados. Em seguida, FuR cria um novo embedding baseado nas predições dos regressores. O objetivo é reestruturar o conjunto de dados também explorar a visão complementar provida pelos regressores. Esta nova representação dos dados é então utilizada como entrada de métodos de regressão que exploram o contexto de vizinhança. Resultados experimentais envolvendo 10 conjuntos de dados e 15 regressores demonstraram que o FuR pode alcançar ganhos efetivos em tarefas de regressão.
Banca examinadora
Titulares:
Ricardo da Silva Torres IC/UNICAMP
Henrique Murilo Gaspar NTNU/Noruega
Guillermo Cámara Chávez DECOM/UFOP
Guilherme Palermo Coelho FT/UNICAMP
Marco Antonio Garcia de Carvalho FT/UNICAMP
Suplentes:
Sandra Eliza Fontes de Avila IC/UNICAMP
João Paulo Papa FC/UNESP
Moacir Antonelli Ponti ICMC/USP