Defesa de Mestrado de Juan Sebastian Beleño Diaz

Título do Trabalho
WorkflowHunt: a hybrid search mechanism for scientific workflow repositories
Candidato(a)
Juan Sebastian Beleño Diaz
Nível
Mestrado
Data
Add to Calender 2018-05-03 00:00:00 2018-05-03 00:00:00 Defesa de Mestrado de Juan Sebastian Beleño Diaz WorkflowHunt: a hybrid search mechanism for scientific workflow repositories Sala 85 IC 2 INSTITUTO DE COMPUTAÇÃO mauroesc@ic.unicamp.br America/Sao_Paulo public
Horário
10:00
Local
Sala 85 IC 2
Orientador(a)
Claudia Maria Bauzer Medeiros
Banca Examinadora

Condição

Titulares  -  Professores Doutores

Unidade/Instituição

Orientador/Presidente

Claudia Maria Bauzer Medeiros

IC/UNICAMP

Membro

Benilton de Sa Carvalho

IMECC/UNICAMP

Membro

Julio Cesar Dos Reis

IC/UNICAMP

 

Condição

Suplentes  -  Professores Doutores

Unidade/Instituição

Suplente

Leonardo Montechi

IC/UNICAMP

Suplente

Ana Estela Antunes Da Silva

FT/UNICAMP

Resumo

Os experimentos científicos e os conjuntos de dados gerados a partir deles estão crescendo em tamanho e complexidade. Os cientistas estão enfrentando dificuldades para compartilhar esses recursos e permitir a reprodutibilidade do experimento. Algumas iniciativas surgiram para tentar resolver esse problema. Uma delas envolve o uso de workflows científicos para representar a execução de experimentos científicos. Existe um número crescente de workflows que são potencialmente relevantes para mais de um domínio científico. Criar um workflow leva tempo e recursos e sua reutilização ajuda aos cientistas a criar novos workflows de forma mais rápida e confiável. No entanto, é difícil encontrar workflows adequados para reutilização. Geralmente, os repositórios de workflows possuem mecanismos de busca com muitas limitações, o que afeta negativamente a descoberta de workflows relevantes para um cientista ou seu time. Esta dissertação apresenta WorkflowHunt, uma arquitetura híbrida para busca e descoberta de workflows em repositórios genéricos, combinando busca baseada em palavras-chave e busca semântica para encontrar workflows relevantes usando diferentes métodos de busca. A arquitetura foi validada por meio de um protótipo que usa workflows e metadados reais do myExperiment, um dos maiores repositórios de workflows científicos. Nosso sistema também compara seus resultados com o mecanismo de busca do myExperiment para analisar em que casos um sistema supera o outro.