07 dez 2022
10:00 Defesa de Mestrado Auditório do IC3
Tema
Scientific Semantic Metasearch (SSM): uma plataforma para recuperação de dados científicos
Aluno
Gustavo Caetano Borges
Orientador / Docente
Orientadora: Claudia Maria Bauzer Medeiros / Coorientador: Julio Cesar dos Reis
Breve resumo
A pesquisa científica em todos os domínios do conhecimento vem avançando em complexidade e na quantidade de dados gerados. O aumento no volume de dados está criando vários desafios de pesquisa a considerar, como por exemplo onde armazená-los e quais metadados usar. A heterogeneidade dos repositórios e dos padrões de metadados usados contribui para a complexidade em achar os dados adequados a serem reusados em um contexto de pesquisa. Aspectos regionais também complicam a recuperação de arquivos, pois um mesmo conjunto de dados pode ser descrito de forma diferente. Todos esses fatos geram a necessidade por maneiras mais flexíveis de buscar arquivos de dados de pesquisa – em outras palavras, recuperação de informação mesmo que armazenada em lugares diferentes ou descrita de formas diversas. De fato, repositórios de dados de pesquisa costumam ter catálogos de metadados para facilitar a busca e identificação dos arquivos desejados. Para diminuir as questões de heterogeneidade, há várias pesquisas associadas ao compartilhamento de dados por meio de repositórios de dados científicos, e seus padrões de metadados. No entanto, há ainda várias lacunas a serem preenchidas no processo de busca. A pesquisa desenvolvida no mestrado, portanto, tem por objetivo encontrar as fontes de dados adequadas dado este cenário de heterogeneidade. A pesquisa especificou e desenvolveu uma plataforma computacional que suporta metabusca por dados científicos, usando métodos semânticos. Esta plataforma – SSM (Scientific Semantic Metasearch) – suporta busca por conjuntos de dados distribuídos em repositórios heterogêneos por meio de ontologias, desta forma ajudando a resolver os problemas de heterogeneidade na descrição dos dados. O protótipo foi testado no contexto de um estudo de caso em agricultura, que mostrou evidências que o uso de semântica pode melhorar a adequação dos dados buscados.
Banca examinadora
Titulares:
Claudia Maria Bauzer Medeiros IC/UNICAMP
Jaudete Daltio EMBRAPA
Guilherme Pimentel Telles IC/UNICAMP
Suplentes:
Ariadne Maria Brito Rizzoni Carvalho IC/UNICAMP
Luciano Antonio Digiampietri EACH/USP