Reprodutibilidade e questões éticas

Jacques Wainer

Crise de reprodutibilidade em ciências

Crise de reprodutibilidade em Ciências

psicologia: tentaram reproduzir 100 artigos publicados em 2015 nas 3 melhores revistas

medicina: do artigo da wikipedia

A survey on cancer researchers found that half of them had been
unable to reproduce a published result.[63] 

A similar survey by Nature on 1,576 researchers who took a brief 
online questionnaire on reproducibility showed that more than 70% 
of researchers have tried and failed to reproduce another 
scientist's experiments, and more than half have failed to reproduce 
their own experiments. [64]

Muitos sabem que não da para reproduzir “tudo” mas quanto é “tudo”?

Há uma diminuição do tamanho do efeito nas replicações (sem fonte)

John Ioannidis é um dos pesquisadores mais conhecidos ligado a essa área (problemático agora dado suas posições sobre COVID)

um livro da National Academy of Science (USA) sobre reprodutibilidade nas ciências. pdf gratuito

Por que?

Retraction

Retraction watch

um paper pode ser “retirado” de uma revista por varias razões https://retractionwatch.com/retraction-watch-database-user-guide/retraction-watch-database-user-guide-appendix-b-reasons/

Reprodutibilidade como confiança

Minha opinião, baseado nos níveis propostos em Guidelines for Transparency and Openness Promotion (TOP) https://ropensci.github.io/reproducibility-guide/sections/introduction/ e neste artigo

Reprodutibilidade em computação

mal uso de aprendizado de maquina pode estar gerando nao reproducibilidade em outras areas https://reproducible.cs.princeton.edu (https://www.nature.com/articles/d41586-022-02035-w>

Reproducibilidade em pesquisa de aprendizado de maquina

A 2019 study reporting a systematic analysis of recent
publications applying deep learning or neural methods to recommender
systems, published in top conferences (SIGIR, KDD, WWW, RecSys), has
shown that on average less than 40% of articles are reproducible, with
as high as 75% and as little as 14% depending on the
conferences. 

Moreover, all but one of the analysed articles proposed
algorithms that were not competitive against much older and simpler
properly tuned baselines. The article also highlights a number of
potential problems in today's research scholarship and calls for
improved scientific practices in that area.[75] These results follow
previous similar findings dating back to 2011.[76][77]

Provavelmente esse artigo https://arxiv.org/abs/1911.07698

sei de relatos do tipo, “todos sabem que não da para acreditar 100% nos resultados desta área”

isso pode ser a razão da segunda parte do texto acima (não usar os melhores baselines)

Este artigo é importante no assunto (mas um pouco antigo)

Outro artigo mais moderno - 2018

Victoria Stodden parece ser a pesquisadora mais importante nessa área

Níveis de reprodutibilidade em computação

existe o termo Repeatability que é mais forte que reprobucibility

e também:

A FAPESP agora exige um plano de disponibilidade de dados para todos os projetos de pesquisa (acho que inclusive bolsa de mestrado e doutorado). https://fapesp.br/gestaodedados

Questões éticas

Ética em pesquisa médica

vem da área de medicina.

princípios que regem o comportamento em relação a sujeitos de experimentos, e os direitos desses sujeitos.

existe uma combinação de questões éticas com proteção legal que confunde as coisas.

Princípios:

Termo de consentimento livre e esclarecido - TCLE.

Ainda mais complicado para pessoas e populações que não podem consentir (crianças, pessoas com debilidade cognitiva, populações indígenas)

Declaração de Helsinki de 2013

Ética em outras pesquisas biomédicas

bancos de dados em saúde

Declaração de Taipei 2016 sobre bancos de dados em saúde (para pesquisa)

Organização

Distinguir entre ética em pesquisa de computação e ética na prática profissional da computação por exemplo ACM

Autorização de divulgação de dados

Se voce vai criar um conjunto de dados relativo a pessoas (imagens, vídeos, medidas do batimento cardíaco, respostas a perguntas, gravação da voz, etc) acho prudente pedir que as pessoas assinem uma autorização de divulgação dos dados (não sei o termo oficial para isso).

Não sei os termos desta autorização.

Ética de publicação

Outros princípios não consensuais de publicação: