Problemas com testes estatísticos

Jacques Wainer

Problemas com testes estatísticos

Múltiplos testes - o grande problema

set.seed(1234)
for (i in 1:20){
   tt=t.test(rnorm(30),rnorm(30))
   print(paste(i,":",round(tt$p.value,3)))
}

Múltiplos testes disfarçado de múltiplas variáveis

set.seed(1234)
a=matrix(rnorm(300),ncol=20)
b=matrix(rnorm(400),ncol=20)
for (i in 1:20){
   teste=t.test(a[,i],b[,i])
   print(paste(i,":",  round(teste$p.value,3)))
}

Múltiplos testes disfarçado de análise de subgrupos

set.seed(4321)
a=rnorm(30)
b=rnorm(30)
t.test(a,b)$p.value
t.test(a[1:10],b[1:15])$p.value
t.test(a[10:30],b[15:30])$p.value
t.test(a[seq(1,30,2)],b[seq(1,30,2)])$p.value

Múltiplos testes disfarçado de múltiplos experimentos

Múltiplos testes disfarçado de olhar os dados antes

set.seed(5555)
a=rnorm(1000)
b=rnorm(1000)
t.test(a,b)$p.value
for (i in seq(50,1000,by=20)) print(cat("i:",i,"pval=",t.test(a[1:i],b[1:i])$p.value))

Múltiplos testes quando comparando vários conjuntos de dados: múltiplas comparações

Usando o teste errado

 set.seed(1234)
a = runif(15)
b = rnorm(7,0.5)
t.test(a,b)
wilcox.test(a,b)

Outros problemas

O que isso significa?