Problemas com testes estatísticos

Jacques Wainer

R online

Problemas com testes estatísticos

Múltiplos testes - o grande problema

set.seed(1234)
for (i in 1:20){
   tt=t.test(rnorm(30),rnorm(30))
   print(sprintf("%2d : %.2f", i, tt$p.value))
}

Múltiplos testes disfarçado de múltiplas variáveis

set.seed(1234)
a=matrix(rnorm(300),ncol=20)
b=matrix(rnorm(400),ncol=20)
for (i in 1:20){
   teste=t.test(a[,i],b[,i])
   print(sprintf("%2d : %.2f", i, teste$p.value))
}

Múltiplos testes disfarçado de análise de subgrupos

set.seed(1111)
a=rnorm(30)
b=rnorm(30)
t.test(a,b)$p.value
t.test(a[1:10],b[1:15])$p.value
t.test(a[10:30],b[15:30])$p.value
t.test(a[seq(1,30,2)],b[seq(1,30,2)])$p.value

Múltiplos testes disfarçado de múltiplos experimentos

Múltiplos testes disfarçado de olhar os dados antes

set.seed(5555)
a=rnorm(1000)
b=rnorm(1000)
t.test(a,b)$p.value
for (i in seq(50,1000,by=20)) print(sprintf("%3d: %.2f ", i, t.test(a[1:i],b[1:i])$p.value))

Múltiplos testes quando comparando vários conjuntos de dados: múltiplas comparações

Outros problemas

O que isso significa?