Jacques Wainer (wainer@ic.unicamp.br)
SECOM - Agosto 2017
Voltado para 3 tipos de audiências:
Futuros pesquisadores (mestrado e doutorado)
Todos os assuntos
Profissionais
Testes estatísticos e talvez busca bibliográfica
Cidadãos
Como entender resultados da Ciência em geral
Artigos reportam em diferentes tipos de pesquisa. Por ordem de qualidade:
Engenharia de software
Informática em educação
Informática em saúde
Engenharia de software
Informática em educação
segurança
VLSI
a=rnorm(6,10) b=rnorm(4,10)
rnorm(6,10)
gera 6 dados de uma distribuição normal de média 10, e
desvio padrão de 1.
mean(a) mean(b)
tira a média dos dois conjuntos. Não são iguais, um deles é "melhor"! Mas eles são basicamente iguais - são duas amostragens de uma mesma fonte, e a diferença entre os dois conjuntos é apenas devido a "sorte"
pareado | não pareado | |
---|---|---|
paramétrico | teste T pareado | teste T nao pareado |
não paramétrico | Wilcoxon signed rank | Wilcoxon sum rank |
pareado | não pareado | |
---|---|---|
paramétrico | repeated ANOVA | ANOVA |
não paramétrico | Friedman | Kruskal-Wallis |
Há outros testes para outras situações (dados não numéricos, dados 0/1 pareados e não pareados, etc).
a=rnorm(6,10) b=rnorm(4,10) wilcox.test(a,b)
wilcox.test
roda o sum rank (dados não pareados), que é um teste não paramétrico
x=rnorm(35,10) y=rnorm(30,10.3) wilcox.test(x,y) t.test(x,y)
veja que o teste T deu um p-valor menor, e confirma o que foi dito que teste T é mais poderoso. Mas veja:
wilcox.test(a,b) t.test(a,b)
a
e b
não satisfazem as pressuposições do teste T (n>30) e então o
teste não da o menor p-valor.
?t.test
a=matrix(rnorm(300),ncol=20) b=matrix(rnorm(400),ncol=20) for (i in 1:20){ teste=t.test(a[,i],b[,i]) print(paste(i,":", round(teste$p.value,3))) }
a=rnorm(1000,10) b=rnorm(1000,10) for (i in 10:1000){ x = t.test(a[1:i],b[1:i])$p.value if (x < 0.05) print(paste(i,x)) }
a=rnorm(6,10) t.test(a) wilcox.test(a,conf.int=T)
a=rnorm(6,10) b=rnorm(8,10.3) x=rnorm(8,12) t.test(a,b) t.test(a)$conf.int t.test(b)$conf.int t.test(a,x) t.test(x)$conf.int