Exercício 2

pode ser feito individualmente ou em pares

Para ser entregue via email como um PDF com as computações, os resultados e suas discussões.

Data de entrega: 17/4 até 11:59 da noite.

Para fazer esse e os outros exercícios eu sugiro usar o R. É possível usar Python e o pacote Statmodels. Usando o Python use por exemplo um notebook Jupyter para os resultados. É possível também usar o Jupyter com o R como ambiente de execução https://docs.anaconda.com/anaconda/navigator/tutorials/r-lang/. O RStudio também tem um ambiente de notebook https://rmarkdown.rstudio.com/

Intervalo de confiança

Os arquivos a1.csv e b1.csv contém um conjunto de medidas cada um.

Gere o intervalo de confiança para o conjunto a1.csv (intervalo de 95% de confiança)

Usando :

teste t reverso
Wilcoxon rank sum reverso
bootstrap. Bootstrap é uma técnica genérica baseado em amostragem (do conjunto de dados) para testes estatísticos e geração de intervalos de confiança. Este video fala sobre bootstrap em geral. Eu não falei nada sobre usar bootstrap como uma técnica para testes estatísticos. Usaremos o bootstrap para gerar intervalos de confiança Esta sequencia de videos discute a teoria de bootstrap para calcular intervalos de confiança (de qualquer medida - não apenas a média como estamos usando). (O interessante é como a professora escreve com a letra espelhada? Ela escreve “atras” do vidro!) Finalmente este tutorial explica como usar a função boot e boot.ci do R para calcular o intervalo de confiança da média. Use a técnica bca para calcular o intervalo de confiança com 5000 repetições (bootstraps).

Tamanho de efeito

Calcule o Cohen D para a diferença entre os dois conjuntos.

Há algumas definições diferentes para o Cohen D. A ideia é sempre a diferença das médias dividido pelo desvio padrão “dos dois conjuntos”. A questão é o que é o desvio padrão “dos conjuntos”. Ha algumas possibilidades

o desvio padrão da união dos dois conjuntos. Nenhuma abordagem segue isso
o desvio padrão de uma só dos conjuntos (o conjunto “normal” ou de controle). Essa abordagem é chamada de delta de Glass.
a media dos desvio padrão dos dois conjuntos. Essa abordagem não tem um nome próprio mas é usada de vez em quando.
a media ponderada dos desvios padrão dos dois conjuntos. Essa abordagem é chamada de pooled standard variation. É essa variação que eu quero que voces usem

Além do Cohen D, há uma medida derivada chamada Hedge g que é o Cohen D com pooled standard variation mas com um outro termo multiplicativo de correção que tem maior efeito para conjuntos menores. Esse parece ser a medida mais correta para usar em artigos, mas ela não é diferente do Cohen D se os dois conjuntos de dados são grandes.

Intervalo de confiança para o tamanho de efeito

Compute o intervalo de confiança do Cohen D

Usando o intervalo de confiança do Cohen D diga se a existe uma diferença significativa entre os dois conjuntos de dados.

Note que a conclusão que voce chegara usando o intervalo de confiança e o teste.t não são a mesma, contrario ao que eu falei em aula. O problema é que as técnicas usadas para calcular o intervalo de confiança do Cohen D e do teste t não são exatamente iguais. Neste caso que o intervalo de confiança é levemente acima do 0 e o p.valor é levemente acima do 0.05 essas diferenças nas técnicas e pressuposições das duas computações (intervalo de confiança e p-valor) fazem diferença.