Exercício 2

Exercício 2

pode ser feito individualmente ou em pares

Para ser entregue via email como um PDF com as computações, os resultados e suas discussões.

Data de entrega: 17/4 até 11:59 da noite.

Para fazer esse e os outros exercícios eu sugiro usar o R. É possível usar Python e o pacote Statmodels. Usando o Python use por exemplo um notebook Jupyter para os resultados. É possível também usar o Jupyter com o R como ambiente de execução https://docs.anaconda.com/anaconda/navigator/tutorials/r-lang/. O RStudio também tem um ambiente de notebook https://rmarkdown.rstudio.com/

Intervalo de confiança

Os arquivos a1.csv e b1.csv contém um conjunto de medidas cada um.

Gere o intervalo de confiança para o conjunto a1.csv (intervalo de 95% de confiança)

Usando :

Tamanho de efeito

Calcule o Cohen D para a diferença entre os dois conjuntos.

Há algumas definições diferentes para o Cohen D. A ideia é sempre a diferença das médias dividido pelo desvio padrão “dos dois conjuntos”. A questão é o que é o desvio padrão “dos conjuntos”. Ha algumas possibilidades

Além do Cohen D, há uma medida derivada chamada Hedge g que é o Cohen D com pooled standard variation mas com um outro termo multiplicativo de correção que tem maior efeito para conjuntos menores. Esse parece ser a medida mais correta para usar em artigos, mas ela não é diferente do Cohen D se os dois conjuntos de dados são grandes.

Intervalo de confiança para o tamanho de efeito

Compute o intervalo de confiança do Cohen D

Usando o intervalo de confiança do Cohen D diga se a existe uma diferença significativa entre os dois conjuntos de dados.

Note que a conclusão que voce chegara usando o intervalo de confiança e o teste.t não são a mesma, contrario ao que eu falei em aula. O problema é que as técnicas usadas para calcular o intervalo de confiança do Cohen D e do teste t não são exatamente iguais. Neste caso que o intervalo de confiança é levemente acima do 0 e o p.valor é levemente acima do 0.05 essas diferenças nas técnicas e pressuposições das duas computações (intervalo de confiança e p-valor) fazem diferença.