pode ser feito individualmente ou em pares
Para ser entregue via email como um PDF com as computações, os resultados e suas discussões.
Data de entrega: 17/4 até 11:59 da noite.
Para fazer esse e os outros exercícios eu sugiro usar o R. É possível usar Python e o pacote Statmodels. Usando o Python use por exemplo um notebook Jupyter para os resultados. É possível também usar o Jupyter com o R como ambiente de execução https://docs.anaconda.com/anaconda/navigator/tutorials/r-lang/. O RStudio também tem um ambiente de notebook https://rmarkdown.rstudio.com/
Os arquivos a1.csv e b1.csv contém um conjunto de medidas cada um.
Gere o intervalo de confiança para o conjunto a1.csv (intervalo de 95% de confiança)
Usando :
teste t reverso
Wilcoxon rank sum reverso
bootstrap. Bootstrap é uma técnica genérica baseado em amostragem (do conjunto de dados) para testes estatísticos e geração de intervalos de confiança. Este video fala sobre bootstrap em geral. Eu não falei nada sobre usar bootstrap como uma técnica para testes estatísticos. Usaremos o bootstrap para gerar intervalos de confiança Esta sequencia de videos discute a teoria de bootstrap para calcular intervalos de confiança (de qualquer medida - não apenas a média como estamos usando). (O interessante é como a professora escreve com a letra espelhada? Ela escreve “atras” do vidro!) Finalmente este tutorial explica como usar a função boot e boot.ci do R para calcular o intervalo de confiança da média. Use a técnica bca para calcular o intervalo de confiança com 5000 repetições (bootstraps).
Calcule o Cohen D para a diferença entre os dois conjuntos.
Há algumas definições diferentes para o Cohen D. A ideia é sempre a diferença das médias dividido pelo desvio padrão “dos dois conjuntos”. A questão é o que é o desvio padrão “dos conjuntos”. Ha algumas possibilidades
Além do Cohen D, há uma medida derivada chamada Hedge g que é o Cohen D com pooled standard variation mas com um outro termo multiplicativo de correção que tem maior efeito para conjuntos menores. Esse parece ser a medida mais correta para usar em artigos, mas ela não é diferente do Cohen D se os dois conjuntos de dados são grandes.
Compute o intervalo de confiança do Cohen D
Usando o intervalo de confiança do Cohen D diga se a existe uma diferença significativa entre os dois conjuntos de dados.
Note que a conclusão que voce chegara usando o intervalo de confiança e o teste.t não são a mesma, contrario ao que eu falei em aula. O problema é que as técnicas usadas para calcular o intervalo de confiança do Cohen D e do teste t não são exatamente iguais. Neste caso que o intervalo de confiança é levemente acima do 0 e o p.valor é levemente acima do 0.05 essas diferenças nas técnicas e pressuposições das duas computações (intervalo de confiança e p-valor) fazem diferença.