Para ser entregue via Classroom como um PDF com as computações, os resultados e suas discussões.
Data de entrega: 10/4 até 11:59 da noite.
Para fazer esse e os outros exercícios eu sugiro usar o R. É possível usar Python e o pacote Statmodels ou o pacote scipy.stats. Usando o Python use por exemplo um notebook Jupyter para os resultados.
É possível também usar o Jupyter com o R como ambiente de execução https://docs.anaconda.com/anaconda/navigator/tutorials/r-lang/. O RStudio também tem um ambiente de notebook https://rmarkdown.rstudio.com/
O arquivo ex2-nonpaired.csv contem dados sobre o pressão sanguinea (bp) e se a pessoa é ou não diabética (type) (diabetico é type = Yes)
teste t
Wilcoxon rank sum
e reporte o p-valor da comparação entre a pressão sangüínea de pessoas diabéticas ou não.
qual tem a maior pressão média? E maior pressão mediana?
a diferença é estatisticamente significativa?
O arquivo ex2-paired.csv contem dados sobre duas medições em Agosto e em Novembro em 13 lugares diferentes (eu não sei que medidas são essas).
test t pareado
Wilcoxon signed rank.
nestes dados.
Qual o mes com maior média e maior mediana?
A diferença é estatisticamente significativa?