Exercício 1

Exercicio 1

pode ser feito individualmente ou em pares

Para ser entregue via email como um PDF com as computações, os resultados e suas discussões.

Data de entrega: 9/10 até 11:59 da noite.

Para fazer esse e os outros exercícios eu sugiro usar o R. É possível usar Python e o pacote Statmodels. Usando o Python use por exemplo um notebook Jupyter para os resultados. É possível também usar o Jupyter com o R como ambiente de execução https://docs.anaconda.com/anaconda/navigator/tutorials/r-lang/. O RStudio também tem um ambiente de notebook https://rmarkdown.rstudio.com/

Dados não pareados

O arquivo ex1.csv contem dados sobre o pressão sanguine (bp) e se a pessoa é ou não diabética (type)

  1. Use os seguintes testes

e reporte o p-valor da comparação entre a pressão sangüínea de pessoas diabéticas ou não.

Dados pareados

O arquivo ex1-paired.csv contem dados sobre duas medições em Agosto e em Novembro em 13 lugares diferentes (eu não sei que medidas são essas).

  1. Use os seguintes testes

nestes dados.

Estudo dos fatores que influenciam o p-valor.

  1. Discuta a influencia dos 3 fatores no p-valor: número de dados, ruído dos dados (o desvio padrão das fontes) e “tamanho da diferença” entre as fontes (diferença entre as médias)

  2. Rode os exemplos acima usando o Wilcoxon rank-sum e mostre que (provavelmente) os efeitos que voce encontrou no teste T é o mesmo para o Wilcoxon. Isso é para mostrar que esses efeitos no p-valor não dependem do teste em si mas são propriedades do conceito de p-valore.