Analise Bayesiana

Jacques Wainer

Análise Bayesiana

Teorema de Bayes

P(X|Y) é a probabilidade de X dado que Y aconteceu. Ou a probabilidade condicional de X dado Y

Como P(A|B) e P(B|A) se relacionam?

P(A|B) = \frac{P(B|A) P(A)}{P(B)}

“Antes” voce tinha apenas o A, com probabilidade de P(A) - o prior.

Ai aconteceu B (nova evidência) e voce passa a ter P(A|B) - o posterior.

Outras versão do teorema de Bayes

P(A e B) = P(A|B) P(B) = P(B|A) P(A)

Essa é mais fácil de lembrar - P(A,B) a joint probability de A e B (a probabilidade de A e B acontecerem)

Uma regra importante

P(B) = \sum_x P(B,C=x) =\sum_x P(B|C=x) P(C=x)

x são todos os valores que C pode assumir.

Assim, varias vezes a evidencia P(B) é expressa como

P(B) = \sum_x P(B|A=x) P(A=x)

P(A=a|B=b) = \frac{P(B=b|A=a) P(A=a)}{\sum_x P(B=b,A=x)}

Finalmente se P(A|B) é uma distribuição (se A ou B é uma variável), então o termo de evidencia P(B) pode ser pensado apenas como uma constante para garantir que a distribuição de probabilidade P(A|B) some (ou de integral) = 1.

P(A=a|B=x) = K P(B=x|A=a) P(A=a)

desde que \sum_x P(A=a|B=x) ou \int P(A=a|B=x) dx seja = 1

Ideia central da análise bayesiana

P(hipotese|dados) = \frac{P(dados|hipotese) P(hipotese)}{P(dados)}

Próximo passo da analise bayesiana

Na verdade em analise bayesiana nós definimos um modelo (M) para a geração dos dados que tem parâmetros \theta, e não apenas uma hipótese. O que queremos é obter os parâmetros do modelo dado os dados D Exemplo: imagem

P(\theta|D,M) =\frac{ P(D|\theta,M) P(\theta|M)}{P(D|M)}

Diferentes modelos (M) propostos

MCMC

Outras Inferências possíveis da joint distribution

BF = \frac{P(h1|D)}{P(h2|D)} = \frac{P(D|h1)}{P(D|h2)}\frac{P(h1)}{P(h2)}

Mais sobre Analise bayesiana

referencias

BEST https://jkkweb.sitehost.iu.edu/articles/Kruschke2013JEPG.pdf

Bayesian wilcoxon https://jmlr.org/papers/v18/16-305.html e bons argmentos porque usar analise bayesiana

Meu paper https://arxiv.org/abs/2208.04935

Exemplo

x1 <- c(5.77, 5.33, 4.59, 4.33, 3.66, 4.48)
x2 <- c(4.88, 4.55, 4.29, 2.59, 2.33, 3.59)

t.test(x1,x2)

library(BEST)

zz = BESTmcmc(x1,x2)

zz$mu1

mean(zz$mu1>zz$mu2)

assuma um ROPE de 0.5

mean(abs(zz$mu1-zz$mu2)<0.5)