Probabilidad e Inferencia Estadística

class: center, middle, inverse, title-slide

.title[
# Probabilidad e Inferencia Estadística
]
.subtitle[
## Test de Hipótesis en una muestra
]
.author[
### Mauricio Bucca <a href="https://github.com/mebucca">github.com/mebucca</a> <a href="mailto:mebucca@uc.cl" class="email">mebucca@uc.cl</a>
]

---

class: inverse, center, middle

# Test de Hipótesis en una muestra

---
## ¿Puede un pulpo predecir los resultados del futbol?

.center[![paul](paul.png)]

---
## ¿Puede un pulpo predecir los resultados del futbol?

| Torneo                  | Partido                 | Predicción | Resultado |
|-------------------------|-------------------------|------------|---------------------|
| Euro 2008               | Alemania vs Polonia     | Alemania   | Correcto            |
| Euro 2008               | Alemania vs Croacia     | Alemania   | Incorrecto          |
| Euro 2008               | Alemania vs Austria     | Alemania   | Correcto            |
| Euro 2008               | Alemania vs Portugal    | Alemania   | Correcto            |
| Euro 2008               | Alemania vs Turquía     | Alemania   | Correcto            |
| Euro 2008               | Alemania vs España      | Alemania   | Incorrecto          |
| Mundial 2010            | Alemania vs Australia   | Alemania   | Correcto            |
| Mundial 2010            | Alemania vs Serbia      | Serbia     | Correcto            |
| Mundial 2010            | Ghana vs Alemania       | Alemania   | Correcto            |
| Mundial 2010            | Alemania vs Inglaterra  | Alemania   | Correcto            |
| Mundial 2010            | Argentina vs Alemania   | Alemania   | Correcto            |
| Mundial 2010            | Alemania vs España      | España     | Correcto            |
| Mundial 2010            | Uruguay vs Alemania     | Alemania   | Correcto            |
| Mundial 2010            | Países Bajos vs España  | España     | Correcto            |

---
## ¿Puede un pulpo predecir los resultados del futbol?

¿Paul tiene habilidades especiales o tuvo suerte?

Esta es una pregunta empírica y la podemos testear.

.pull-left[
![](https://static.onecms.io/wp-content/uploads/sites/21/2010/10/pulpo_paul_071410_300.jpg)
]

.bold[Paso #1: Expresar pregunta en términos de Hipótesis Nula e Hipótesis Alternativa]

--

.bold[Hipótesis Nula]: "Paul no tiene ningún talento especial, sus predicciones son como tirar una moneda al aire".

- `$H_0: \mathbb{P}(\text{Acierto}) = \mathbb{P}(\text{Fallo}) = 0.5$`

--

.bold[Hipótesis Alternativa]: "Paul tiene un talento, acierta más de lo que falla", o quizás 
"Paul es un mal adivino, falla más de lo que acierta".

- `$H_a: \mathbb{P}(\text{Acierto}) \neq \mathbb{P}(\text{Fallo})$`

---
## ¿Puede un pulpo predecir los resultados del futbol?

.bold[Paso #2: Elegir y calcular un estadístico]

--

- Los datos nos muestran que Paul acertó en 12 de 14 partidos.

- Estadístico relevante: proporción de aciertos, `$\hat{p}$`.

`$$\text{Proporción de Aciertos}: \hat{p} = \frac{12}{14} = 0.857$$`

---
## ¿Puede un pulpo predecir los resultados del futbol?

.bold[Paso #3: Determinar la Distribución Nula]

- Es decir, la distribución muestral de nuestro estadístico bajo el supuesto de que la `$H_0$` es verdadera -- Paul no tiene habilidad especial y por tanto `$\mathbb{P}(\text{Acierto}) = \mathbb{P}(\text{Fallo}) = 0.5$`.

- Por el TLC sabemos que:  `$\hat{p} \sim \text{Normal}\bigg(p, \frac{\sqrt{p(1-p)} }{\sqrt{n}}\bigg)$`
 
--

- Por tanto,  `$\hat{p} \mid H_{0} \sim \text{Normal}\bigg(0.5, \frac{\sqrt{0.5(1-0.5)} }{\sqrt{n}}\bigg)$`

--

- Estandarizando podemos  derivar un .bold[test-z]:

- Si `$Z_{\hat{p}} = \frac{\hat{p} - p}{\frac{\sqrt{p(1-p)} }{\sqrt{n}}}$` entonces: `$Z_{\hat{p}} \mid H_0   \sim \text{Normal}\big(0, 1\big)$`

- Nuestro estadístico `$\hat{p}$` se transforma el .bold[test-z], el valor estandarizado de del estadístico bajo `$H_0$`:

`$$\hat{z} = \frac{\hat{p} - p}{\frac{\sqrt{p(1-p)} }{\sqrt{n}}} = \frac{0.857 - 0.5}{\frac{\sqrt{0.5(1-0.5)} }{\sqrt{14}}} = 2.6726$$`

---
## ¿Puede un pulpo predecir los resultados del futbol?

.bold[Paso #4: Elegir un nivel de significación] `$\alpha$`

Selecciona un .bold[nivel de significación] `$\alpha$`, tal que consideraremos como "demasiado alto"/"demasiado bajo" aquellos valores que corresponden al `$\alpha$`% de valores más extremos en la distribución nula.

`$$\alpha = \mathbb{P}(\text{Rechazar } H_{0} \mid H_{0} \text{ es verdadera})$$`

--

- Mientras menor es `$\alpha$` más dificl es rechazar la hipótesis nula.

- Dado que no confiamos en pulpos adivinos, vamos trabajar a un nivel alto de significación, `$\alpha=0.01$`.

---
## ¿Puede un pulpo predecir los resultados del futbol?

.bold[Paso #5: Calcular el valor-p]

Si la hipótesis nula fuera verdadera, ¿es nuestro estadístico un valor esperable o un valor extremo?

En nuestro caso estamos testeando

.pull-left[

`$\text{valor-p} = \mathbb{P}( \bar{X} > |\hat{p}| \mid H_{0} \text{ es verdadera})$`

equivalentemente:

`$\text{valor-p} = \mathbb{P}( Z > \big| \frac{\hat{\mu} - \mu}{\sigma/\sqrt{n}} \big| )$`

``` r
n <- 14
p_hat <- 12/14

z_hat <- (p_hat - 0.5)/(sqrt(0.5*0.5) /sqrt(n))

pvalue =  2*(1 - pnorm(z_hat))

cat("z_hat=",round(z_hat,2), " valor-p=", pvalue, sep="")
```

```
## z_hat=2.67 valor-p=0.007526315
```
]

.pull-right[
![](class_17_files/figure-html/unnamed-chunk-2-1.png)
]

---
## ¿Puede un pulpo predecir los resultados del futbol?

.bold[Paso #6: Mantener o Rechazar la Hipótesis Nula]

- Comparamos -- bajo el supuesto de que `$H_0$` es verdaadera --  la probabilidad de obtener el resultados que obtuvimos ( valor-p ) vs. el criterio seleccionado para clasificar resultados como "extremos" ( `$\alpha$` ).

.bold[Decisión:]

- Si `$\text{valor-p} < \alpha$` entonces rechazamos `$H_{0}$`

- Si `$\text{valor-p} > \alpha$` no podemos rechazar `$H_{0}$`

--

En este caso:

```
## 𝛼=0.01; valor-p=0.007526315
```

.bold[Conclusión:]

Una tasa de acierto de 85.7% se encuentra por encima de la proporción esperada bajo el supuesto de que la hipótesis nula -- que Paul acierta con una probabilidad de 0.5. Por tanto con un nivel de significación del 1% (o 99% de confianza) podemos rechazar la hipótesis nula.

Sigue en pie la posibilidad de que Paul tenga habilidades especiales!

---
class: inverse, center, middle

.center[ 
![paul](https://www.toonpool.com/user/10161/files/paul_rules__915595.jpg)
]

---
class: inverse, center, middle

##Hasta la próxima clase. Gracias!

Mauricio Bucca 
https://mebucca.github.io/ 
github.com/mebucca