Probabilidad e Inferencia Estadística

class: center, middle, inverse, title-slide

.title[
# Probabilidad e Inferencia Estadística
]
.subtitle[
## Estimación de Intervalos
]
.author[
### Mauricio Bucca <a href="https://github.com/mebucca">github.com/mebucca</a> <a href="mailto:mebucca@uc.cl" class="email">mebucca@uc.cl</a>
]
.date[
### 30 September, 2025
]

---

class: inverse, center, middle

# Estimación de Intervalos

---
##Estimación Puntual

.pull-left[

- Cuando contamos con .bold[UNA] muestra no tenemos una distribución de estimados

- Tenemos una .bold[estimación puntual]

Por ejemplo:

`$\bar{X}_{200}$` =  4.0658543

- Sabemos que la media muestral es un estimador insesgado de la media poblacional (en promedio coinciden)

- Sin embargo, .bold[la estimación puntal no necesariamente corresponde al parámetro poblacional].

- No nos tomamos este número tan enserio
 
]

.pull-right[
![](class_12_files/figure-html/unnamed-chunk-2-1.png)
]

---  
class: inverse, center, middle

#Error en estimación

---
##Error en estimación

¿Qué tan probable es que que nuestro estimador se equivoque? ¿en cuanto?

Definamos un nivel de error `$e$`.
--
 La probabilidad de que el estimado `$\bar{X}_{n}$` esté a una distancia `$e$` respecto del parámetro poblacional:

`$$\mathbb{P}( |\bar{X} - \mu| < e) = \quad \mathbb{P}(-e < \bar{X} - \mu < e)$$`

--

dividendo por el error estándard (SE) de `$\bar{X}$`: `$\quad \quad \mathbb{P}\bigg(\frac{-e }{\sigma/\sqrt{n}} < Z_{\bar{X}} < \frac{e}{\sigma/\sqrt{n}}\bigg) =$`

.pull-left[

![](class_12_files/figure-html/unnamed-chunk-3-1.png)
]

.pull-right[

Usamos las propiedades de una Normal Standard para calcular esta probabilidad:

$$ = \Phi\Bigg({\frac{e }{\sigma/\sqrt{n}}}\Bigg) - \Phi\Bigg(\frac{-e }{\sigma/\sqrt{n}}\Bigg)$$
]

---
##Error en estimación, ejemplo

- La variable `$X$` en la población distribuye Normal con `$\sigma=3.464$`.
  - Tomamos un muestra aleaatorias de tamaño 200 y estimamos la media muestral `$\bar{X}_{200}$`.
  
--

.bold[¿Cual es la probabilidad de que nuestro estimado difiera como máximo en 0.25 puntos respecto de la media poblacional?] (en cualquier dirección)

`$$\mathbb{P}(-e < \bar{X} - \mu < e) = \mathbb{P}(-0.25 < \bar{X} - \mu < 0.25)$$`

--

Dividimos por el error estándard (SE) de `$\bar{X}$`, donde  `$SE_{\bar{X}} = \sigma/\sqrt{n} =  3.464/\sqrt{200} \approx 0.245$`

.pull-left[
`\begin{align}
\mathbb{P}(-0.25 < \bar{X} - \mu < 0.25) &= \mathbb{P}\bigg(\frac{-0.25}{0.245} < Z_{\bar{X}} < \frac{0.25}{0.245}\bigg) \\ \\
&= \mathbb{P}\bigg(−1.02 < Z_{\bar{X}} < 1.02 \bigg) \\ \\
&= 1 - 2 \cdot \Phi(−1.02) \approx 0.6922 \\ \\
\end{align}`
]

.pull-right[
![](class_12_files/figure-html/unnamed-chunk-4-1.png)
]

---
class: inverse, center, middle

#Intervalos de confianza

---
##Intervalos de confianza

.pull-left[
Anteriormente calculamos la probabilidad de que el estimado `$\bar{X}_{n}$` esté a una distancia `$e$` respecto del parámetro poblacional: 
]

.pull-right[
`$$\mathbb{P}\bigg(-e < \bar{X} - \mu < e\bigg) = \mathbb{P}\bigg(\frac{-e }{\sigma/\sqrt{n}} < Z_{\bar{X}} < \frac{e}{\sigma/\sqrt{n}}\bigg)$$`
]

--

Un .bold[intervalo de confianza] consiste en el proceso inverso:

> Buscar un intervalo de valores tal que el .bold[parámetro poblacional se encuentre dentro del intervalo] con una cierta probabilidad arbitraria (nivel de confianza).

--

Definamos un .bold[Nivel de Confianza] = `$1 - \alpha$`

El intervalo `$(a,b)$` es un intervalo de confianza al  `$100 \cdot (1 - \alpha) \%$` para el estimador `$\bar{X}_{n}$` de la media poblacional `$\mu$` si:

.content-box-primary[
`$$\color{white}{\mathbb{P}(a < \mu < b ) = 1 - \alpha}$$`
]

donde `$a$` y `$b$` son funciones de `$\bar{X}_{n}$`. 
--
.bold[¿Cómo determinamos los valores de a y b?]

---
##Intervalos de confianza, paso a paso:

i. Estandarizamos la media muestral:  `$Z_{\bar{X}} = \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} \quad$` donde `$\quad \sigma_{\bar{X}}= \sigma/\sqrt{n}$` o Error Estándard (EE).

- Por TLC sabemos `$\frac{\bar{X} - \mu}{\sigma_{\bar{X}}} \sim \text{Normal}(0,1)$`

ii. Definimos el nivel de confianza `$1 - \alpha$` y buscamos los "valores críticos" `$(-C,C)$` tales que:
`$$\mathbb{P}\bigg( -C < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < C \bigg) = 1 - \alpha$$`

.pull-left[
![](class_12_files/figure-html/unnamed-chunk-5-1.png)
]

.pull-right[

En cada cola se acumula un probabilidad de `$\alpha/2$`.

- `$\quad C = \Phi^{-1}(1 - \alpha/2)$` `$\equiv$` `$Z_{\alpha/2}$`

- `$-C = \Phi^{-1}(\alpha/2)$` `$\equiv$` `$-Z_{\alpha/2}$`

]

---
##Intervalos de confianza, paso a paso:

ii. `$\mathbb{P}\bigg( -C < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < C \bigg) = 1 - \alpha$`

iii. `$\mathbb{P}\bigg( \Phi^{-1}(\alpha/2) < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < \Phi^{-1}(1 - \alpha/2) \bigg) = 1 - \alpha$`

> por simpleza re-escrimos `$\Phi^{-1}(\alpha/2)$` y `$\Phi^{-1}(1 - \alpha/2)$` como `$-Z_{(\alpha/2)}$` y `$Z_{(\alpha/2)}$` respectivamente.

iv. `$\mathbb{P}\bigg( -Z_{(\alpha/2)} < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < Z_{(\alpha/2)} \bigg) = 1 - \alpha$`

v. `$\mathbb{P}\bigg( -Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \bar{X} - \mu < Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha$`

vi. `$\mathbb{P}\bigg( -Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu - \bar{X} < Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha$`

vii. `$\mathbb{P}\bigg( \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu < \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha$`

---
##Intervalos de confianza

En resumen,

El intervalo `$(a,b)$` es un intervalo de confianza al  `$100 \cdot (1 - \alpha) \%$` para el estimador `$\bar{X}_{n}$` de la media poblacional `$\mu$` si:

`$$\mathbb{P}(a < \mu < b ) = 1 - \alpha$$`

Más específicamente,

.content-box-primary[
`$$\color{white}{\mathbb{P}\bigg( \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu < \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha}$$`
]

donde:

- `$\sigma_{\bar{X}}= \sigma/\sqrt{n}$`

- `$-Z_{\alpha/2} = \Phi^{-1}(\alpha/2)$`

- `$\quad Z_{\alpha/2} = \Phi^{-1}(1 - \alpha/2)$`

---
##Intervalos de confianza, qué es y qué no

Un intervalo al `$100 \cdot (1 - \alpha)\%$` de confianza `$CI: (\bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} , \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} )$` ...

.bold[NO ES:]

.content-box-secondary[
`$\color{black}{\text{La probabilidad de que la media poblacional } \mu \text{ tome valores entre } \bar{X} -  Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \quad \text{y} \quad  \bar{X} + Z_{(\alpha/2)}\cdot \sigma_{\bar{X}}}$`
]

> `$\mu$` es un valor fijo y no es una variable aleatoria que tome valores en un intervalo. La aleatoriedad la aporta `$\bar{X}$` por el hecho de estar calculado en una muestra aleatoria.

.bold[ES:]
.content-box-primary[
`$\color{white}{\text{La probabilidad de que un intervalo entre } \bar{X} -  Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \quad \text{y} \quad  \bar{X} + Z_{(\alpha/2)}\cdot \sigma_{\bar{X} \quad} \text{contenga la media poblacional } \mu}$`

]

> Si tomamos infinitas muestras de tamaño `$n$` a partir de la misma población y en cada uno construimos un intervalo en torno al promedio muestral `$\bar{X}$`, el `$100 \cdot (1 - \alpha)\%$` de dichos intervalos contendrá `$\mu$`.

---
class: inverse, center, middle

#Intervalos de confianza

###Ejemplo

[`[Shiny App]`](https://github.com/mebucca/ad2-sol114/blob/master/slides/class_12/shinyapp_ci.R)

---
class: inverse, center, middle

##Hasta la próxima clase. Gracias!

Mauricio Bucca 
https://mebucca.github.io/ 
github.com/mebucca