class: center, middle, inverse, title-slide .title[ # Probabilidad e Inferencia Estadística ] .subtitle[ ## Estimación de Intervalos ] .author[ ###
Mauricio Bucca
github.com/mebucca
mebucca@uc.cl
] .date[ ### 30 September, 2025 ] --- class: inverse, center, middle # Estimación de Intervalos --- ##Estimación Puntual .pull-left[ - Cuando contamos con .bold[UNA] muestra no tenemos una distribución de estimados - Tenemos una .bold[estimación puntual] <br> Por ejemplo: `\(\bar{X}_{200}\)` = 4.0658543 <br> - Sabemos que la media muestral es un estimador insesgado de la media poblacional (en promedio coinciden) - Sin embargo, .bold[la estimación puntal no necesariamente corresponde al parámetro poblacional]. - No nos tomamos este número tan enserio ] .pull-right[ <!-- --> ] --- class: inverse, center, middle #Error en estimación --- ##Error en estimación ¿Qué tan probable es que que nuestro estimador se equivoque? ¿en cuanto? -- Definamos un nivel de error `\(e\)`. -- La probabilidad de que el estimado `\(\bar{X}_{n}\)` esté a una distancia `\(e\)` respecto del parámetro poblacional: `$$\mathbb{P}( |\bar{X} - \mu| < e) = \quad \mathbb{P}(-e < \bar{X} - \mu < e)$$` <br> -- dividendo por el error estándard (SE) de `\(\bar{X}\)`: `\(\quad \quad \mathbb{P}\bigg(\frac{-e }{\sigma/\sqrt{n}} < Z_{\bar{X}} < \frac{e}{\sigma/\sqrt{n}}\bigg) =\)` -- .pull-left[ <!-- --> ] .pull-right[ Usamos las propiedades de una Normal Standard para calcular esta probabilidad: <br> $$ = \Phi\Bigg({\frac{e }{\sigma/\sqrt{n}}}\Bigg) - \Phi\Bigg(\frac{-e }{\sigma/\sqrt{n}}\Bigg)$$ ] --- ##Error en estimación, ejemplo - La variable `\(X\)` en la población distribuye Normal con `\(\sigma=3.464\)`. - Tomamos un muestra aleaatorias de tamaño 200 y estimamos la media muestral `\(\bar{X}_{200}\)`. -- .bold[¿Cual es la probabilidad de que nuestro estimado difiera como máximo en 0.25 puntos respecto de la media poblacional?] (en cualquier dirección) -- `$$\mathbb{P}(-e < \bar{X} - \mu < e) = \mathbb{P}(-0.25 < \bar{X} - \mu < 0.25)$$` <br> -- Dividimos por el error estándard (SE) de `\(\bar{X}\)`, donde `\(SE_{\bar{X}} = \sigma/\sqrt{n} = 3.464/\sqrt{200} \approx 0.245\)` -- .pull-left[ `\begin{align} \mathbb{P}(-0.25 < \bar{X} - \mu < 0.25) &= \mathbb{P}\bigg(\frac{-0.25}{0.245} < Z_{\bar{X}} < \frac{0.25}{0.245}\bigg) \\ \\ &= \mathbb{P}\bigg(−1.02 < Z_{\bar{X}} < 1.02 \bigg) \\ \\ &= 1 - 2 \cdot \Phi(−1.02) \approx 0.6922 \\ \\ \end{align}` ] .pull-right[ <!-- --> ] --- class: inverse, center, middle #Intervalos de confianza --- ##Intervalos de confianza .pull-left[ Anteriormente calculamos la probabilidad de que el estimado `\(\bar{X}_{n}\)` esté a una distancia `\(e\)` respecto del parámetro poblacional: ] .pull-right[ `$$\mathbb{P}\bigg(-e < \bar{X} - \mu < e\bigg) = \mathbb{P}\bigg(\frac{-e }{\sigma/\sqrt{n}} < Z_{\bar{X}} < \frac{e}{\sigma/\sqrt{n}}\bigg)$$` ] <br> -- Un .bold[intervalo de confianza] consiste en el proceso inverso: > Buscar un intervalo de valores tal que el .bold[parámetro poblacional se encuentre dentro del intervalo] con una cierta probabilidad arbitraria (nivel de confianza). <br> -- Definamos un .bold[Nivel de Confianza] = `\(1 - \alpha\)` -- El intervalo `\((a,b)\)` es un intervalo de confianza al `\(100 \cdot (1 - \alpha) \%\)` para el estimador `\(\bar{X}_{n}\)` de la media poblacional `\(\mu\)` si: .content-box-primary[ `$$\color{white}{\mathbb{P}(a < \mu < b ) = 1 - \alpha}$$` ] donde `\(a\)` y `\(b\)` son funciones de `\(\bar{X}_{n}\)`. -- .bold[¿Cómo determinamos los valores de a y b?] --- ##Intervalos de confianza, paso a paso: i. Estandarizamos la media muestral: `\(Z_{\bar{X}} = \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} \quad\)` donde `\(\quad \sigma_{\bar{X}}= \sigma/\sqrt{n}\)` o Error Estándard (EE). - Por TLC sabemos `\(\frac{\bar{X} - \mu}{\sigma_{\bar{X}}} \sim \text{Normal}(0,1)\)` -- ii. Definimos el nivel de confianza `\(1 - \alpha\)` y buscamos los "valores críticos" `\((-C,C)\)` tales que: `$$\mathbb{P}\bigg( -C < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < C \bigg) = 1 - \alpha$$` .pull-left[ <!-- --> ] .pull-right[ <br> En cada cola se acumula un probabilidad de `\(\alpha/2\)`. - `\(\quad C = \Phi^{-1}(1 - \alpha/2)\)` `\(\equiv\)` `\(Z_{\alpha/2}\)` - `\(-C = \Phi^{-1}(\alpha/2)\)` `\(\equiv\)` `\(-Z_{\alpha/2}\)` ] --- ##Intervalos de confianza, paso a paso: ii. `\(\mathbb{P}\bigg( -C < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < C \bigg) = 1 - \alpha\)` -- iii. `\(\mathbb{P}\bigg( \Phi^{-1}(\alpha/2) < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < \Phi^{-1}(1 - \alpha/2) \bigg) = 1 - \alpha\)` > por simpleza re-escrimos `\(\Phi^{-1}(\alpha/2)\)` y `\(\Phi^{-1}(1 - \alpha/2)\)` como `\(-Z_{(\alpha/2)}\)` y `\(Z_{(\alpha/2)}\)` respectivamente. -- iv. `\(\mathbb{P}\bigg( -Z_{(\alpha/2)} < \frac{\bar{X} - \mu}{\sigma_{\bar{X}}} < Z_{(\alpha/2)} \bigg) = 1 - \alpha\)` -- v. `\(\mathbb{P}\bigg( -Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \bar{X} - \mu < Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha\)` -- vi. `\(\mathbb{P}\bigg( -Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu - \bar{X} < Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha\)` -- vii. `\(\mathbb{P}\bigg( \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu < \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha\)` --- ##Intervalos de confianza En resumen, El intervalo `\((a,b)\)` es un intervalo de confianza al `\(100 \cdot (1 - \alpha) \%\)` para el estimador `\(\bar{X}_{n}\)` de la media poblacional `\(\mu\)` si: `$$\mathbb{P}(a < \mu < b ) = 1 - \alpha$$` -- Más específicamente, .content-box-primary[ `$$\color{white}{\mathbb{P}\bigg( \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} < \mu < \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \bigg) = 1 - \alpha}$$` ] donde: - `\(\sigma_{\bar{X}}= \sigma/\sqrt{n}\)` - `\(-Z_{\alpha/2} = \Phi^{-1}(\alpha/2)\)` - `\(\quad Z_{\alpha/2} = \Phi^{-1}(1 - \alpha/2)\)` --- ##Intervalos de confianza, qué es y qué no -- Un intervalo al `\(100 \cdot (1 - \alpha)\%\)` de confianza `\(CI: (\bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} , \bar{X} + Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} )\)` ... -- .bold[NO ES:] .content-box-secondary[ `\(\color{black}{\text{La probabilidad de que la media poblacional } \mu \text{ tome valores entre } \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \quad \text{y} \quad \bar{X} + Z_{(\alpha/2)}\cdot \sigma_{\bar{X}}}\)` ] -- > `\(\mu\)` es un valor fijo y no es una variable aleatoria que tome valores en un intervalo. La aleatoriedad la aporta `\(\bar{X}\)` por el hecho de estar calculado en una muestra aleatoria. -- .bold[ES:] .content-box-primary[ `\(\color{white}{\text{La probabilidad de que un intervalo entre } \bar{X} - Z_{(\alpha/2)} \cdot \sigma_{\bar{X}} \quad \text{y} \quad \bar{X} + Z_{(\alpha/2)}\cdot \sigma_{\bar{X} \quad} \text{contenga la media poblacional } \mu}\)` ] > Si tomamos infinitas muestras de tamaño `\(n\)` a partir de la misma población y en cada uno construimos un intervalo en torno al promedio muestral `\(\bar{X}\)`, el `\(100 \cdot (1 - \alpha)\%\)` de dichos intervalos contendrá `\(\mu\)`. --- class: inverse, center, middle #Intervalos de confianza ###Ejemplo [`[Shiny App]`](https://github.com/mebucca/ad2-sol114/blob/master/slides/class_12/shinyapp_ci.R) --- class: inverse, center, middle ##Hasta la próxima clase. Gracias! <br> Mauricio Bucca <br> https://mebucca.github.io/ <br> github.com/mebucca