class: center, middle, inverse, title-slide .title[ # Probabilidad e Inferencia Estadística ] .subtitle[ ## Distribución Normal Standard ] .author[ ###
Mauricio Bucca
github.com/mebucca
mebucca@uc.cl
] --- class: inverse, center, middle #Distribución Normal Standard --- ##Distribución Normal Standard -- - `\(X\)` es una variable aleatoria que sigue una distribución Normal con valor esperado `\(\mu\)` y desviación estándard `\(\sigma\)`. `$$X \sim \text{Normal}(\mu,\sigma)$$` <br> -- - Consideremos una nueva variable aleatoria `\(Z\)`, tal que `$$Z = \frac{X-\mu}{\sigma}$$` -- .bold[Pregunta: ¿Cual es la distribución de Z?] <br> .content-box-secondary[ .bolder[Respuesta]: `$$Z \sim \text{Normal}(0,1)$$` ] --- ##Distribución Normal Standard .pull-left[ <!-- --> ] .pull-right[ .bold[Función de densidad probabilística] <br> `$$f(x) = \frac{1}{7 \sqrt{2\pi}} e^{-\frac{(x - 15)^2}{2 \times 7^2}} $$ <br><br><br><br><br> `$$f(z) = \frac{1}{ \sqrt{2\pi}} e^{-\frac{z^2}{2}} $$ ] --- ##Distribución Normal Standard .pull-left[ <!-- --> ] .pull-right[ .bold[Función de probabilidad acumulada (CDF):] `\begin{align} F(-z) &= \mathbb{P}(Z \leq -z) = \int_{-\infty}^{-z} \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} dx \end{align}` En este caso, `\(-z=-1\)` - No tenemos una fórmula analítica sencilla para `\(F(-z)\)`. - Por convención la .bold[CDF de una Normal Standard se denota] `\(\Phi(.)\)`, tal que - `\(\Phi(-z): F(-z)\)` - En `R` podemos calcular `\(\Phi(-1)\)` fácilmente: ``` r pnorm(-1) ``` ``` ## [1] 0.1586553 ``` ] --- class: inverse, center, middle #Propiedades de la Normal Standard --- ##1) Simetría .pull-left[ <!-- --> ] .pull-right[ Si `\begin{align} \mathbb{P}(Z \leq -z) = \Phi(-z) = p \end{align}` entonces `\begin{align} \mathbb{P}(Z \geq z) = 1 - \Phi(z) = p \end{align}` <br> En este caso, `\(z=1\)` y `\(-z=-1\)` ] --- ##1) Simetría .pull-left[ <!-- --> ] .pull-right[ En `R`, - `\(\mathbb{P}(Z \leq -1) = \Phi(-1) =\)` ``` r pnorm(-1) ``` ``` ## [1] 0.1586553 ``` <br> y <br> - `\(\mathbb{P}(Z \geq 1) = 1 - \Phi(1) =\)` ``` r 1- pnorm(q=1) ``` ``` ## [1] 0.1586553 ``` ] --- ##2) Probabilidad en las colas .pull-left[ <!-- --> ] .pull-right[ `\begin{align} \mathbb{P}( Z \leq -z \quad \text{or} \quad Z \geq z ) &= \\ \\ &= \Phi(-z) + (1 - \Phi(z)) \quad \text{ por simetría} &= \\ \\ &= 2 \times \Phi(-z) \end{align}` <br> <br> Por ejemplo, `\(\mathbb{P}( Z \leq -1 \quad \text{or} \quad Z \geq 1 )\)` ``` r 2*pnorm(-1) ``` ``` ## [1] 0.3173105 ``` ] --- ##2) Probabilidad central .pull-left[ <!-- --> ] .pull-right[ `\begin{align} \mathbb{P}( -z \leq Z \leq z) &= \mathbb{P}( |Z| \leq z) \\ \\ &= \Phi(z) - \Phi(-z) \quad \text{ por simetría} \\ \\ &= 1 - 2 \times \Phi(-z) \end{align}` <br> <br> Por ejemplo, `\(\mathbb{P}(-1 \leq Z \leq 1)\)` ``` r 1 - 2*pnorm(-1) ``` ``` ## [1] 0.6826895 ``` ] --- ##3) Probabilidad central: σ y 2σ .pull-left[ <!-- --> ] .pull-right[ En una Normal Standard: - La probabilidad de encontrar .bold[valores a menos de 1σ] respecto de la media es aprox. 68\%. `\begin{align} \mathbb{P}( -1 \leq Z \leq 1) = 1 - 2 \times \Phi(-1) \end{align}` ``` r 1 - 2*pnorm(-1) ``` ``` ## [1] 0.6826895 ``` - La probabilidad de encontrar .bold[valores a menos de 2σ] respecto de la media es aprox. 96\%. `\begin{align} \mathbb{P}( -2 \leq Z \leq 2) = 1 - 2 \times \Phi(-2) \end{align}` ``` r 1 - 2*pnorm(-2) ``` ``` ## [1] 0.9544997 ``` ] --- class: inverse, center, middle #Quantiles de la Normal Standard --- ##Función de Quantiles de la Normal Standard .pull-left[ <!-- --> ] .pull-right[ En terminos generales, la .bold[función de quantiles] es la inversa de la función de densidad acumulada (CDF): - En una Normal Standard la CDF `\(\Phi(z)\)` entrega `\(p = \mathbb{P}(Z \leq z)\)`. - La inversa de la CDF, `\(\Phi^{-1}(p)\)` entrega el valor `\(z\)` tal que `\(\mathbb{P}(Z \leq z) = p\)`. - No hay fórmula analítica sencilla para `\(\Phi^{-1}(p)\)`, pero podemos calcularlo en `R`. .bold[Ejemplo:] ¿Bajo que valor de una Normal Standard se acumula el 90% de la probabilidad? ``` r qnorm(p=0.1); qnorm(p=0.9) ``` ``` ## [1] -1.281552 ``` ``` ## [1] 1.281552 ``` ] --- class: inverse, center, middle # De Normal Standard a # Normal con parámetros arbitrarios --- ### De Normal Standard a Normal con parámetros arbitrarios Si `$$Z = \frac{X-\mu}{\sigma}$$` entonces $$X = \mu + \sigma Z $$ <br> <br> <br> -- Si sabemos que `\(Z \sim \text{Normal}(0,1)\)`, ¿Cual es la distrubución de `\(X\)`? <br> -- `$$X \sim \text{Normal}(\mu,\sigma)$$` --- ### Función de probabilidad acumulada .pull-left[ `\(X \leq x \implies \frac{X-\mu}{\sigma} \leq \frac{x-\mu}{\sigma}\)` `\(X \leq x \implies Z \leq z\)` <br> Dado que `\(x = \mu + \sigma z \quad\)` entonces: `$$\mathbb{P}(X \leq x ) = \mathbb{P}(X \leq \mu + \sigma z ) = \mathbb{P}(Z \leq z)$$` <br> - Sabemos que `\(\mathbb{P}(Z \leq z) = \Phi(z)\)` .content-box-secondary[ .bolder[Por tanto:] `$$F_{X}(x) = F_{X}( \mu + \sigma z) = \Phi(z)$$` ] ] .pull-right[ <!-- --> ] --- ### Función de probabilidad acumulada .bold[Ejemplo:] - Si `\(X \sim \text{Normal}(\mu=5,\sigma=3)\)` - ¿Cuanta es la probabilidad de obtener un valor `\(X \leq 3.48\)`? -- .bold[Respuesta:] - Sabemos que: `\(F_{X}(x) = F_{X}( \mu + \sigma z) = \Phi(z)\)`, por tanto, `$$F_{X}(3.48) = \Phi\Big( (3.48 - 5)/3 \Big) = 0.306$$` -- .pull-left[ .bolder[En `R`]: ``` r z <- (3.48 - 5)/3 p <- pnorm(z); print(p) ``` ``` ## [1] 0.3061944 ``` ] -- .pull-right[ <br> .bolder[Chequeamos el resultado] ``` r pnorm(3.48, mean=5, sd=3) ``` ``` ## [1] 0.3061944 ``` ] --- ### Función de probabilidad acumulada inversa .pull-left[- Si `\(\Phi^{-1}(p)=z\)` y - `\(x = \mu + \sigma z\)` - `\(x = \mu + \sigma \Phi^{-1}(p)\)` <br> .content-box-secondary[ .bolder[Entonces:] `$$F^{-1}_{X}(p) = \mu + \sigma \Phi^{-1}(p)$$` ] ] .pull-right[ <!-- --> ] --- ### Función de probabilidad acumulada inversa .bold[Ejemplo:] - Si `\(X \sim \text{Normal}(\mu=5,\sigma=3)\)` - ¿Bajo que valor de `\(X\)` se acumula el 30% de la densidad probabilística? -- .bold[Respuesta:] - Sabemos que: `\(F^{-1}_{X}(p) = \mu + \sigma \Phi^{-1}(p)\)`, por tanto, `$$F^{-1}_{X}(0.3) = 5 + 3 \Phi^{-1}(0.3) = 3.43$$` -- .pull-left[ .bolder[En `R`]: ``` r z_30 <- qnorm(0.3); print(z_30) ``` ``` ## [1] -0.5244005 ``` ``` r x_30 <- 5 + 3*z_30; print(x_30 ) ``` ``` ## [1] 3.426798 ``` ] -- .pull-right[ <br> .bolder[Chequeamos el resultado] ``` r qnorm(p=0.3, mean=5, sd=3) ``` ``` ## [1] 3.426798 ``` ] --- ### Contrucción de Intervalos Si `\(X \sim \text{Normal}(\mu,\sigma)\)`, ¿Cuales son los valores `\(x_1\)` y `\(x_2\)` tales que `\(\mathbb{P}( x_1 \leq X \leq x_2) = p\)` ? .pull-left[ <!-- --> ] .pull-right[ .bold[Despejando por] `\(x_1\)`: `\begin{align} F_{X}(x_1) &= (1-p)/2 \quad \text{ aplicando función inversa (quantiles)} \\ x_1 &= F^{-1}_{X}\Big( (1-p)/2 \Big) \end{align}` Dado que `\(F^{-1}_{X}(q) = \mu + \sigma \Phi^{-1}(q)\)`, concluimos que `$$x_1 = F^{-1}_{X}\Big( (1-p)/2 \Big) = \mu + \sigma \Phi^{-1}\Big((1-p)/2\Big)$$` <br> .bold[En este caso]: ``` r z_5 <- qnorm( 0.1/2 ); print(z_5) ``` ``` ## [1] -1.644854 ``` ``` r x1 <- 5 + 3*z_5; print(x1) ``` ``` ## [1] 0.06543912 ``` ] --- ### Contrucción de Intervalos Si `\(X \sim \text{Normal}(\mu,\sigma)\)`, ¿Cuales son los valores `\(x_1\)` y `\(x_2\)` tales que `\(\mathbb{P}( x_1 \leq X \leq x_2) = p\)` ? .pull-left[ <!-- --> ] .pull-right[ .bold[Despejando por] `\(x_2\)`: `\begin{align} 1 - F_{X}(x_2) &= (1-p)/2 \\ 1 - (1-p)/2 &= F_{X}(x_2) \\ F^{-1}_{X}\Big( 1- (1-p)/2 \Big) &= x_2 \end{align}` Dado que `\(F^{-1}_{X}(q) = \mu + \sigma \Phi^{-1}(q)\)`, concluimos que `$$x_2 = F^{-1}_{X}\Big( 1- (1-p)/2 \Big) = \mu + \sigma \Phi^{-1}\Big( 1- (1-p)/2 \Big)$$` .bold[En este caso]: ``` r z_95 <- qnorm( 1 - 0.1/2 ); print(z) ``` ``` ## [1] -0.5066667 ``` ``` r x2 <- 5 + 3*z_95; print(x2) ``` ``` ## [1] 9.934561 ``` ] --- class: inverse, center, middle ##Hasta la próxima clase. Gracias! <br> Mauricio Bucca <br> https://mebucca.github.io/ <br> github.com/mebucca