class: center, middle, inverse, title-slide .title[ # Probabilidad e Inferencia Estadística ] .subtitle[ ## #7: Estandarización (puntaje Z) ] .author[ ###
Mauricio Bucca
github.com/mebucca
mebucca@uc.cl
] --- class: fullscreen, center, middle ## Momentos <br> <br> <br> <br> <br> .center[ | Momento | Notación parámetro teórico/poblacional | Intuición | |-------------------|----------------------------------------|------------------------------| | **Valor Esperado**| `\(\mathbb{E}(X) = \mu\)` | Punto de equilibrio o centro | | **Varianza** | `\(\mathbb{Var}(X) = \sigma^2\)` | Dispersión en torno al centro| ] -- <br> .bold[Ejemplo:] `$$X \sim \text{Normal}(\mu,\sigma)$$` La variable aleatoria `\(X\)` sigue una distribución Normal con valor esperado `\(\mu\)` y desviación estándard `\(\sigma\)`. --- class: inverse, center, middle #Estandarización ##(puntaje Z) --- ## Puntaje Z <br> -- Sea `\(X\)` es una variable aleatorial, tal que: <br> - `\(\mathbb{E}(X) = \mu\)` - `\(\mathbb{Var}(X) = \sigma^2\)`. Equivalentemente, `\(\sqrt{\mathbb{Var}(X)} = \sigma\)` <br> -- El puntaje Z de dicha variable se define como: <br> `\begin{align} Z &= \frac{X - \mathbb{E}(X)}{\sqrt{\mathbb{Var}(X)}} \\ \\ &= \frac{X - \mu}{\sigma} \end{align}` --- ## Valor esperado de Z El valor esperado de una variable Z es 0: <br> $$ `\begin{aligned} \mathbb{E}(Z) &= \mathbb{E}\left(\frac{X - \mu}{\sigma}\right) \\ \\ &= \frac{1}{\sigma} \mathbb{E}(X - \mu) \\ \\ &= \frac{1}{\sigma} ( \mathbb{E}(X) - \mathbb{E}(\mu) ) \\ \\ &= \frac{\mu - \mu}{\sigma} = 0 \end{aligned}` $$ -- <br> .bold[Des-centrar una variable:] cada valor individual `\(x\)` se desplaza por la misma cantidad, `\(-\mu\)` . --- ## Varianza de Z La varianza (y desviación standard) de una variable Z es 1: <br> `\begin{aligned} \mathbb{Var}(Z) &= \mathbb{Var}\left(\frac{X - \mu}{\sigma}\right) \\ \\ &= \frac{1}{\sigma^2} \mathbb{Var}(X - \mu) \\ \\ &= \frac{1}{\sigma^2} ( \mathbb{Var}(X) - \mathbb{Var}(\mu) ) \\ \\ &= \frac{\sigma^2 - 0}{\sigma^2} = 1 \end{aligned}` -- <br> .bold[Re-escalamiento de una variable:] cada valor individual `\(x\)` se escala por `\(\frac{1}{\sigma}\)` --- ## Propiedades variable en pje. Z <br> .pull-left[ - .bold[Sin unidad:] Toda variable en puntaje Z tiene la misma media y la misma desviación estándar. Útil para comparar valores que provienen de distintas distribuciones ("estandarizar"). <br> - .bold[Preserva forma:] des-centramiento y re-escalamiento no cambia la forma de la distribución original. ] .pull-right[ <!-- --> ] --- class: inverse, center, middle #Ejemplo ##Altura en dos "poblaciones" --- ## Altura en dos "poblaciones" <br> <br> .center[  ] --- ## Altura en dos "poblaciones" .bold[Proceso "generador" de datos] Supongamo que acuerdo a determinantes genèticos, la altura de un hombre de Islas Faroe y la de una mujer de Filipinas pueden describirse respectivamente como una .bold[realización] de las siguientes variables aleatorias: .pull-left[ <br> - Hombre Islas Faroe `$$A_{HIF}\sim \text{Normal}(\mu = 179,\sigma = 5)$$` <br> - Mujer Filipinas `$$A_{MF}\sim \text{Normal}(\mu = 150,\sigma = 7)$$` ] .pull-right[ <!-- --> ] --- ## Altura en dos "poblaciones" ``` r mu_faroe=179; sigma_faroe=5 mu_filip=150; sigma_filip=7 hombres_faroe <- rnorm(n=53000, mean = mu_faroe, sd=sigma_faroe) mujeres_filip <- rnorm(n=113000000, mean = mu_filip, sd=sigma_filip) hombres_faroe_z <- (hombres_faroe - mu_faroe)/sigma_faroe mujeres_filip_z <- (mujeres_filip - mu_filip)/sigma_filip datos_faroe <- data_frame(altura = hombres_faroe, z=hombres_faroe_z) datos_filip <- data_frame(altura = mujeres_filip, z=mujeres_filip_z) ``` -- .pull-left[ ``` ## # A tibble: 6 × 2 ## altura z ## <dbl> <dbl> ## 1 167.8 -2.250 ## 2 177.2 -0.3679 ## 3 176.9 -0.4263 ## 4 179.3 0.06878 ## 5 178.9 -0.01515 ## 6 182.1 0.6255 ``` ] .pull-right[ ``` ## # A tibble: 6 × 2 ## altura z ## <dbl> <dbl> ## 1 149.6 -0.05615 ## 2 152.9 0.4188 ## 3 153.4 0.4920 ## 4 147.2 -0.4025 ## 5 150.5 0.06986 ## 6 129.9 -2.871 ``` ] --- ## Altura en dos "poblaciones" .pull-left[ .bold[Población simulada] | País | Género | Población | Altura Promedio (cms) | |:-----------:|:------:|:-------------:|:---------------------:| | Islas Feroe | H | ~53,000 | 179.02 | | Filipinas | M | ~113 millones | 150.00 | <br> .bold[Población existente] | País | Género | Población | Altura Promedio (cms) | |:-------------:|:----------:|:-------------:|:--------------------:| | Islas Feroe | H | ~53,000 | 179.00 | | Filipinas | M | ~113 millones | 150.00 | ] .pull-right[ <br><br> <br><br> <br><br> <br><br> <br><br> <br><br>  ] --- class: inverse, center, middle ##Hasta la próxima clase. Gracias! <br> Mauricio Bucca <br> https://mebucca.github.io/ <br> github.com/mebucca