Intervalos de Confianza

Teoría

Un intervalo de confianza (IC) para un parámetro poblacional \(\theta\) es un rango aleatorio que, con cierta probabilidad, contiene al valor verdadero del parámetro.

1. Definición general

Si construimos el intervalo a partir de una muestra de tamaño \(n\), se cumple:

\[ P\!\left( L(X_1, \dots, X_n) \;\leq\; \theta \;\leq\; U(X_1, \dots, X_n) \right) = 1 - \alpha, \]

donde:
- \(L\) es el límite inferior del intervalo,
- \(U\) es el límite superior del intervalo,
- \(1 - \alpha\) es el nivel de confianza (típicamente 0.90, 0.95 o 0.99).

2. Caso de la media poblacional

Supongamos que queremos construir un IC para la media poblacional \(\mu\), cuando la varianza poblacional \(\sigma^2\) es conocida.

Recordemos que, por el Teorema Central del Límite, el estadístico estandarizado:

\[ Z = \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} \]

sigue aproximadamente una distribución normal estándar \(N(0,1)\).

En la normal estándar sabemos que:

\[ P\!\left( -z_{1-\alpha/2} < Z < z_{1-\alpha/2} \right) = 1 - \alpha, \]

donde \(z_{1-\alpha/2}\) es el cuantil correspondiente (por ejemplo, 1.96 para \(\alpha = 0.05\)).

Sustituyendo la definición de \(Z\), tenemos:

\[ P\!\left( -z_{1-\alpha/2} < \frac{\overline{X} - \mu}{\sigma/\sqrt{n}} < z_{1-\alpha/2} \right) = 1 - \alpha. \]

Multiplicamos todo por \(\sigma/\sqrt{n}\):

\[ P\!\left( -z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} < \overline{X} - \mu < z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \right) = 1 - \alpha. \]

Aislando a \(\mu\), reordenamos la desigualdad para dejar a \(\mu\) en el centro:

\[ P\!\left( \overline{X} - z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} < \mu < \overline{X} + z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \right) = 1 - \alpha. \]

Esto nos da el intervalo de confianza al nivel \(1-\alpha\):

\[ IC = \left[ \; \overline{X} - z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}}, \quad \overline{X} + z_{1-\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \; \right]. \]

El valor verdadero de \(\mu\) es fijo y no tiene probabilidad de “estar dentro o fuera” del intervalo.
Lo que varía es el intervalo: cada vez que tomamos una muestra distinta, obtenemos un intervalo distinto.
Decir que un IC al 95% “tiene confianza del 95%” significa que, si repitiéramos el procedimiento muchas veces, aproximadamente el 95% de los intervalos construidos cubrirán el verdadero valor de \(\mu\).

Simulación

Para demostrar cómo funciona la cobertura de los intervalos de confianza, crearemos una simulación controlada:

Crearemos un poblacion en la cual la media verdadera es \(\mu = 25\) años (edad promedio de graduación en Chile).
A partir de esta población, tomaremos repetidamente muestras aleatorias de tamaño \(n\).
Con cada muestra construiremos un intervalo de confianza al nivel elegido \(1-\alpha\).
Finalmente, observaremos qué proporción de intervalos construidos efectivamente contiene a la media verdadera.

De este modo, la aplicación ilustra de manera empírica lo que garantiza la teoría: en el largo plazo, aproximadamente una fracción \(1-\alpha\) de los intervalos cubrirá a \(\mu\).

Conclusión

Cada intervalo es una estimación con incertidumbre de la media poblacional.
Algunos intervalos no incluyen a \(\mu = 25\) (se destacan en rojo).
La proporción de intervalos que cubren a \(\mu\) converge al nivel de confianza elegido.