Notebook: Estimación por Máxima likelihood (MLE)

Estimación mediante Máxima likelihood (MLE)

Anteriormente, lanzamos la misma moneda 100 veces y obtuvimos “Cara” (1) 82 veces.

Pregunta: ¿Qué valor de \(p\) es más plausible (“likely”) para haber generado estos datos?

Función de likelihood

Para responder a esta pregunta, debemos definir una función de likelihood, que mide cuán plausible es un valor particular de \(p\) dado los datos observados. La likelihood se define como:

\[\textit{L}(p \mid \text{Datos}) = p^{k}(1-p)^{n-k}\]

Donde: - \(k\) es el número de éxitos (caras) observados. - \(n\) es el número total de lanzamientos.

Función de Log-likelihood

La función de log-likelihood es simplemente el logaritmo natural de la función de likelihood:

\[ \ell(p \mid \text{Datos}) = \textit{L}og \textit{L}(p \mid \text{Datos}) = k \textit{L}og(p) + (n - k) \textit{L}og(1-p) \]

El uso de la log-likelihood es común porque facilita la derivación y optimización, dado que el logaritmo convierte productos en sumas, simplificando el cálculo.

Solución Numérica

Calcularemos la likelihood y la log-likelihood para algunos valores arbitrarios de \(p\) y luego encontraremos el valor de \(p\) que maximiza la log-likelihood.

# Función de likelihood
likelihood <- function(p, n, k) {
  L = p^k * (1-p)^(n-k)
  return(L)
}

# Función de log-likelihood
ll <- function(p, n, k) {
  ell = k * log(p) + (n - k) * log(1-p)
  return(ell)
}

# Evaluar las funciones de likelihood y log-likelihood para algunos valores arbitrarios
likelihood(p=0.1, n=100, k=82)

## [1] 1.500946e-83

ll(p=0.1, n=100, k=82)

## [1] -190.7085

likelihood(p=0.7, n=100, k=82)

## [1] 7.695235e-23

ll(p=0.7, n=100, k=82)

## [1] -50.91886

En este paso definimos las funciones de likelihood y log-likelihoo. La likelihood nos da una medida directa de la plausibilidad de \(p\), mientras que la log-likelihood nos da una versión transformada de esta medida que es más fácil de trabajar matemáticamente.

Evaluación de la Log-likelihood en un Rango de Valores de \(p\)

Ahora evaluaremos la función de log-likelihood en un rango de valores de \(p\) para encontrar el valor de \(p\) que maximiza la log-likelihood. Este valor es nuestro estimador de máxima likelihood (MLE) para \(p\).

# Evaluar la función de log-likelihood para un rango de valores de p
espacio_parametros <- tibble(p=seq(0,1,by=0.01)) %>%
  mutate(loglik = ll(p, n=100, k=82))

espacio_parametros

# Encontrar el valor de p que maximiza la función de log-likelihood
p_optimo <- espacio_parametros[which.max(espacio_parametros$loglik),]
p_optimo

Aquí calculamos la log-likelihood para una serie de valores posibles de \(p\) (desde 0 hasta 1) e identificamos el valor de \(p\) que maximiza la log-likelihood. Este valor es el que mejor explica los datos observados bajo el modelo de Bernoulli que hemos supuesto.

¡Notar que dice “más plausibles”, no “más probables”!↩︎

Notebook: Estimación por Máxima likelihood (MLE)

Estimación

Explicación:

Estimación mediante Máxima likelihood (MLE)

Función de likelihood

Función de Log-likelihood

Solución Numérica

Evaluación de la Log-likelihood en un Rango de Valores de \(p\)

Visualización de la Optimización Numérica