SOL3070 Análisis de Datos Categóricos

Author

Tarea corta 2, respuestas

Ponderación:6% de la nota final del curso.

La final del Mundial 2006 – Italia vs. Francia – se definió por penales. La tabla a continuación resume la información de la ronda de penales. La columna X registra los resultados de cada lanzamiento, donde \(X_{i}=1\) indica que el jugador \(i\) convirtió el penal y \(X_{i}=0\) indica que el penal fue atajado o perdido.

Jugador	Equipo	X: Resultado
Pirlo	Italia	1
Wiltord	Francia	1
Materazzi	Italia	1
Trezeguet	Francia	0
De Rossi	Italia	1
Abidal	Francia	1
Del Piero	Italia	1
Sagnol	Francia	1
Grosso	Italia	1

Asumiendo que el tiro de cada jugador no es afectado por los resultados en los tiros anteriores, es razonable sostener que el resultado de cada penal sigue una distribución Bernoulli. Formalmente: \(X_{i} \sim \text{Bernoulli}(p_{i})\), donde \(p_{i}\) es la probabilidad de que cada jugador marque su penal.

Preguntas:

Expresa la función de probabilidad de cada variable aleatoria \(X_{i}\).

Solución

\[X_{i} \sim p_{i}^{x_{i}}(1-p_{i})^{1-x_{i}}\]

Asumiendo que todos los jugadores de un mismo equipo tienen la misma probabilidad de marcar su penal (\(p\) para Italia y \(q\) para Francia), expresa la “Likelihood function” de \(p\) y \(q\).

Solución

Para Italia:

\[\mathcal{L}(p) = \mathbb{P}(x_{\text{Pirlo}}, x_{\text{Materazzi}}, x_{\text{De Rossi}}, x_{\text{Del Piero}}, x_{\text{Grosso}} \mid p) = p^{5}(1-p)^{0} = p^5\]

Para Francia:

\[\mathcal{L}(q) = \mathbb{P}(x_{\text{Wiltord}}, x_{\text{Trezeguet}}, x_{\text{Abidal}}, x_{\text{Sagnol}} \mid q) = q^{3}(1-q)^{1} = q^3(1-q)\]

Grafica la función \(\mathcal{L}(q)\) ( \(q\) en el eje-x y \(\mathcal{L}(q)\) en el eje y).

Para hacerlo, debes reemplazar la variable L_francia en el siguiente código por la expresión obtenida en la pregunta (2). Es decir, L_francia = (q-1^1)*(1-q)^2 sirven a modo de ejemplo.

Solución

library(ggplot2)
library(dplyr)

mydata <- data_frame(q = seq(from = 0, to = 1, by=0.01), L_francia = (q^3)*(1-q))

plot <- ggplot(data = mydata) +
        geom_path(aes(x = q, y=L_francia, colour="Francia"), linewidth=1.5) +
        labs(y="Likelihood", x="probabilidad marcar penal", title="Likelihood function de q", colour="") +
        scale_color_manual(values = c("Francia" = "blue")) +
        theme_bw() 

print(plot)

Estima visualmente cuál es el valor de \(q\) que maximiza \(\mathcal{L}(q)\). Explica el significado de éste número.

Solución

El valor de \(q\) que maximiza la “likelihood function” es \(q=0.75\). Es decir, estimamos que el escenario en que cada jugador francés tiene una probabilidad de \(0.75\) de convertir su penal es el más “plausible” dado los datos de los que disponemos.

Supón la siguiente situación: Es sabido que \(P(\text{marcar penal} \mid \text{Francia}) = 0.75\). Un fanático nervioso se resiste a ver la transmisión del primer penal y tampoco sabe qué equipo empieza pateando. Pasados unos segundos, escucha gritos de celebración indicando que el penal fue convertido. El pobre tifoso recuerda que puede usar el Teorema de Bayes para conocer la probabilidad de que el penal haya sido marcado por un jugador francés — \(P(\text{Francia} \mid \text{marcar penal})\) — pero no recuerda cómo hacerlo. Realiza tú el cálculo requerido.

Solución

Primero, calculamos \(P(\text{marcar penal})\):

\[P(\text{marcar penal}) = P(\text{marcar penal} \mid \text{Italia}) \cdot P(\text{Italia}) + P(\text{marcar penal} \mid \text{Francia}) \cdot P(\text{Francia})\]

\[P(\text{marcar penal}) = 1 \cdot 0.5 + 0.75 \cdot 0.5 = 0.5 + 0.375 = 0.875\]

Ahora, aplicamos el Teorema de Bayes para calcular \(P(\text{Francia} \mid \text{marcar penal})\):

\[P(\text{Francia} \mid \text{marcar penal}) = \frac{P(\text{marcar penal} \mid \text{Francia}) \cdot P(\text{Francia})}{P(\text{marcar penal})}\]

\[P(\text{Francia} \mid \text{marcar penal}) = \frac{0.75 \cdot 0.5}{0.875}\]

\[P(\text{Francia} \mid \text{marcar penal}) = \frac{0.375}{0.875}\]

\[P(\text{Francia} \mid \text{marcar penal}) = \frac{375}{875} \approx 0.4286\]