library(ggplot2)
library(dplyr)
<- data_frame(q = seq(from = 0, to = 1, by=0.01), L_francia = (q^3)*(1-q))
mydata
<- ggplot(data = mydata) +
plot geom_path(aes(x = q, y=L_francia, colour="Francia"), linewidth=1.5) +
labs(y="Likelihood", x="probabilidad marcar penal", title="Likelihood function de q", colour="") +
scale_color_manual(values = c("Francia" = "blue")) +
theme_bw()
print(plot)
SOL3070 Análisis de Datos Categóricos
Ponderación:
6% de la nota final del curso.
La final del Mundial 2006 – Italia vs. Francia – se definió por penales. La tabla a continuación resume la información de la ronda de penales. La columna X registra los resultados de cada lanzamiento, donde \(X_{i}=1\) indica que el jugador \(i\) convirtió el penal y \(X_{i}=0\) indica que el penal fue atajado o perdido.
Jugador | Equipo | X: Resultado |
---|---|---|
Pirlo | Italia | 1 |
Wiltord | Francia | 1 |
Materazzi | Italia | 1 |
Trezeguet | Francia | 0 |
De Rossi | Italia | 1 |
Abidal | Francia | 1 |
Del Piero | Italia | 1 |
Sagnol | Francia | 1 |
Grosso | Italia | 1 |
Asumiendo que el tiro de cada jugador no es afectado por los resultados en los tiros anteriores, es razonable sostener que el resultado de cada penal sigue una distribución Bernoulli. Formalmente: \(X_{i} \sim \text{Bernoulli}(p_{i})\), donde \(p_{i}\) es la probabilidad de que cada jugador marque su penal.
Preguntas:
- Expresa la función de probabilidad de cada variable aleatoria \(X_{i}\).
Solución
\[X_{i} \sim p_{i}^{x_{i}}(1-p_{i})^{1-x_{i}}\]
- Asumiendo que todos los jugadores de un mismo equipo tienen la misma probabilidad de marcar su penal (\(p\) para Italia y \(q\) para Francia), expresa la “Likelihood function” de \(p\) y \(q\).
Solución
Para Italia:
\[\mathcal{L}(p) = \mathbb{P}(x_{\text{Pirlo}}, x_{\text{Materazzi}}, x_{\text{De Rossi}}, x_{\text{Del Piero}}, x_{\text{Grosso}} \mid p) = p^{5}(1-p)^{0} = p^5\]
Para Francia:
\[\mathcal{L}(q) = \mathbb{P}(x_{\text{Wiltord}}, x_{\text{Trezeguet}}, x_{\text{Abidal}}, x_{\text{Sagnol}} \mid q) = q^{3}(1-q)^{1} = q^3(1-q)\]
- Grafica la función \(\mathcal{L}(q)\) ( \(q\) en el eje-x y \(\mathcal{L}(q)\) en el eje y).
Para hacerlo, debes reemplazar la variable L_francia
en el siguiente código por la expresión obtenida en la pregunta (2). Es decir, L_francia = (q-1^1)*(1-q)^2
sirven a modo de ejemplo.
Solución
- Estima visualmente cuál es el valor de \(q\) que maximiza \(\mathcal{L}(q)\). Explica el significado de éste número.
Solución
El valor de \(q\) que maximiza la “likelihood function” es \(q=0.75\). Es decir, estimamos que el escenario en que cada jugador francés tiene una probabilidad de \(0.75\) de convertir su penal es el más “plausible” dado los datos de los que disponemos.
- Supón la siguiente situación: Es sabido que \(P(\text{marcar penal} \mid \text{Francia}) = 0.75\). Un fanático nervioso se resiste a ver la transmisión del primer penal y tampoco sabe qué equipo empieza pateando. Pasados unos segundos, escucha gritos de celebración indicando que el penal fue convertido. El pobre tifoso recuerda que puede usar el Teorema de Bayes para conocer la probabilidad de que el penal haya sido marcado por un jugador francés — \(P(\text{Francia} \mid \text{marcar penal})\) — pero no recuerda cómo hacerlo. Realiza tú el cálculo requerido.
Solución
Primero, calculamos \(P(\text{marcar penal})\):
\[P(\text{marcar penal}) = P(\text{marcar penal} \mid \text{Italia}) \cdot P(\text{Italia}) + P(\text{marcar penal} \mid \text{Francia}) \cdot P(\text{Francia})\]
\[P(\text{marcar penal}) = 1 \cdot 0.5 + 0.75 \cdot 0.5 = 0.5 + 0.375 = 0.875\]
Ahora, aplicamos el Teorema de Bayes para calcular \(P(\text{Francia} \mid \text{marcar penal})\):
\[P(\text{Francia} \mid \text{marcar penal}) = \frac{P(\text{marcar penal} \mid \text{Francia}) \cdot P(\text{Francia})}{P(\text{marcar penal})}\]
\[P(\text{Francia} \mid \text{marcar penal}) = \frac{0.75 \cdot 0.5}{0.875}\]
\[P(\text{Francia} \mid \text{marcar penal}) = \frac{0.375}{0.875}\]
\[P(\text{Francia} \mid \text{marcar penal}) = \frac{375}{875} \approx 0.4286\]