Aprobación presidencial

¿Qué evaluación tienen los ciudadanos del trabajo de Andrés M. López Obrador como Presidente de la República? Oraculus da seguimiento y agrega los resultados de las principales encuestas públicas de aprobación presidencial.

Por: Javier Márquez | @JMarquezP


TP: Toma de posesión.
Las líneas indican estimaciones puntuales de la tendencia. Las áreas sombreadas representan regiones de alta densidad (95%) de la distribución posterior de los parámetros del modelo.

Oraculus actualiza el poll of polls cada vez que alguna de las principales encuestadoras difunde resultados sobre aprobación presidencial. Además de brindar información sobre los actuales niveles de aprobación, una nueva encuesta contribuye a mejorar las estimaciones de los meses más recientes; por lo tanto, la serie puede variar en cada actualización. La metodología se puede consultar aquí.

Modelo y programación web: Javier Márquez | @JMarquezP.
Datos: Eduardo Noriega y Pablo Reyes.

Encuestas

Principales series regulares

Archivo histórico

Metodología

Nuestro método de agregación de encuestas consiste en un modelo bayesiano multinomial de espacio de estados para series de tiempo. Sea \(p_{ij}\) un vector con las proporciones de respuestas de la encuesta \(i\) a cada categoría de la pregunta de aprobación presidencial \(j=\{Aprueba,\;Desaprueba,\;Otro\}\). Denotamos a \(n_{i}^{*}=\frac{n_{i}}{deff}\) el tamaño efectivo de muestra, donde \(deff=1.7\) es una aproximación conservadora del efecto de diseño. Entonces, \(y_{ij}=p_{ij}n_{i}^{*}\) es un vector de conteos que proviene de una distribución de probabilidad multinomial:

\(
y_{ij}\sim Multinomial\left(\pi_{ij},n_{i}^{*}\right)
\)

cuyo parámetro \(\pi_{ij}\) es la probabilidad de que un entrevistado manifieste su preferencia hacia cada una de las categorías de respuesta. Con el propósito de modelar la sobredispersión que se observa en los resultados de las encuestas, asumimos que \(\pi_{ij}\) proviene de una distribución Dirichlet:

\(
\pi\sim Dirichlet\left(\alpha,\eta_{ij}\right)
\)

con parámetro de dispersión \(\alpha\) y componente sistemático

\(
\eta_{ij}=\frac{exp\left(\theta_{t[i]j}+\delta_{k[i]j}\right)}{\sum_{j=1}^{J}exp\left(\theta_{t[i]j}+\delta_{k[i]j}\right)}
\),

fijando \(\eta_{i3}=0\) para identificación del modelo. Así, la probabilidad de aprobar/desaprobar el trabajo del presidente en la encuesta \(i\) depende (1) de la aprobación latente en la población \(\theta_{tj}\) en el periodo de tiempo \(t=1\ldots T\) en que se levantó la encuesta, (2) del «efecto de casa» \(\delta_{kj}\) de la empresa \(k=1\ldots K\) que la realizó, y (3) de errores no-muestrales de la industria que no son capturados por el efecto de diseño. El modelo de transición consiste en un nivel local:

\(
\begin{bmatrix}
\theta_{t[i],1}\\
\theta_{t[i],2}
\end{bmatrix}\sim N\left(
\begin{bmatrix}
\theta_{t-1,1}\\
\theta_{t-1,2}
\end{bmatrix},\sum\right)
\)

donde \(\sum\) es una matriz de varianza-covarianza.

El modelo fue programado en JAGS. Los parámetros fueron estimados con simulación bayesiana (MCMC) a través de un muestreo de Gibbs. Las distribuciones a priori son:

\(
\alpha=\exp\left(a\right),a\sim Unif\left(0,10\right)
\)
\(
\theta_{1,j}\sim N\left(\left[\begin{array}{c}
0\\
0
\end{array}\right],\left[\begin{array}{cc}
0 & 10\\
10 & 0
\end{array}\right]\right)
\)
\(
\sum^{-1}\sim Wishart\left(R,p=3\right),R=I\times0.5p
\)

Para agilizar la convergencia del muestreo de Gibbs se utilizó una reparameterización redundante de los efectos de casa:

\(
\delta_{k,j}\sim N\left(\left[\begin{array}{c}
0\\
0
\end{array}\right],\left[\begin{array}{cc}
0 & 10\\
10 & 0
\end{array}\right]\right)
\)

y transformados en:

\(
\delta_{kj}^{*}=\delta_{kj}-\frac{1}{K}\sum_{k=1}^{K}\delta_{kj}
\)

El cálculo de la media en la ecuación anterior es robusto, de modo que los efectos de casa más extremos fueron excluidos y pueden tomar cualquier valor. En cambio, la suma de los efectos de casa de las demás empresas suman cero. Las gráficas muestran la aprobación latente neta de efectos de casa, la cual se obtiene con la transformación logística inversa:

\(
\frac{exp\left(\theta_{tj}^{*}\right)}{\sum exp\left(\theta_{tj}^{*}\right)},\theta_{tJ}=0
\)