Diferencia de estimaciones en las encuestas y el CIS.

Diferencia de estimaciones en las encuestas y el CIS.

Política LA COCINA DEL CIS

Dónde y por qué ha intentado engañar nuevamente el CIS

Dada la polémica por segundo mes consecutivo sobre el dato anormalmente alto que el CIS da al PSOE, y la consiguiente desconfianza sobre el resto de datos y análisis, cabe responder a la pregunta de cuál hubiera sido el resultado del CIS si el análisis se hubiera hecho bajo correcciones y ajustes normales y habituales, asumidos por la comunidad científica. 

Anticipamos que, de aplicar el rigor y el método habitual, el PSOE tendría exactamente seis puntos menos (25% en vez de 31%), el PP  cuatro más (22% en vez de 18%), Ciudadanos uno más (22% en vez de 21%) y Podemos uno más (18% en vez de 17%). Los otros dos puntos se reparten al azar entre el resto, pero llaman la atención tres puntos más. Es incomprensible que el CIS no contemple el voto en blanco. Es imposible que ERC tenga un 4,3%, pues ello implicaría más de un 50% en toda Cataluña. Coalición Canaria es imposible que tenga un 0,1%: ello implicaría casi su desaparición. El análisis bien hecho da un 0,3%.

Estos evidentes errores se enmarcan dentro de los cambios que ha anunciado el CIS. De todos ellos destacamos tres: Aumentar la periodicidad del estudio, que pasa de trimestral a mensual; aumentar la muestra a unos 3.000 individuos; y utilizar un sistema de estimación de voto basado en una mera regla de tres, despreciando los análisis que se venían haciendo hasta ahora y que son los aceptados por toda la comunidad científica. 

Respecto de los dos primeros cambios, hay que decir que en sí mismos son buenos, aunque lo que muy probablemente persiguen no es sino aumentar la notoriedad de cada encuesta, en detrimento de los institutos más modestos, silenciando los datos del resto de medios a costa de llamar la atención y la expectativa sobre el esperado dato del CIS. Si además el dato es polémico, la notoriedad aún es mayor.  

'Sorpasso' de Ciudadanos a PP según el CIS

Respecto de la tercera innovación, el asunto es más grave. La estimación de voto, como cualquier otro tipo de prospectiva es un ejercicio matemático que exige de un rigor metodológico y analítico  preciso,  profesional y  científico. Por ejemplo, debe cumplir los requisitos de reproductibilidad y refutabilidad, es decir, debe explicarse cómo se ha hecho para que cualquier otro pueda llegar a las mismas o a otras conclusiones.

La innovación presentada no sólo no está explicada en términos científicos, sino que proporciona una prospectiva altamente errónea, fuera de toda lógica, casi insultante para la comunidad de investigadores sociales.

La intención directa de voto 

Es sabido que la pregunta bruta a partir de la cual se estima el voto, tiene una formulación similar a la siguiente: “Si mañana hubiera elecciones… ¿ a qué partido votaría?”. 

La pregunta puede variar sin que necesariamente cambie la fiabilidad, ya que no existe una pregunta perfecta y todas sus variaciones tienen siempre ventajas e inconvenientes, normalmente compensados entre sí.

De cualquier manera, todo el mundo acepta que las respuestas a esta pregunta, llamada “intención directa de voto” no puede usarse ni como estimación ni como pronóstico, porque conlleva ciertos niveles de incertidumbre, entre las cuales destacamos: Un elevado “no sabe / no contesta” (genéricamente llamados indecisos, aunque muchos de ellos no lo sean); una abstención declarada siempre bastante más baja que la real (históricamente, la abstención real suele ser el doble de la declarada en las encuestas); y un voto en blanco más elevado del real.

La necesidad de introducir correcciones

Para soslayar estos tres sesgos, todos, absolutamente todos los institutos con un cierto sentido del rigor (y el CIS hasta ahora), utilizamos unos coeficientes correctores, propios de cada instituto, que consisten en: 

1.- Reequilibrar la muestra (es decir, corregir pequeñas desviaciones para que la muestra represente lo mejor posible el universo de los electores en aquellos parámetros que haya sido difícil hacerlo).

2.- Medir las discrepancias en el recuerdo de voto (medir la diferencia entre lo que los encuestados dicen que votaron, y lo que realmente votaron, que es un dato conocido).

3.- Imputar indecisos a partidos concretos según diferentes hipótesis, como por ejemplo al partido que votaron en las anteriores, o según diferentes niveles de abstención.  

4.- Por último, corregir datos absurdos; por ejemplo, ERC no puede tener más de un 3,5% de voto, Bildu no puede estar por encima del PNV, Coalición Canaria no puede tener menos de un 0,2% o la suma de la izquierda no puede dar más del 47%.

Estas cuatro correcciones son la base de la denominada cocina o estimación de voto. No aplicar este método hace inútil cualquier pronóstico basado en análisis de encuesta, y aplicarlos con habilidad y siempre comparando el éxito o fracaso de anteriores coeficientes con la realidad, es lo que diferencia a los buenos de los malos institutos de investigación.

El caso concreto del recuerdo de voto

Corregir el voto directo sólo por recuerdo de voto suele dar resultados satifactorios, ya que absorbe el resto de correcciones. De hecho, es la forma más rápida y la que siempre suele utilizar el CIS.

A veces el CIS ha optado por imputar indecisos por simpatía política, pero no suele mejorar la estimación, ya que simpatizar por un partido no implica votarle. Es más, nos parece un absurdo añadir la “simpatía política” como variable de predicción. En cualquier caso, para hallar los coeficientes correctores según recuerdo de voto no hay más que comparar el recuerdo de voto de la encuesta con el que realmente ocurrió.

.

.

De lo que se observa comparando estos datos con los que realmente ocurrieron en junio de 2016, se aprecian diferencias máximas de 18 puntos en la abstención (normal) pero de más de +6 en el PSOE (anormal), y de casi -4 en el PP (anormal); es decir, una diferencia bastante grande proporcionalmente en estos dos últimos, lo que ya hace pronosticar que el voto al PSOE y al PP, de no corregirse adecuadamente, estarán desviados en esa misma proporción.

Resultado con los coeficientes correctores

Pues bien, si aplicamos correctamente estos coeficientes, éstos deberían haber dado lo expuesto en la columnas “dato correcto”. En cambio el CIS ha publicado la “directa”, es decir, la que sale sin aplicar ninguna corrección, ya que en este caso, el partido beneficiado era el PSOE con casi siete puntos más.

.

.

Si el CIS hubiera analizado los datos como se debe, hubiera coincidido con las últimas encuestas publicadas, que son las siguientes (fuente Electrograph):

.

.

Conclusiones y recomendaciones

A título personal, y sin exagerar, sobrerrepresentar al PSOE  en 7 puntos, y infravalorar al PP en 5, sin cálculo ninguno, es un fraude, y un intento de engaño grave, ya que a través de un instituto público, con fondos públicos y además muy caros, se trata de influir en el ánimo del electorado de una manera acientífica y chusca, aplicando una regla de tres a datos que exigen cálculos y correcciones mucho más complejas.

Hace mucho tiempo que defiendo que dado que las estimaciones de voto están en el ámbio de la prospectiva y, por lo tanto, del tanteo, el CIS debería publicar los datos brutos, sin estimaciones, y que cada medio o cada universidad, o cada experto saque sus futuribles. Ello sin entrar en las posibles responsabilidades del actual director del CIS.

*Gonzalo Adán es doctor en Psicología Social y director de Sociométrica.