domingo, julio 24, 2011

¿Hubo algún cambio en las últimas elecciones? (y III): Resultados y conclusiones

El objetivo de esta serie de posts es plantear de una manera científica la cuestión de si el 15m ha tenido algún efecto en las pasadas elecciones. Si observas cualquier fallo de planteamiento, metodología, o si crees directamente que soy un chalado prepotente, por favor, deja un comentario o envíame un tweet (@brenes). Me interesa cualquier feedback para ver si voy por buen camino.

Una vez presentados los datos y explicado lo que vamos a hacer con ellos para tratar de extraer conclusiones, voy a presentar los resultados obtenidos y a exponar mis conclusiones sobre ellos.

Resultados



Como ya se comentó, se implementaron unos scripts ruby para ejecutar de forma automatizada los algoritmos explicados en el post anterior. Estos scripts se pueden hallar en un repositorio de Github así que cualquiera puede revisar que no tienen errores.

En Google Fusion Tables he colgado los resultados sobre las elecciones de 2007 y los resultados sobre las elecciones de 2011.



Gráfico comparativo de las predicciones y los resultados del 2007




Gráfico comparativo de las predicciones y los resultados del 2011


Estas tablas y gráficos muestran las diferencias que en 2007 y 2011 se produjeron entre las predicciones realizadas por el CIS y los resultados finales de las elecciones. Como se puede ver hay errores bastante abultados y el comportamiento depende de la comunidad autónoma en la que nos estemos fijando, pero la tendencia general es un aumento del voto en blanco (recordemos que contamos la abstención dentro del voto en blanco).

En la tabla http://www.google.com/fusiontables/DataSource?snapid=S2295373w33 se muestran los errores de las encuestas realizadas por el CIS para cada grupo en las elecciones de 2007 y 2011. En estas tablas un error positivo implica que el grupo incluye a un mayor número de votantes de los que se había previsto en las encuestas, mientras que un error negativo implica que en las encuestas se preveía que un mayor número de votantes recayera en ese grupo.



Errores en las predicciones del CIS en las elecciones autonómicas del 2007




Errores en las predicciones del CIS en las elecciones autonómicas del 2011


En ambos gráficos se puede observar las diferentes tendencias de los errores en 2007 y 2011.

Por último, en la tabla http://www.google.com/fusiontables/DataSource?snapid=S2295394LU2 se ha cargado la variación en los errores de las predicciones entre el 2007 y el 2011. Una variación positiva implica que el error en 2011 es más positivo que en 2007, es decir, en el grupo acabaron más votantes de los que habría cabido esperar teniendo en cuenta las predicciones de 2011 y los errores que se habían cometido en 2007.



Variación de los errores del CIS entre 2007 y 2011


Por ejemplo, en Castilla-León el error para terceros partidos en fue de un 0,812%, lo que quiere decir que hubo casi un 1% de ciudadanos en este grupo más de los esperados por la encuesta. Si en 2011 hubieramos añadido a las predicciones ese 0,812% nos habríamos quedado cortos, ya que el error fue de un 1,158%.

Conclusiones



El último de los gráficos es el que se relaciona de manera más directa con la pregunta que planteamos en el primero de esta serie de posts: ¿ha variado el error cometido por las encuestas del CIS del 2011 de manera significativa con respecto a las encuestas del CIS del 2007?

Lo que nos muestra el gráfico es que en muchas de las comunidades autónomas el error ha aumentado para los grupos de PSOE y Otros, es decir, ha habido más votantes para esos grupos de los que hubiera cabido esperar teniendo en cuenta las encuestas del 2011 y los errores del 2007.

Por el contrario, el error para el PP y para el grupo de votos en blanco ha disminuido de manera notable.

La tendencia más marcada es, sin duda, el aumento del error en el PSOE en casi todas las comunidades (excepto Navarra). Hay estudios que marcan que determinados factores sociales puede forzar errores en las encuestas (como afirmar que se va a ir a votar cuando no es cierto, porque votar es socialmente correcto) que pueden provocar que votar al partido en el gobierno central durante una crisis como la que estamos viviendo no sea correcto.

Esta explicación parece coherente con el hecho de que ese error del PSOE no tiene relación con que fuera el partido gobernante en la comunidad autonómica. Sin embargo, para comprobar esta afirmación se deberían repetir estos estudios en otras elecciones realizadas en épocas de crisis comparables.

La tendencia de error hacia los terceros partidos se muestra positiva también, excepto en Cantabria, Extremadura y Murcia, donde la variación de error es negativa.

En Cantabria el tercer partido es el PRC, que hasta el 2011 ocupaba el gobierno (así que el tercer partido era el mayoritario). Ésto podría haber causado que los votantes de Cantabria incorporaran este partido al grupo contra el que el 15m se movilizaba (de hecho, una rápida búsqueda permite encontrar enlaces que hacen mención al PRC: http://www.dondado.es/2011/05/15m-demasiado-rapido-para-analizarlo/).

Sin embargo, esto choca con una de las regiones donde el error ha sido más positivo, Navarra. Allí, la responsabilidad de ese error recae sobre un aumento del voto para UPN, partido que se presentaba junto al PP hasta estas elecciones. Es posible que esa desvinculación del PP haya provocado un efecto positivo para UPN, aunque no tenemos pruebas para poder sostener esta hipótesis.

Otra región donde un tercer partido es importante es Canarias, donde Coalición Canaria es un partido con bastante poder. Este partido apareció vinculado también al movimiento 15m en algunas páginas (por ejemplo, la página que se enlaza en el párrafo sobre PRC) y es la región donde menos varió el error.

La variación se muestra especialmente relevante también en otras dos comunidades autónomas: Aragón y Asturias, con alrededor de un 13% positivo.

En Asturias la gran "sorpresa" fue Foro, el partido de Álvarez Cascos. En Aragón están el Partido Aragonés y la Chunta Aragonesista. En ambas regiones había terceros partidos con posibilidades reales de obtener escaños y restar poder a partidos mayoritarios.

En Baleares (donde la variación del error ronda el 10%), los votos a terceros partidos se concentran en coaliciones de distintas formaciones con tintes socialistas, lo que puede haber facilitado la migración de votos (hay que decir que es la única comunidad donde la variación de error para el PSOE es negativa).

Resumen



En cuanto a la pregunta que nos hacíamos "¿ha variado el error cometido por las encuestas del CIS del 2011 de manera significativa con respecto a las encuestas del CIS del 2007?" Parece que podemos decir que sí. Las variaciones de los errores son bastante significativos, superando el 5% e incluso el 10% en algunos casos.

La tendencia además está clara, menos abstención de votos y voto popular del esperable, más voto para PSOE y terceros partidos, aunque se presentan algunas excepciones.

¿Están estas variaciones del error asociadas al movimiento #15m? La verdad es que es dificil encontrar un enlace directo entre las peticiones del 15m y las variaciones observadas.

Es cierto que algunos estudios indican que los votantes son más participativos si ven posibilidades reales de que su opción vaya a obtener buenos resultados. Esto podría explicar casos como Asturias, Navarra o Aragón donde los terceros partidos tenían posibilidades reales de obtener resultados. Sin embargo, Cantabria (con el PRC en el poder) se muestra contrario a esa tendencia.

Otra dificultad para enlazar el #15m con estas variaciones es el hecho de que en la Comunidad de Madrid, donde las acampadas tuvieron mayor relevancia, se presenta muy poca variación. Sin embargo, si se observa el crecimiento de los terceros partidos, en Madrid obtenemos un buen crecimiento, solo que este ya se reflejaba en las predicciones del CIS. ¿Es posible que en Madrid, donde mayores cocnentraciones hubo, este cambio ya estuviera asumido por la sociedad y, por tanto, no se refleje en los errores del CIS? Quizás allí las acampadas fueron la consecuencia de ese cambio social hacia terceros partidos, pero influyeron a poca gente más después.

Por otra parte, parece necesario comparar estos resultados con más elecciones en el pasado, en especial con elecciones en donde se produjera una situación de crisis lo más cercana posible a la actual.

En un resumen muy corto, ha habido variación significativa en los errores del CIS, pero no puedo relacionarlo con el movimiento del #15m, aunque es algo bastante prometedor que requiriría más análisis.

Vendría bien, por ejemplo, saber el papel que otorga la gente a los terceros partidos ¿es realmente el PRC uno de los "malos"? ¿Se libra UPN por su separación del PP? ¿En Madrid el cambio ya estaba implantado antes de las acampadas? Interrogantes muy interesantes, pero que comienzan a escaparse de mis posibilidades.

Si quereis aportar comentarios, no dudeis en escribir.

sábado, julio 23, 2011

¿Hubo algún cambio en las últimas elecciones? (II): Metodología y datos

El objetivo de esta serie de posts es plantear de una manera científica la cuestión de si el 15m ha tenido algún efecto en las pasadas elecciones. Si observas cualquier fallo de planteamiento, metodología, o si crees directamente que soy un chalado prepotente, por favor, deja un comentario o envíame un tweet (@brenes). Me interesa cualquier feedback para ver si voy por buen camino.

En el anterior post comentaba la motivación para realizar un estudio estádístico y comprobar sie el #15m pudo tener algun efecto medible en las intenciones de voto del electorado de cara a las últimas elecciones autonómicas del pasado 22 de Mayo de 2011.

En este post comentaré las fuentes de datos que usé (y los problemas que encontré) para poder realizar los experimentos. A continuación describiré el experimento realizado.

Fuentes de datos



Encuestas electorales



Como ya comentamos en el anterior post, usaremos los datos de las encuestas electorales anteriores al #15m como grupo de control, atendiendo a que se trataba de un grupo de votantes que estaban influidos por todos los factores de la realidad de las elecciones (nuevos partidos políticos, crisis, corrupción, etc.).

Además, observaremos tanto las elecciones de 2011 como del 2007. Esto nos permitirá conocer el error habitual de las encuestas del CIS y no atribuir al #15m toda la magnitud del error, sobrevalorando su influencia.

La crítica que me han repetido más personas es la falta de datos. Tanto en lo referente a las fuentes de datos de encuestas preelectorales como al número de elecciones tenidas en cuenta.

En cuanto al número de fuentes de datos se me comentó que, aunque sean datos oficiales, el CIS puede no ser una buena fuente de datos única. La solución sugerida fue el uso de varias fuentes (por ejemplo, se me comentó Demoscopia) para intentar equilibrar el error entre todas las fuentes.

El uso de encuestas provenientes de medios privados, sin embargo, es algo que me parece bastante cuestionable debido a los diferentes intereses de partidos y grupos de comunicación. No es desconocida la manipulación de los datos de las encuestas para movilizar a los votantes en una u otra dirección.

El CIS no está libre de sospecha tampoco. Por ejemplo, Enric Morera, portavoz de la coalición Compromís en Valencia, pedirá la comparecencia del director del CIS en las Cortes. En este caso la denuncia se realiza por la gran diferencia entre las encuestas (que les situaban fuera del parlamento) y la realidad (donde consiguieron 6 escaños).

Lo que se está denunciando en este caso es la infravaloración de un tercer partido con objetivo de desmoralizar a los votantes (idea sobre la que volveremos más adelante). Sin embargo, es dificil asegurar si esta infravaloración fue realizada a propósito o si realmente se produjo un movimiento social importante tras dichas encuestas en favor de terceras opciones.

Otras denuncias hablan de la omisión de terceros partidos y candidatos en algunas de las respuestas de los estudios (es el caso de Cascos en Asturias o el Partido Andalucista). Sin embargo, estas denuncias no se refieren a la pregunta sobre itnención de voto, sino sobre la valoración de candidatos (donde no se pregunta por todos los candidatos).

En resumen:



  1. Las acusaciones realizadas por formaciones políticas acerca de manipulaciones de encuestas por parte del CIS obedecen a diferencias elevadas entre las predicciones y los resultados finales para los terceros partidos.


  2. Sin embargo, este estudio se basa precisamente en la existencia de esas desviaciones y su relación con el #15m, por lo que las acusaciones de manipulación necesitarían aparecer en elecciones previas o bien encontrar una justificación al hecho de que solo se haya realizado en estas elecciones.




Resultados electorales



A priori, encontrar datos sobre algo tan oficial como los resultados de las elecciones autonómicas de un país no debería resultar dificil. Sin embargo, he sido incapaz de encontrar una fuente oficial para estos datos. Lo más lejos que llegué fue a la página del Ministerio de Interior, pero el resultado de estas últimas elecciones aún no está publicado.

Por ello he usado otra fuente no oficial para obtener los resultados, la página de El País. Decantarme por la página de El País fue bastante sencillo, ya que ofrecían los datos en XML, listos para su consumo y sin necesidad de realizar operaciones sobre HTML (lo cual simplifica bastante el proceso). Además, los datos de las elecciones del 2007 seguían disponibles.

Si bien para los datos de encuestas preelectorales no me gustaba la idea de usar medios privados, los resultados electorales son lo suficientemente comprobables e inequívocos (no los puedes achacar a desviaciones estadísticas en las encuestas) como para poder confiar en que un medio como El País no publicaría los datos incorrectos y que, de hacerlo, las críticas que se recibiría por parte de otros medios o Internet serían notorias.

Procesando los datos



Una vez descargados los datos hay que plantearse qué transformaciones se le aplican para poder extraer conclusiones acerca de la intención de voto de los ciudadanos.

Lo ideal sería obtener un resultado que nos permitiéra apreciar los cambios de intención entre los distintos grupos tenidos en cuenta por el #15m: los "partidos mayoritarios", los "terceros partidos" y la abstención al voto.

En concreto, el movimiento #15m animaba a reducir el abstencionismo o el voto en blanco (en contra de lo que muchos medios publicaban) a favor de votar a terceros partidos y así reducir el poder de los partidos mayoritarios, por lo que el procesado de los datos debería mostrarnos si ha habido un trasvase de intención de votos desde la abstención y el voto a los partidos mayoritarios hacia los terceros partidos y si ese trasvase ha sido más importante que en las anteriores elecciones.

Para ello definiremos 4 grupos. Un grupo será para el PSOE, otro para el PP, otro para los terceros partidos y otro para el voto abstencionista.

La razón para dividir el grupo de los partidos mayoritarios en dos se tomó sencillamente para tratar de evitar que la migración de votos esperada del PSOE al PP nos impidiera observar los trasvases hacia esos partidos (por ejemplo, una huida de votos del grupo podría identificarse con una debacle electoral del PSOE).

No se incluye a CIU ni PNV (que sí se nombraban en el movimiento) debido a que el ámbito de sus elecciones era municipal, y no autonómico.

Al contrario que en el caso del PP y el PSOE; para los terceros partidos se decidió juntarlos a todos en un único grupo por dos razones: 1) el #15m no se centraba en ningún tercer partido en particular y 2) hay gran número de terceros partidos, algunos de ellos sin alcance municipal, y se dificultaría la visualización de los resultados al no poder observar adecuadamente el flujo de votos hacia los terceros partidos.

Por último, en estas elecciones hubo casos de escisión de partidos políticos (que yo sepa ocurrió en Asturias, donde Foro se escindió del PP, y Navarra, donde el PP se escindió de UPN). En un primer instante pensamos incorporarlos a la categoría del partido mayoritario (en Asturias agrupar a PP y Foro en el grupo PP), pero consideramos que si la razón de crear un nuevo partido es diferenciarse del partido anterior meterlos en el mismo grupo podría no reflejar la verdadera intención del votante.

En lo referente a los votos en blanco y las abstenciones, las trataremos como iguales ya que ambos indican que el votante no se ha inclinado por ninguna formación política.

A modo de ejemplo, consideremos el caso de Asturias durante las elecciones autonómicas del 2007. En las encuestas preelectorales, en la pregunta 8 "Y suponiendo que las elecciones a la Junta General del Principado de Asturias se celebrasen
mañana, ¿a qué partido o coalición votaría Ud.?" las respuestas son las que se muestran en la siguiente tabla:



Al agrupar los datos hay dos respuestas que no encajan en ningún grupo: "N.C." y "No sabe todavía". Estas respuestas son ignoradas ya que no nos permiten saber su intención de voto, si es que realmente tienen alguna. A continuación, se crean los grupos y se normalizan los datos (se ajustan proporcionalmente para que sumen el 100%).



Si hacemos lo mismo para los resultados de las elecciones tenemos la siguiente tabla:



Si ahora calculamos los errores, podemos apreciar el movimiento de votos:



Todo este proceso se ha implementado mediante una serie de scripts ruby que acceden a las páginas mencionadas y se descargan los datos. Hay que indicar que en el caso de las predicciones de las elecciones del 2011, en el momento de realizar el script, no estaban disponibles en formato HTML, por lo que se tuvo que convertir los PDFs a HTML para poder realizar todo el proceso.

En el próximo post se compartirán los resultados de estos scripts y este proceso y, a continuación, se discutirá si los resultados son lo suficientemente significativos como para inclinarse por la posibilidad de que se produjera un cambio significativo en el movimiento de los votos desde las predicciones del CIS hasta las elecciones.

domingo, julio 10, 2011

¿Hubo algún cambio en las últimas elecciones? (I): Introducción

El objetivo de esta serie de posts es plantear de una manera científica la cuestión de si el 15m ha tenido algún efecto en las pasadas elecciones. Si observas cualquier fallo de planteamiento, metodología, o si crees directamente que soy un chalado prepotente, por favor, deja un comentario o envíame un tweet (@brenes). Me interesa cualquier feedback para ver si voy por buen camino.

En estos últimos meses hemos tenido en este país lo más parecido a una revolución social pacífica que seguramente hayamos tenido nunca (lamento mis escasos conocimientos de historia, mi profesor comía mandarinas).

Todo el movimiento del #15m, el #nolesvotes y la #acampadasol ha sido una reaccción ante la situación que vive un país que se siente en manos de directores de grandes empresas y que ve cómo aquellos que han votado para que lleven a cabo un trabajo caen ante la presión de aquellos que mueven dinero.

Una de las características de esta revolución es que tenía una fecha de compromiso. El pasado 22 de Mayo se iba a ver si el movimiento de miles de personas conseguía remover la sociedad y cambiar las cosas. El 23 se vería si ese movimiento era algo o no.

Y el 23 ocurrió como ocurre en todas las elecciones, todo el mundo había ganado.

Si preguntabas a alguien con recelos hacia el 15m, PP y PSOE seguían siendo los partidos mayoritarios. Con un par de excepciones todo fué como se pensaba, el PP subió, el PSOE bajó, y el resto recogieron las migajas. Los ciudadanos volvieron a legitimar a los que están en el poder, las quejas de los indignados perdieron validez, evidentemente, dado que los ciudadanos habían dicho a los de siempre "mirad, confiamos en vosotros". ¿Había gente quejándose? Sí, pero solo esa minoría que está acampada.

Los entusiastas del 15m te dirían otra cosa. Es evidente que en una semana no se puede cambiar la mentalidad de una sociedad (quien pensase lo contrario debería hacerselo mirar). Tenemos que contar con que cada partido tiene sus forofos, que no van a cambiar de idea, que mucha gente votó a uno de los grandes para castigar al otro o evitar que acaparara poder y que incluso aquellos que pudieran estar convencidos podían no saber qué hacer o a quién votar (el tema del famoso voto útil). Pero es mucha la gente que ha abierto los ojos, que se ha vuelto más sensible y activa. Incluso el movimiento se ha trasladado a otros paises que han mostrado su apoyo.

Ambas versiones son muy razonables y se han repetido en decenas de formas a lo largo de televisiones, radios, periódicos, blogs y tweets. Sin embargo, ambas versiones adolecen de lo mismo: "Lo que se afirma sin prueba, sin prueba se niega" (al parecer esta frase proviene de los escolásticos, aunque a mi me la enseñó un dominico, lo que no deja de ser irónico).

Es evidente que la sociedad tiene una cierta inercia, por lo que la idea "nos han votado, así que vuestras quejas son artificiales y solo vuestras" no es correcta. Sí, os han votado, pero es probable que no todo el mundo haya interiorizado el mensaje aún, o que hayan pecado de prudentes y no se hayan atrevido a ejercer el voto de otra manera...

Y sí, es cierto que no podíamos esperar que la sociedad cambiase en una semana, pero eso no quiere decir que el movimiento no haya tenido que tener un cierto impacto que nos demuestre que la sociedad está despertando.

Es ese debate que no se base en visiones personales del mundo (porque, al final, el que esté a favor del 15m dirá que sí ha tenido impacto y el que no lo esté dirá que no) lo que más he hechado en falta. Y no me sorprende por parte del aparato de la prensa tradicional, en la que tengo bastante poca fé. Me sorprende y decepciona por parte del movimiento 15m, porque no se puede esperar cambios si hacemos lo mismo que hacen los de antes (creo que ésta era de Einstein).

Aquel que me conozca sabrá que soy una persona con una mentalidad bastante científica. En las cosas importantes me parece crucial tener una manera de comprobar si tus ideas son correctas y van por el buen camino o no. No digo que no haya que dar pasos poco justificados, porque de alguna manera hay que andar, pero sí creo importante comprobar de vez en cuando que vamos por el camino correcto.

Y creo que a todos les interesaría comprobarlo. En el caso de los partidos políticos, porque si realmente el 15m ha tenido un impacto, es algo a tener en cuenta. En el caso del 15m, porque si no se ha tenido un impacto apreciable es hora de cambiar de estrategia y ponerse las pilas (no digo que haya que abandonar).

Hace un tiempo, hablando con Dani Gayo, se nos ocurrió idear una manera de comprobar el impacto que ha tenido el 15m en las elecciones. Lo enfocamos, por supuesto, desde un punto de vista científico. No hablamos de opiniones, sentimientos... hablamos de datos, grupos de control y experimentos.

El método científico lo deja claro. Si tienes una hipótesis (en este caso "el 15m ha tenido un impacto en las elecciones") tienes que diseñar un experimento que te permita discernir si es correcta o no.

En nuestro caso, el experimento necesitaría dos versiones de las elecciones, en una de ellas votaría un grupo que estuviera influenciado por el 15m, mientras que en la otra votaría un grupo libre de la influencia del 15m. Ambos grupos deberían tener las mismas características y ser lo suficientemente amplios como para ser estadísticamente relevantes. Aun mejor sería sería tener un solo grupo y realizar dos votaciones, una con la influencia del 15m y otra sin ella.

Nótese que, cuando me refiero a "influencia", no quiero decir que el movimiento del 15m haya tenido un efecto concreto sobre la persona. El simil que se me ocurre es el del jurado de un juicio que no puede hablar con otras personas del juicio, ni leer prensa, para no verse contaminado. No es que por leer la prensa el miembro del jurado vaya a cambiar su decisión de manera consciente, es que al leer la prensa queda "manchado" y no se puede saber si su decisión habría sido la misma de no haber leido la prensa, aunque él jure que sí.

Así pues, el experimento ideal sería tener un grupo que no hubiera leido, oido o visto nada sobre el 15m y comparar su votación con uno que sí hubiera estado expuesto.

Sin embargo, un experimento de este tipo no es factible. No puedes aislar a un grupo de personas representativo y heterogéneo que no haya tenido conocimiento sobre el 15m ya que la cobertura mediática final fue bastante (hablo de cantidad, no calidad).

Incluso si se consiguiera un grupo así, tendríamos que confiar en toda esa gente cuando aseguran que no han tenido conocimiento alguno del 15m, ya que no hay muchas maneras de probar si es cierto o no.

Y entonces nos acordamos de las encuestas del CIS sobre intención de voto. Estas encuestas se realizaron el 17 de Marzo, casi dos meses antes de las acampadas, por lo que en ellas están reflejadas todos los temas que afectan a la sociedad española actual (paro, corrupción política...) excepto el movimiento de las acampadas.

Las encuestas del CIS se aceptan como provenientes de una fuente imparcial y fiable, con una representatividad suficiente para la población española como para ser tenidas en cuenta por los partidos. Por esto, los datos publicados por el CIS se convierten en un grupo, fiable y estadísticamente aceptable, al que se le pidió que eligiese un partido político sin estar influenciados por el movimiento de las acampadas (que estaba lejos de existir).

Ahora ya tenemos a nuestros dos grupos: los resultados del CIS (que ejercen de grupo de control) y los resultados de las elecciones generales.

Pero los resultados del CIS no son perfectos, por lo que ya van a tener un error achacable a otros factores (la gente puede ser reticente al partido en el poder, con la que está cayendo, votar a la derecha puede no ser aceptable en algunos círculos, puede que aún estés pensando tu voto y no estés del todo seguro...).

Para comprobar cual es el error aceptable de los resultados del CIS lo que haremos será repetir el experimento con los datos de las elecciones autonómicas de 2007.

La pregunta que intentaremos responder, entonces, es ¿ha variado el error cometido por las encuestas del CIS del 2011 de manera significativa con respecto a las encuestas del CIS del 2007?

Si la respuestas es afirmativa, podremos comenzar a argumentar que se ha añadido un factor (aparte de los factores habituales) entre la realización de las encuestas y las elecciones finales que ha movido no los resultados de las elecciones con respecto a las anteriores (hay entran en juego también los factores de crisis, corrupción, etc...), ni lo que se esperaba por las predicciones del CIS (ahí entran en juego también factores psicológicos y errores habituales de las encuestas), sino lo que habría sido normal teniendo en cuenta las encuestas del CIS y sus errores habituales.

Por ejemplo, si para 3 opciones de voto (A. B y C) tuvieramos los siguientes datos:

- Predicción del CIS de 2007: A=35% B=40% y C=25%.
- Elecciones de 2007: A=36%, B=41% y C=23%. Esto supone un MAE (Error Medio Absoluto) de 1,33% ((1+1+2)/3).
- Predicción del CIS de 2011: A=45% B=35% y C=20%.
- Elecciones de 2011: A=41%, B=36% y C=23%. Esto supone un MAE (Error Medio Absoluto) de 2,66% ((4+1+3)/3).

No podríamos unir la variación en un 5% del partido A (hacia arriba) y el B (hacia abajo) al 15m porque hay muchos otros factores sociales que podrían llevar a ese cambio de gobierno.

Tampoco podríamos unir ese 2,66% de error al movimiento 15m, porque las encuestas del CIS tienen errores.

Sin embargo, hay un incremento de 1,33% en el MAE de las encuestas del CIS, y la única diferencia entre el momento de realización de las encuestas y de sus respectivas elecciones es que en el caso del 2011 se produjo el movimiento de las acampadas.

Por supuesto, hay que tomar estos datos con cuidado. No debemos confundir la correlación con la causa/efecto. Que dos cosas, el 15m y un mayor error en las encuestas del CIS, ocurran simultáneamente no quiere decir que una sea la causa de la otra (XKCD tiene una maravillosa tira sobre ello).

Sin embargo, si la correlación es fuerte podrá darnos pie a comprobarlo en anteriores elecciones y quizás podamos convencernos de que, efectivamente, el movimiento ha servido para algo.

Esta serie de posts se estructuraran a la manera de un artículo científico. El presente post es la introducción, la motivación y el diseño del experimento. En el siguiente post se comentaran los datos utilizados para los experimentos, así como la metodología de los mismos. Por último, se presentarán los resultados (tablas de números) y se pasará a la discusión de los mismos (mis interpretaciones).

Intentaré preparar rápido las otras entradas, aunque viendo el tiempo que me ha requerido escribir ésta, no puedo prometer nada.