{"id":577,"date":"2014-01-31T21:59:31","date_gmt":"2014-01-31T20:59:31","guid":{"rendered":"http:\/\/www.rafafont.eu\/blog\/?p=577"},"modified":"2014-02-01T15:13:13","modified_gmt":"2014-02-01T14:13:13","slug":"puede-la-actividad-de-twitter-de-las-candidatas-predecir-los-resultados-de-las-primariasequo","status":"publish","type":"post","link":"https:\/\/www.rafafont.eu\/blog\/puede-la-actividad-de-twitter-de-las-candidatas-predecir-los-resultados-de-las-primariasequo\/","title":{"rendered":"\u00bfPuede la actividad de Twitter de las candidatas predecir los resultados de las #primariasEQUO?"},"content":{"rendered":"<p>Durante las \u00faltimas 8 semanas he recogido datos sobre la actividad en Twitter de las personas candidatas a las #primariasEQUO. Me pregunto si ser\u00eda posible predecir con ellos el resultado de la primera vuelta, cuya votaci\u00f3n se cierra en un par de horas.<\/p>\n<p>He utilizado la herramienta <a href=\"http:\/\/www.tweetbinder.com\/\">TweetBinder<\/a> para recoger los datos. TweetBinder analiza los tweets de los \u00faltimos 7 d\u00edas, y por tanto he realizado 8 mediciones semanales de los siguientes datos:<\/p>\n<ul>\n<li>el n\u00famero total de veces que se menciona el nombre de una candidata<\/li>\n<li>el n\u00famero de personas que contribuyen a esas menciones<\/li>\n<li>el n\u00famero medio de tweets relacionados que publica cada persona contribuyente (una forma de medir la interacci\u00f3n)<\/li>\n<li>el n\u00famero de retweets de estas menciones<\/li>\n<\/ul>\n<p>Todos los datos recogidos est\u00e1n disponibles en este GoogleDoc para quien quiera verlos y jugar con ellos: &#8220;<a href=\"https:\/\/docs.google.com\/spreadsheet\/ccc?key=0AjOi8DpgRnxEdDJlS0p3RFF0M0ptcDBZUThldmJ3dEE&amp;usp=sharing\">Impacto en Twitter de candidaturas #primariasEQUO<\/a>&#8220;.<\/p>\n<p><strong>Limitaciones<\/strong><\/p>\n<p>Este peque\u00f1o estudio tiene muchas limitaciones que es necesario tener en cuenta.<\/p>\n<p>En principio mi tesis es que el impacto real de una candidatura va a tener su reflejo en Twitter, y que las interacciones en esta red aproximan bien el inter\u00e9s real por los candidatos. Quiero estudiar la correlaci\u00f3n entre los resultados en las primarias y la interacci\u00f3n en Twitter, pero no tengo nada claro si es posible derivar alg\u00fan tipo de causalidad. \u00bfTwitter influye en el voto real, o viceversa, o ambos? Esa pregunta se me queda grande. Estoy abierto a todo tipo de cr\u00edticas sean metodol\u00f3gicas, epistemol\u00f3gicas, o de cualquier otro tipo.<\/p>\n<p>Eleg\u00ed Twitter por la relativa sencillez de uso de TweetBinder. Me hubiese gustado tambi\u00e9n analizar Facebook, pero no encontr\u00e9 ninguna herramienta similar. Ambas redes tienen idiosincrasias diferentes, no se hace el mismo uso de ellas. Por tanto, no puedo decir nada sobre el impacto de &#8220;las redes sociales&#8221; en las #primariasEQUO, sino \u00fanicamente sobre Twitter. De hecho, centrarse \u00fanicamente en Twitter puede hacer que se minusvalore el impacto de Facebook.<\/p>\n<p>Los datos han sido recogidos de forma &#8220;casi semanal&#8221;, cada domingo. Hay dos excepciones, en la semana 3 que los recog\u00ed un lunes, y en la semana 8 que los recojo un viernes porque es cuando se acaban las votaciones. Dado que Tweetbinder recoge los datos de los \u00faltimos 7 d\u00edas (sin poder seleccionar, que yo sepa, \u00fanicamente los \u00faltimos 5 d\u00edas), el resultado de no recoger datos a la misma hora el mismo d\u00eda supone que habr\u00e1 datos que se pierdan (por ejemplo la actividad del 23 de diciembre no est\u00e1) y otros que se dupliquen (por ejemplo los d\u00edas 25 y 26 de enero se cuentan tanto en la semana 7 como en la 8). Con las horas de recogida para algo similar: a veces recuento a las 12, otras a las 23, y unos datos se pierden y otros se duplican.<\/p>\n<p>He ido introduciendo los datos seg\u00fan iba conociendo cuentas de los candidatos en Twitter. Por eso algunos s\u00f3lo aparecen desde la mitad del estudio, y otros incluso s\u00f3lo la \u00faltima semana.<\/p>\n<p>Twitter es una herramienta abierta al p\u00fablico, pero quienes van a votar en las primarias son un grupo limitado de personas (afiliadas, simpatizantes y votantes registradas ex-profeso). Son dos grupos diferentes, y no se puede saber si una interacci\u00f3n en Twitter proviene de una persona que va a votar, o no. Por tanto, una de las principales asunciones de este estudio es que quien genera la interacci\u00f3n con los candidatos es quien tiene un inter\u00e9s por ellos y por votarles, es decir, gente supuestamente registrada como votante.<\/p>\n<p>Otra asunci\u00f3n impl\u00edcita es que todas las interacciones son positivas. Podr\u00edan tambi\u00e9n ser menciones cr\u00edticas, pero no tengo forma de saberlo. Por eso se asume cierto efecto &#8220;popularidad&#8221;, y que quien levante m\u00e1s inter\u00e9s ser\u00e1 quien mejores resultados obtenga (que hablen de mi aunque sea mal).<\/p>\n<p>Por \u00faltimo, los candidatos que no usan Twitter no est\u00e1n incluidos en este estudio. No puedo decir con ello que vayan a obtener buenos o malos resultados, s\u00f3lo que los datos no pueden decir nada sobre ellos.<\/p>\n<p><strong>\u00bfEn qu\u00e9 basar una predicci\u00f3n?<\/strong><\/p>\n<p>Un primer indicador podr\u00eda ser el n\u00famero de seguidores. Los candidatos parten de situaciones muy diferentes, desde <a href=\"https:\/\/twitter.com\/Reyesmontiel\">Reyes Montiel<\/a>, que arrancaba la campa\u00f1a con 6.500 seguidores, hasta varios otros que no ten\u00edan cuenta de Twitter y empezaron de cero durante la campa\u00f1a, como por ejemplo <a href=\"https:\/\/twitter.com\/mateoquiros66\">Mateo Quir\u00f3s<\/a>, que ha llegado hasta 261. Ambos han &#8220;ganado&#8221; un n\u00famero de seguidores similar durante la campa\u00f1a.<\/p>\n<p>De los 4 indicadores que saco de TweetBinder, descartar\u00eda el de &#8220;media de tweets por contribuyente&#8221;. Mide cuantos tweets de media ha publicado un contribuyente en particular en los que se mencione al candidato. Es un buen indicador para saber cual es la calidad de la interacci\u00f3n, y si el candidato est\u00e1 hablando solo o logra involucrar a la gente en los debates. Aunque puede ser muy \u00fatil para que un candidato ajuste su campa\u00f1a, creo que no son tan indicativos respecto a los posibles votos. Por ejemplo, en la semana 1 <a href=\"https:\/\/twitter.com\/Guantini\">Rafael Conde<\/a> tuvo un gran n\u00famero de menciones (927) pero una interacci\u00f3n baja (1.14). La explicaci\u00f3n es que consigui\u00f3 que un tweet suyo fuese muy retwiteado, pero sin entrar en debate. Un ejemplo diferente ser\u00eda <a href=\"https:\/\/twitter.com\/lapoliticayyo\">Carolina L\u00f3pez<\/a>, que en las semanas 5 y 6 tiene tambi\u00e9n muchas menciones (por encima de 900) pero una interacci\u00f3n muy alta (mayor de 9). En este caso se trata de discusiones muy animadas con mucha gente contestando muchas veces. Ambos casos pueden generar potenciales votantes, pero no tengo nada claro c\u00f3mo medirlo.<\/p>\n<p>Dado que el n\u00famero de RTs va incluido en el n\u00famero total de interacciones, me quedo finalmente con 3 indicadores: <strong>el n\u00famero de seguidores,<\/strong><strong>el n\u00famero total de interacciones, y el n\u00famero de contribuyentes.<\/strong><\/p>\n<p>Otro aspecto a considerar ser\u00eda en qu\u00e9 marco temporal se hace la predicci\u00f3n. Los datos acumulan 8 semanas, pero las votaciones s\u00f3lo se han realizado durante los \u00faltimos 9 d\u00edas. Si la gente va decidiendo su voto con antelaci\u00f3n, entonces ser\u00e1 m\u00e1s relevante un marco temporal amplio. Eso repercutir\u00e1 en un mejor resultado de quienes tienen el terreno m\u00e1s trabajado, como por ejemplo <a href=\"https:\/\/twitter.com\/idelreves\">In\u00e9s L\u00f3pez-D\u00f3riga<\/a> que tiene un impacto muy regular a lo largo de todo el estudio. Si el voto se decide en los \u00faltimos d\u00edas, ser\u00e1 m\u00e1s relevante saber c\u00f3mo de frescos llegan los candidatos a la recta final. Por ejemplo, <a href=\"https:\/\/twitter.com\/HontanaresEQUO\">Hontanares Arranz<\/a> s\u00f3lo comienza a twittear a mitad del estudio, pero en la \u00faltima semana ha tenido bastante impacto, escala puestos y se mete en el ajo.<\/p>\n<p>Como ninguna opci\u00f3n parece dar la respuesta por s\u00ed misma, probablemente haya que hacer una mezcla entre todas. Los pesos relativos de cada apartado s\u00f3lo los podremos saber una vez calibrada la balanza, es decir, despu\u00e9s de tener los resultados.<\/p>\n<p><strong>Los resultados de las primarias del PVE son coherentes con el impacto en Twitter<\/strong><\/p>\n<p>Despu\u00e9s de tantas limitaciones y problemas, aqu\u00ed va un ejemplo de que este sistema podr\u00eda funcionar. Justo tras conocerse los resultados de las primarias del PVE recog\u00ed los datos de los cuatro candidatos en Twitter. Fueron votados en este orden: <a href=\"https:\/\/twitter.com\/Skakeller\">Ska Keller<\/a>, <a href=\"https:\/\/twitter.com\/josebove\">Jos\u00e9 Bov\u00e9<\/a>\u00a0, <a href=\"https:\/\/twitter.com\/RebHarms\">Rebecca Harms<\/a> y <a href=\"https:\/\/twitter.com\/Monicafrassoni\">M\u00f3nica Frassoni<\/a>.<\/p>\n<p><span style=\"line-height: 1.714285714; font-size: 1rem;\"><strong>Ska Keller<\/strong><\/span><\/p>\n<ul>\n<li>Votos: 11.791.<\/li>\n<li>Impacto en Twitter: 1.316 menciones, 719 contribuyentes, 1,83 tweets\/contribuyente, 787 RTs<\/li>\n<\/ul>\n<p><strong>Jos\u00e9 Bov\u00e9\u00a0<\/strong><\/p>\n<ul>\n<li>Votos:\u00a011.726<\/li>\n<li>Impacto en Twitter: 1.252 menciones, 799 contribuyentes, 1,56 tweets\/contribuyente, 803 RTs<\/li>\n<\/ul>\n<p><strong> Rebecca Harms<\/strong><\/p>\n<ul>\n<li>Votos: 8.170<\/li>\n<li>Impacto en Twitter: 953 menciones, 591 contribuyentes, 1,61 tweets\/contribuyente, 642 RTs<\/li>\n<\/ul>\n<p><strong> Monica Frassoni<\/strong><\/p>\n<ul>\n<li>Votos: 5.851, 573, 359, 1.59, 375<\/li>\n<li>Impacto en Twitter: 573 menciones, 359 contribuyentes, 1,59 tweets\/contribuyente, 375 RTs<\/li>\n<\/ul>\n<p>En este caso se trata de interacciones \u00fanicamente durante la \u00faltima semana (no tengo m\u00e1s datos). Resultan bastante aproximadas al resultado real, con el n\u00famero de menciones imitando al resultado real, el de RT y contribuyentes un poco menos, y los tweets por persona indicando cosas diferentes, como hab\u00edamos visto antes. Hay que tener la precauci\u00f3n de que esto es un \u00fanico dato y podr\u00eda ser casualidad, pero parece prometedor.<\/p>\n<p><strong>Predicciones para las #primariasEQUO<\/strong><\/p>\n<p>Con todo lo anterior, intentar\u00e9 basar una predicci\u00f3n para el resultado de la primera vuelta de las primarias en los datos recogidos sobre n\u00famero de menciones, n\u00famero de personas que contribuyen y n\u00famero de seguidores, tanto para las \u00faltimas 2 semanas (durante las cuales se celebra la votaci\u00f3n), como para el global del estudio.<\/p>\n<p><a href=\"https:\/\/www.rafafont.eu\/blog\/wp-content\/uploads\/2014\/01\/ranking.png\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-578\" alt=\"ranking\" src=\"https:\/\/www.rafafont.eu\/blog\/wp-content\/uploads\/2014\/01\/ranking.png\" width=\"971\" height=\"273\" srcset=\"https:\/\/www.rafafont.eu\/blog\/wp-content\/uploads\/2014\/01\/ranking.png 971w, https:\/\/www.rafafont.eu\/blog\/wp-content\/uploads\/2014\/01\/ranking-300x84.png 300w, https:\/\/www.rafafont.eu\/blog\/wp-content\/uploads\/2014\/01\/ranking-624x175.png 624w\" sizes=\"(max-width: 971px) 100vw, 971px\" \/><\/a><\/p>\n<p>&nbsp;<\/p>\n<p>Todos los datos en: &#8220;<a href=\"https:\/\/docs.google.com\/spreadsheet\/ccc?key=0AjOi8DpgRnxEdDJlS0p3RFF0M0ptcDBZUThldmJ3dEE&amp;usp=sharing\">Impacto en Twitter de candidaturas #primariasEQUO<\/a>&#8220;.<\/p>\n<p>Ah\u00ed va por tanto una posible conclusi\u00f3n en funci\u00f3n de los datos. De los dos hombres que pasar\u00e1n a la segunda fase, hay dos que est\u00e1n arriba en todos los rankings, <a href=\"https:\/\/twitter.com\/fmarcellesi\">Florent Marcellesi<\/a>, y<a href=\"https:\/\/twitter.com\/joan_gp\"> Joan Groizard<\/a>, y uno que ha ido creciendo durante la campa\u00f1a, <a href=\"https:\/\/twitter.com\/willrodrob\">Guillermo Rodr\u00edguez<\/a>.\u00a0De las dos mujeres una ser\u00eda con bastante seguridad <a href=\"https:\/\/twitter.com\/reyesmontiel\">Reyes Montiel<\/a>, y el cuarto lugar ser\u00eda o bien para <a href=\"https:\/\/twitter.com\/idelreves\">In\u00e9s L\u00f3pez-D\u00f3riga<\/a> o para <a href=\"https:\/\/twitter.com\/moniequo\">M\u00f3nica Monteagudo<\/a>.<\/p>\n<p>\u00bfTendr\u00e1 sentido todo esto que he dicho? Lo veremos ma\u00f1ana. Buenas noches, y buena suerte.<\/p>\n<p><strong>Actualizaci\u00f3n 01\/02\/14:<\/strong> \u00a1Bingo! Florent, Guillermo, Reyes e In\u00e9s pasan a segunda vuelta. Por la parte de encima de la lista parece que hay bastante correlaci\u00f3n entre actividad en Twitter y resultados, mientras que por la parte de abajo, no tanta. Mientras me aclaro con los an\u00e1lisis que hay que hacer, aqu\u00ed queda disponible <a href=\"https:\/\/docs.google.com\/spreadsheet\/ccc?key=0AjOi8DpgRnxEdDJlS0p3RFF0M0ptcDBZUThldmJ3dEE&amp;usp=drive_web#gid=11\">el documento con los datos de la votaci\u00f3n incorporados<\/a> por si alguien quiere analizarlos estad\u00edsticamente.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Durante las \u00faltimas 8 semanas he recogido datos sobre la actividad en Twitter de las personas candidatas a las #primariasEQUO. Me pregunto si ser\u00eda posible predecir con ellos el resultado de la primera vuelta, cuya votaci\u00f3n se cierra en un par de horas. He utilizado la herramienta TweetBinder para recoger los datos. TweetBinder analiza los [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_s2mail":"yes","jetpack_publicize_message":"","jetpack_is_tweetstorm":false,"jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","enabled":false}}},"categories":[353,4],"tags":[362,365,363,364],"jetpack_publicize_connections":[],"_links":{"self":[{"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/posts\/577"}],"collection":[{"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/comments?post=577"}],"version-history":[{"count":4,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/posts\/577\/revisions"}],"predecessor-version":[{"id":583,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/posts\/577\/revisions\/583"}],"wp:attachment":[{"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/media?parent=577"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/categories?post=577"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.rafafont.eu\/blog\/wp-json\/wp\/v2\/tags?post=577"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}