Cómo detectar bots en Twitter y su uso por medios digitales

Cómo detectar bots en Twitter y su uso por medios digitales

Desde hace tiempo, sigo con suma atención el trabajo que vienen realizando desde TwitterBots. Se dedican a el análisis de las redes de bots, que se ponen en marcha para dar soporte a candidatos y partidos. Bueno, más que para dar soporte, para inflar los números de impacto, ya que aunque parezca mentira en muchos aspectos estamos todavía asentados en modo «a ver quién la tiene más gorda» (con perdón!). Pero lo que no se es si son conscientes que el impacto que tienen con este tipo de acciones es nulo. Imagino que lo único que les interesa, a quién diseña este tipo de acciones, es poder vender que el trabajo que está realizando da sus frutos. En definitiva, engañar a quién ha dado el OK.

Pero esto no sólo ocurre en política. En la promoción de contenidos de los medios digitales es una práctica habitual. Imagino que en este caso el objetivo es también inflar los números, con el objetivo de poder cobrar más por la publicidad insertada en la web.

Detección de Bots

Para detectar a estos usuarios (bots) podemos utilizar diferentes indicadores:

La diferencia entre número de usuarios únicos y volumen de tweets: A menor diferencia, más automatización, más bots. A mayor diferencia más impacto, más RT.

El siguiente gráfico muestra la evolución del volumen de tweets (línea azul), el volumen de usuarios únicos (línea roja), localizaciones desde las que se publica (línea naranja). En los tres picos señalados, el primero y el tercero casi no tienen diferencia en el volumen de tweets publicados y usuarios únicos. Mientras que el que se sitúa en el centro se puede apreciar una importante diferencia entre tweets y usuarios.

Diferencia usuarios únicos tweets totales

Por los patrones de publicación y distribución: Complementando el punto anterior, mediante los patrones de publicación y de distribución del contenido, podemos confirmar la hipótesis que a menor diferencia entre tweets y usuarios, mayor número de bots.

Tomando como base el gráfico anterior para ver la diferencia.

El siguiente gráfico muestra el contenido publicado en la primera punta mediante Twitterfeed. Cada punto representa un tweet. Los puntos que se sitúan en la misma fila indican tweets publicados por un mismo usuario, y los que se encuentran en la misma fila, son tweets publicados por diferentes usuarios en el mismo momento. Como se puede observar, hay diferentes ráfagas. La más grande, muestra la publicación del texto del tweet que se observa (pertenece al punto rojo) por parte de diferentes usuarios.

patrón de publicación bots

Sin embargo, si tomamos como referencia el segundo pico, podemos ver el impacto que han tenido algunos usuarios consiguiendo RT masivos. Los puntos verdes representan tweets que han sido RT, los azules los que han RT a alguien y las líneas azules es la representación del RT de uno a otro.

patrón RT masivo

Una pequeña aclaración en este punto. Un RT masivo también puede tener diferentes patrones. En el siguiente gráfico se puede observar un RT masivo generado por @sanchezcastejon y otro de @pablo_iglesias_ . En el caso del primero casi la totalidad de usuarios que han hecho RT se incorporan a la conversación posteriormente a su publicación, es decir, entran a publicar algo por el tema porque lo ha publicado @sanchezcastejon. En el caso de @pablo_iglesias_ la mayoría de los RT que recibe es por parte de usuarios que ya habían participado en la conversación.

De esta manera también podemos detectar a los «supporters» o perfiles, que aunque de gestión manual, suelen hacer RT casi siempre a determinados usuarios, en este caso por un tema de soporte político.

Diferencia patrones difusión

Por el cliente que genera la publicación: Es decir, si se utiliza Twitterfeed, Dlvr.it, IFTTT… son contenidos automatizados, utilizados por bots, sin embargo Twitter Web Client, Twitter for Android, for IOS… son publicados de manera manual.

Este tipo de análisis nos va a permitir medir la calidad de los diferentes temas asociados a un proyecto. El siguiente gráfico muestra la asociación entre los clientes que se han utilizado para publicar tweets sobre «Hospitalet» durante este último mes. Como se puede observar hay temas como #weathercloud, #empleo o #trabajo que están generados en un 100% por clientes que automatizan la publicación de contenidos.

Hospitalet - automatización temas

En el caso de los medios digitales, podemos comprobar la calidad de su impacto en Twitter utilizando la misma técnica. Para ello asociamos el tipo de cliente con el host de la url que han compartido. En este caso se puede apreciar que el 100% de los tweets que comparten el contenido de empleoya.es, y más del 50% de los impactos de 20minutos.es y abc.es están generados por TwitterFeed, es decir por bots.

Hospitalet - Bots - medios

Mediante el análisis de redes (ARS): Al visualizar el grafo de una conversación en Twitter, las redes de bots aparecen normalmente totalmente aisladas de la conversación principal. Es decir, conforman un grupo aislado debido a que se mencionan y RT entre ellos sin generar ningún impacto en el resto de usuarios, o sencillamente quedan como nodos sin ningún tipo de relación, por lo que ya ni aparecen en la visualización.

En el ejemplo de Hospitalet, al generar el grafo, quedan totalmente separados de la conversación principal los siguientes grupos. Entre ellos @empleoya_es y @20m, que como hemos visto se alimentan de TwitterFeed.

grafo bots

Bots y medios digitales

En el caso de Hospitalet que he utilizado, hemos visto un cierto grado de automatización en la difusión de contenidos de algunos medios digitales. Podríamos pensar que es algo aislado, pero si hacemos una comprobación similar para otros temas, por ejemplo el seguimiento de una empresa del IBEX.

Más del 50% del contenido difundido de los siguientes medios proviene de dlvr.it, twitterfeed e iftt: eleconomista.es, cincodias.com, abc.es y economista.com.mx.

Sin embargo hay medios como expansion.com que casi no reciben impactos de perfiles automatizados.

clientes host

Parece que inflar las audiencias empieza a ser una práctica habitual entre algunos medios digitales!

Más info

42 comentarios en «Cómo detectar bots en Twitter y su uso por medios digitales»

Los comentarios están cerrados