Queridos seguidores y amigos, ya hemos empezado el segundo volumen de El Quijote. El tuit 8095 marcó el fin del primer libro, y el principio del segundo:
QUIJOTE 8095. salida de don Quijote. Forsi altro canterà con miglior plectio. Finis Segunda parte del ingenioso
— QuijoteEn17000Tuits (@elquijote1605) June 9, 2015
//platform.twitter.com/widgets.js Y el prólogo empieza en el tuit 8188, una vez pasados los prolegómenos legales, la fe de erratas y la aprobación y el privilegio:
QUIJOTE 8188. PRÓLOGO AL LECTOR ¡Válame Dios, y con cuánta gana debes de estar esperando ahora, lector ilustre, o quier plebeyo, este
— QuijoteEn17000Tuits (@elquijote1605) June 12, 2015
La dedicatoria, que en el primer volumen precede al prólogo, queda ahora en segundo lugar, urgente como le resulta a Cervantes defender su obra de los comentarios insultantes sobre él que el autor de una segunda parte de El Quijote había vertido en su libro.
Cervantes demuestra una meditada contención a la hora de referirse a Avellaneda, el autor del Quijote apócrifo. Por las palabras de Cervantes, parece que Avellaneda fue especialmente áspero y bravucón al referirse al autor del Quijote original, cosa que puedo entender perfectamente, ya que hoy día también se usa el trolleo para obtener relevancia social (y dónde más que en Twitter). En su papel de autor reputado y por tanto en otra dimensión de la discusión, mal que le pesase a su interlocutor, Cervantes prueba a ser un caballero y mantener trabada su ofendida dignidad de soldado, y de hecho lo consigue, al menos al principio: hay una queja doliente y digna sobre el reproche de ser viejo y manco. Me gusta mucho cómo se defiende de la acusación de vejez:
…como si hubiera sido en mi mano haber detenido el tiempo…
y más aún la defensa de su mano inútil, no viendo en ella más que un motivo de orgullo:
… como si mi manquedad hubiera nacido en alguna taberna, sino en la más alta ocasión que vieron los siglos pasados, los presentes, ni esperan ver los venideros.
A mí me resulta entrañable el viejo soldado y su fiero orgullo que defiende sus heridas junto con las miserias a las que como soldado se ha visto abocado en su vida militar, pero que en ningún momento le hacen perder su convicción acerca de la rectitud de su actitud ante la vida:
El soldado más bien parece muerto en la batalla que libre en la fuga
Y a continuación afea a Avellaneda, con suma contención, que le acuse de envidioso, y le recuerda que él admira a Lope de Vega, y que Lope de Vega también consideraba buenas sus novelas. Tras contenerse durante dos páginas, por fin Cervantes no puede aguantarse más y le reprocha a Avellaneda que se presente
… encubriendo su nombre, fingiendo su patria, como si hubiera hecho alguna traición de lesa majestad.
Y usando dos pequeños cuentos, ridiculiza las pretensiones de Avellaneda de ser capaz de hacer un libro capaz de darle dinero y fama (comparándole con el loco que infla perros soplándoles por el culo) y le niega todo tipo de talento para escribir (con la otra historia del loco que se dedica a apedrear perros hasta que el dueño de uno le da una paliza). La asociación nada sutil de las figuras de perros y locos con la persona del autor del apócrifo es lo más cerca que Cervantes se pone de una agresión verbal. En estas historias usa todo su talento para el género picaresco, dejando patente la fiereza que se mantiene agazapada detrás del artificio de las letras: no quisiera yo haber estado en la piel de Avellaneda si se hubiera producido un encuentro frente a frente.
“Prevenir enfermedades con comida alcalina y sus propiedades beneficiosas”
Bien mirado, quizás lo suyo en Twitter sería usar listas. Pero yo soy perezoso para esto de categorizar a quienes sigo, y por eso tengo el hábito de tirarme a mi línea de tiempo (timeline, TL) en plan indolente, buscando cosas interesantes de modo errático. Cuando esta estrategia falla, me voy a las tendencias (trending topics, TT) en inglés, a ver tuits relacionados por esas etiquetas.
Un día, en uno de esos rastreos por tendencias, me llamó la atención un tuit sobre la comida alcalina. No es que me interese la macrobiótica o la alimentación en general. Lo llamativo era que el hashtag no tenía nada que ver con el contenido del tuit. Y no me habría fijado, pero acababa de ver el mismo tuit sobre la comida alcalina con una etiqueta (hashtag, HT) diferente.
Enrique Iglesias Prevenir enfermedades con comida alcalina y sus beneficios http://t.co/Gl5slMgUIU 😀
— AnaMaria Terapias (@AnaMariaTerapia) Mayo 31, 2015
En un caso el hashtag es #holaberberecho y en el otro Enrique Iglesias. Ambos eran tendencia en España en ese momento, pero evidentemente no tienen mucho que ver con los tuits (bueno, no sé si los berberechos son alcalinos – y si me apuras tampoco sé el pH de Enrique Iglesias).
Una búsqueda con las palabras comida alcalina revela que, efectivamente, hay muchos usuarios tuiteando el mismo contenido. Pero hay diferencias respecto a los robots que he visto tuitear en ocasiones. Los tuits estaban organizados interiormente con una estructura ligeramente distinta en cada caso.
El hashtag (#IslasDelMundo, #DiaMundialSinTabaco, Scary Movie, Michel Franco) aparece a veces al principio, a veces al final.
Hay en ocasiones una palabra (Atención! Entérate!) que precede el texto.
En ocasiones el texto termina con emoticonos (:O, 😀).
El enlace del tuit es siempre el mismo (al menos en este caso, en otros no).
Las tres primeras características están orientadas a evitar la apariencia mecánica de los distintos tuits, de forma que sean menos fáciles de correlacionar. La cuarta, si se presenta, identifica sin género de duda que los tuits pertenecen a un mismo lote.
Por curiosidad seguí el enlace y descubrí que se dirigía a un artículo de una revista digital, cuerpoymente.es. Esta web publica artículos de salud, y entonces entendí la razón de todo el montaje: mediante esta red de perfiles falsos se publican tuits que dirigen a contenidos de la revista. Queda la duda de si es la propia web la que ha organizado esta infraestructura o si la ha contratado a terceros. Mi sospecha va en la primera dirección, según justificaré más tarde.
Y ¿por qué tengo tanto interés en estos usuarios falsos?
La realidad corta es porque me molestan. En primer lugar, el creador de esta red está violando los términos de servicio de Twitter, al usar los hashtags de los trending topic para visibilizar sus tuits. Puesto que los HT son TT, significa que muchos usuarios están interesados por ellos y por tanto clicarán para descubrir contenido asociado. La trampa aquí es que los tuits no tienen ninguna relación con esos HT.
En segundo lugar, el hecho de que aparezcan tuits espúreos entre los que uno desea realmente leer se denomina spam, y está también penalizado por Twitter. A mí particularmente también me ha molestado tanto como para reportar usuarios tramposos. Sólo por estas dos razones ya me parecía interesante investigar más, igual que ya he hecho en otras ocasiones. Pero, además, según investigaba me daba cuenta de que todo era más sofisticado de lo que parecía en primera instancia, y la curiosidad me empujó a seguir intentando discernir los criterios que el diseñador de la red de usuarios falsos había decidido implementar.
Así pues, tomé varios usuarios y me puse a estudiar sus perfiles primero y sus líneas de tiempo después.
Perfiles de usuario
Los perfiles eran quizás lo menos trabajado de todo. Tenían dos características comunes:
Ninguno contenía descripción, tan sólo el nombre y el identificador de Twitter.
La mayoría de ellos tenía entre 40 y 70 cuentas a las que seguían, y estas cuentas eran básicamente de dos tipos: las cuentas populares que Twitter te recomienda al dar de alta una cuenta, por un lado, y por otro, otros usuarios falsos.
Las cuentas de este sistema se siguen unas a otras, así que si queremos hacer una redada, por así decir, basta tomar una de estas cuentas y ver a quién siguen. En la imagen podéis ver unas cuantas.
NInguna de estas cuentas es real.
Otra forma de conseguir un listado de usuarios es tomar un tuit que sea sospechoso (más adelante explico los rasgos típicos) y hacer una búsqueda de las palabras más significativas. Así obtendremos una lista de tuits que, si hemos elegido bien las palabras, serán casi todos de las remesas que publica este sistema publicitario. Para este estudio, he usado la búsqueda “ovnis OR luces AND Massachusetts AND ciudad“. Os animo a hacer la búsqueda por vosotros mismos. Deberíais obtener una colección de tuits como éstos:
Uno de los tuiteros no es fake. A ver si lo encontráis.
Esta lista puede rastrearse, con paciencia, hasta febrero de 2014.
A través del API de Twitter he hecho la misma búsqueda, y en este caso he encontrado unos 1200 tuits en un periodo de sólo nueve días: eso representa una basura de más de 100 tuits diarios acerca de los ovnis de Massachusetts. Os he dejado los links para que podáis ver que todos os remiten al mismo lugar, un artículo de la revista web cuerpoymente.es.
0 2015-06-04 09:08:13 Corpus Christi Las luces de Massachusetts capturados en video sobrevolando la ciudad http://t.co/1mNY4p5fNi
1 2015-06-04 08:38:07 RT @PacaPacheco89: Las luces de Massachusetts grabados en video sobre la ciudad http://t.co/gdzNAcmw14 #PesadillaTaberneta
2 2015-06-04 08:34:04 Las luces de Massachusetts grabados en video sobrevolando la ciudad http://t.co/KMoQ4Pke4p #SiempreMePasaQue
3 2015-06-04 08:30:56 Las luces de Massachusetts grabados en video sobre la ciudad http://t.co/gdzNAcmw14 #PesadillaTaberneta
4 2015-06-04 08:11:16 Las luces de Massachusetts grabados en video maniobrando sobre la ciudad http://t.co/pIUxUr9Iq3 Pizarro
5 2015-06-04 08:07:53 RT @LauriPari90: Los ovnis de Massachusetts capturados en video maniobrando sobre la ciudad http://t.co/P49HEKtMld Chuck Blazer
6 2015-06-04 08:03:51 Los ovnis de Massachusetts capturados en video maniobrando sobre la ciudad http://t.co/P49HEKtMld Chuck Blazer
7 2015-06-04 07:40:17 #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad
8 2015-06-04 07:38:57 RT @SaraTorresBcn: #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/mZkqG36ER3
9 2015-06-04 07:36:39 RT @MartaAbuelo86: #SeriaRePiolaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/FnYz4iQWkx
10 2015-06-04 07:35:53 #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/mZkqG36ER3
11 2015-06-04 07:33:41 #SeriaRePiolaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/FnYz4iQWkx
12 2015-06-04 07:29:54 Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/prkOlzmCLb #FelizJueves
13 2015-06-04 07:13:14 RT @AndresMateoAndr: Los ovnis de Massachusetts grabados en video sobre la ciudad http://t.co/Qskwo2uRMu #SiempreMePasaQue
Es fácil ver que los tuits son muy parecidos, pero es difícil formular las reglas que se usan para que los tuits parezcan distintos y, por tanto, naturales. Más adelante estudiamos esas reglas. Lo que me interesa son los usuarios distintos que hay. Los campos que hay en el siguiente listado se explican a continuación:
Fecha creación: La fecha en que se creó el usuario. Debo decir que los cuatro primeros usuarios parecen reales, ya que son de 2012 (los otros son de oct-2014 en adelante), tienen pocos tuits diarios y además contienen algo en los campos de location y description, cosa de la que los usuarios fake carecen.
Días: Cuántos días hace que se creó la cuenta.
Tuits: Tuits que ha enviado la cuenta desde su creación. Como veréis, son números similares.
T/día: Promedio de tuits enviados a diario. Dato interesante: las cuentas más antiguas tienen un promedio más bajo, seguramente porque al principio el sistema procesaba menos tuits. A partir de abril de 2014 pasa de unos 140-150 a 260, señal de que se ha decidido incrementar los tuits, posiblemente al añadir nuevos contenidos que publicitar.
T1: Tuits que hemos encontrado en esta búsqueda de los ovnis de Massachusetts. Su número oscila entre 9 y 23. Esto en un período de 9 días, lo que viene a ser uno o dos tuits de ovnis al día (por cada usuario).
Fw: Usuarios a los que ese usuario fake sigue. Los usuarios seguidos son unos cuantos de la misma red de usuarios fake, mas otra colección de cuentas populares que se usan ocasionalmente para retuitear contenidos.
screen_name: el nombre del usuario en Twitter. Lo pongo con el enlace para que podáis entrar en sus perfiles y comprobar el tipo de tuits que publican, todos falsos (menos los retuits de cuentas populares y los chistes).
location: el campo que declara la ubicación del usuario. Como es texto libre, no es de mucha confianza como información, pero en este caso lo normal es que no exista, salvo en los cuatro primeros, que ya dije que parecen reales (o de otra remesa más antigua).
description: el texto que se añade a la cuenta como descripción. Los fakes de este sistema no suelen tener.
Respecto a las líneas de tiempo, se reconocían los tuits publicitarios antes descritos, pero también había dos tipos de tuits distintos:
Retuits de otras cuentas, principalmente de las cuentas recomendadas. Entiendo que pretenden dar una apariencia humana a la cuenta, retuiteando contenido de terceros para dar a entender que el usuario fake lee otras cuentas. Mirando con atención, no hay mucho criterio en la selección de los tuits; basta ceñirse a las cuentas recomendadas para obtener contenidos razonablemente lógicos.
Tuits de frases ingeniosas, combinadas con un TT para darles visibilidad. La estrategia aquí es aparecer en las búsquedas por TT gracias al HT, focalizar la atención de los usuarios por su naturaleza ingeniosa (hay infinidad de cuentas de las que se puede obtener esas frases) hacia el usuario fake y lograr en consecuencia que un usuario termine por entrar a curiosear en la TL del usuario fake, donde encontrará todos los tuits publicitarios.
Análisis de variabilidad de los tuits
He hecho una búsqueda de tuits conteniendo las palabras comida alcalina, y me salen 531. Sin embargo, se observa que se han tomado precauciones para que no se reconozcan fácilmente que se trata de tuits repetidos, y menos de forma mecánica.
En rojo se marca el texto del tuit. Si los examinas, verás que son ligeramente distintos, como analizaremos a continuación.
En azul están los HT, que una vez más remarcaré que son TT que no tienen nada que ver con el contenido del tuit. Además, el sistema a veces sitúa el HT al principio en vez de al final.
Existen añadidos al tuit como un texto de introducción (en amarillo) y un emoticono (en rosa) al final, antes del HT cuando éste aparece al final.
Algunos tuits son RT de otros usuarios fake.
Todas estas variaciones pretenden simular que los tuits no provienen de la misma fuente, y de hecho funciona muy bien; yo descubrí todo esto gracias al uso de los TT inconsistentes: sólo al cabo de un tiempo inspeccionando los tuits fui descubriendo las distintas regularidades que presentan.
El análisis de las frases en rojo, que son el núcleo del tuit, presenta las siguientes variaciones:
Esto revela una combinación mecánica de tres grupos, cada uno de ellos formado por dos o tres subfrases:
preven las enfermedades / Prevenir enfermedades
gracias a comida alcalina / con comida alcalina
y sus propiedades beneficiosas / y sus beneficios / y sus múltiples propiedades
En el caso de los ovnis de Massachusetts, las variaciones se obtienen igual:
Los ovnis de Massachusetts/Las luces de Massachusetts
grabados en vídeo/capturados en vídeo
sobre la ciudad/sobrevolando la ciudad/maniobrando sobre la ciudad
Hay que reconocer que los diseñadores del sistema han dedicado un considerable esfuerzo en disimular su naturaleza mecánica.
A dónde remiten los links
Ya he mencionado antes la revista cuerpoymente.es, pero aquí voy a estudiar los enlaces que existen en estos tuits, para ver a quién pertenecen y qué pretenden publicitar. La estrategia para ello es capturar la TL de uno de estos usuarios fake y extraer de sus tuits los enlaces que contienen.
He usado a MonicaNaranjo90, un usuario cualquiera de la lista de más arriba. He recuperado unos 3200 tuits, de los cuales he descartado los RT (porque algunos son de las cuentas populares, y remiten a otros enlaces que no nos interesan) y los que no tienen enlaces. En total hay unos 1600 tuits con enlaces válidos, la mitad, lo que no sé si interpretar como una casualidad o como un criterio de diseño. En cualquier caso, estos 1600 tuits se corresponden con sólo 80 enlaces distintos, que se repiten, por tanto, unas 200 veces cada uno. Y esto en un periodo de análisis de 17 días, lo que da una idea del volumen de tuits fraudulentos que esta red introduce en Twitter.
Los 80 enlaces (bueno, 79 en realidad) se corresponden con tres dominios:
cuerpoymente.es: una revista o blog de medicina natural, salud y terapias alternativas. Hay 22 enlaces.
archivoparanormal.com: como su nombre indica, un blog sobre temas paranormales. 38 enlaces.
play.google.com: el almacén de aplicaciones de Google, desde donde se pueden descargar aplicaciones de un desarrollador: NatureSoft Games. 19 enlaces.