“Prevenir enfermedades con comida alcalina y sus propiedades beneficiosas”
Bien mirado, quizás lo suyo en Twitter sería usar listas. Pero yo soy perezoso para esto de categorizar a quienes sigo, y por eso tengo el hábito de tirarme a mi línea de tiempo (timeline, TL) en plan indolente, buscando cosas interesantes de modo errático. Cuando esta estrategia falla, me voy a las tendencias (trending topics, TT) en inglés, a ver tuits relacionados por esas etiquetas.
Un día, en uno de esos rastreos por tendencias, me llamó la atención un tuit sobre la comida alcalina. No es que me interese la macrobiótica o la alimentación en general. Lo llamativo era que el hashtag no tenía nada que ver con el contenido del tuit. Y no me habría fijado, pero acababa de ver el mismo tuit sobre la comida alcalina con una etiqueta (hashtag, HT) diferente.
Enterate! preven las enfermedades con comida alcalina y sus beneficios http://t.co/REzCfTPo9D 🙂 #holaberberecho
— Bob Marley (@BobMarley90Jr) Mayo 31, 2015
Enrique Iglesias Prevenir enfermedades con comida alcalina y sus beneficios http://t.co/Gl5slMgUIU 😀
— AnaMaria Terapias (@AnaMariaTerapia) Mayo 31, 2015
En un caso el hashtag es #holaberberecho y en el otro Enrique Iglesias. Ambos eran tendencia en España en ese momento, pero evidentemente no tienen mucho que ver con los tuits (bueno, no sé si los berberechos son alcalinos – y si me apuras tampoco sé el pH de Enrique Iglesias).
Una búsqueda con las palabras comida alcalina revela que, efectivamente, hay muchos usuarios tuiteando el mismo contenido. Pero hay diferencias respecto a los robots que he visto tuitear en ocasiones. Los tuits estaban organizados interiormente con una estructura ligeramente distinta en cada caso.
- El hashtag (#IslasDelMundo, #DiaMundialSinTabaco, Scary Movie, Michel Franco) aparece a veces al principio, a veces al final.
- Hay en ocasiones una palabra (Atención! Entérate!) que precede el texto.
- En ocasiones el texto termina con emoticonos (:O, 😀).
- El enlace del tuit es siempre el mismo (al menos en este caso, en otros no).
Las tres primeras características están orientadas a evitar la apariencia mecánica de los distintos tuits, de forma que sean menos fáciles de correlacionar. La cuarta, si se presenta, identifica sin género de duda que los tuits pertenecen a un mismo lote.
Por curiosidad seguí el enlace y descubrí que se dirigía a un artículo de una revista digital, cuerpoymente.es. Esta web publica artículos de salud, y entonces entendí la razón de todo el montaje: mediante esta red de perfiles falsos se publican tuits que dirigen a contenidos de la revista. Queda la duda de si es la propia web la que ha organizado esta infraestructura o si la ha contratado a terceros. Mi sospecha va en la primera dirección, según justificaré más tarde.
Y ¿por qué tengo tanto interés en estos usuarios falsos?
La realidad corta es porque me molestan. En primer lugar, el creador de esta red está violando los términos de servicio de Twitter, al usar los hashtags de los trending topic para visibilizar sus tuits. Puesto que los HT son TT, significa que muchos usuarios están interesados por ellos y por tanto clicarán para descubrir contenido asociado. La trampa aquí es que los tuits no tienen ninguna relación con esos HT.
En segundo lugar, el hecho de que aparezcan tuits espúreos entre los que uno desea realmente leer se denomina spam, y está también penalizado por Twitter. A mí particularmente también me ha molestado tanto como para reportar usuarios tramposos. Sólo por estas dos razones ya me parecía interesante investigar más, igual que ya he hecho en otras ocasiones. Pero, además, según investigaba me daba cuenta de que todo era más sofisticado de lo que parecía en primera instancia, y la curiosidad me empujó a seguir intentando discernir los criterios que el diseñador de la red de usuarios falsos había decidido implementar.
Así pues, tomé varios usuarios y me puse a estudiar sus perfiles primero y sus líneas de tiempo después.
Perfiles de usuario
Los perfiles eran quizás lo menos trabajado de todo. Tenían dos características comunes:
- Ninguno contenía descripción, tan sólo el nombre y el identificador de Twitter.
- La mayoría de ellos tenía entre 40 y 70 cuentas a las que seguían, y estas cuentas eran básicamente de dos tipos: las cuentas populares que Twitter te recomienda al dar de alta una cuenta, por un lado, y por otro, otros usuarios falsos.
Las cuentas de este sistema se siguen unas a otras, así que si queremos hacer una redada, por así decir, basta tomar una de estas cuentas y ver a quién siguen. En la imagen podéis ver unas cuantas.
Otra forma de conseguir un listado de usuarios es tomar un tuit que sea sospechoso (más adelante explico los rasgos típicos) y hacer una búsqueda de las palabras más significativas. Así obtendremos una lista de tuits que, si hemos elegido bien las palabras, serán casi todos de las remesas que publica este sistema publicitario. Para este estudio, he usado la búsqueda “ovnis OR luces AND Massachusetts AND ciudad“. Os animo a hacer la búsqueda por vosotros mismos. Deberíais obtener una colección de tuits como éstos:
Esta lista puede rastrearse, con paciencia, hasta febrero de 2014.
A través del API de Twitter he hecho la misma búsqueda, y en este caso he encontrado unos 1200 tuits en un periodo de sólo nueve días: eso representa una basura de más de 100 tuits diarios acerca de los ovnis de Massachusetts. Os he dejado los links para que podáis ver que todos os remiten al mismo lugar, un artículo de la revista web cuerpoymente.es.
0 2015-06-04 09:08:13 Corpus Christi Las luces de Massachusetts capturados en video sobrevolando la ciudad http://t.co/1mNY4p5fNi 1 2015-06-04 08:38:07 RT @PacaPacheco89: Las luces de Massachusetts grabados en video sobre la ciudad http://t.co/gdzNAcmw14 #PesadillaTaberneta 2 2015-06-04 08:34:04 Las luces de Massachusetts grabados en video sobrevolando la ciudad http://t.co/KMoQ4Pke4p #SiempreMePasaQue 3 2015-06-04 08:30:56 Las luces de Massachusetts grabados en video sobre la ciudad http://t.co/gdzNAcmw14 #PesadillaTaberneta 4 2015-06-04 08:11:16 Las luces de Massachusetts grabados en video maniobrando sobre la ciudad http://t.co/pIUxUr9Iq3 Pizarro 5 2015-06-04 08:07:53 RT @LauriPari90: Los ovnis de Massachusetts capturados en video maniobrando sobre la ciudad http://t.co/P49HEKtMld Chuck Blazer 6 2015-06-04 08:03:51 Los ovnis de Massachusetts capturados en video maniobrando sobre la ciudad http://t.co/P49HEKtMld Chuck Blazer 7 2015-06-04 07:40:17 #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad 8 2015-06-04 07:38:57 RT @SaraTorresBcn: #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/mZkqG36ER3 9 2015-06-04 07:36:39 RT @MartaAbuelo86: #SeriaRePiolaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/FnYz4iQWkx 10 2015-06-04 07:35:53 #SiempreMePasaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/mZkqG36ER3 11 2015-06-04 07:33:41 #SeriaRePiolaQue Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/FnYz4iQWkx 12 2015-06-04 07:29:54 Los ovnis de Massachusetts grabados en video sobrevolando la ciudad http://t.co/prkOlzmCLb #FelizJueves 13 2015-06-04 07:13:14 RT @AndresMateoAndr: Los ovnis de Massachusetts grabados en video sobre la ciudad http://t.co/Qskwo2uRMu #SiempreMePasaQue
Es fácil ver que los tuits son muy parecidos, pero es difícil formular las reglas que se usan para que los tuits parezcan distintos y, por tanto, naturales. Más adelante estudiamos esas reglas. Lo que me interesa son los usuarios distintos que hay. Los campos que hay en el siguiente listado se explican a continuación:
- Fecha creación: La fecha en que se creó el usuario. Debo decir que los cuatro primeros usuarios parecen reales, ya que son de 2012 (los otros son de oct-2014 en adelante), tienen pocos tuits diarios y además contienen algo en los campos de location y description, cosa de la que los usuarios fake carecen.
- Días: Cuántos días hace que se creó la cuenta.
- Tuits: Tuits que ha enviado la cuenta desde su creación. Como veréis, son números similares.
- T/día: Promedio de tuits enviados a diario. Dato interesante: las cuentas más antiguas tienen un promedio más bajo, seguramente porque al principio el sistema procesaba menos tuits. A partir de abril de 2014 pasa de unos 140-150 a 260, señal de que se ha decidido incrementar los tuits, posiblemente al añadir nuevos contenidos que publicitar.
- T1: Tuits que hemos encontrado en esta búsqueda de los ovnis de Massachusetts. Su número oscila entre 9 y 23. Esto en un período de 9 días, lo que viene a ser uno o dos tuits de ovnis al día (por cada usuario).
- Fw: Usuarios a los que ese usuario fake sigue. Los usuarios seguidos son unos cuantos de la misma red de usuarios fake, mas otra colección de cuentas populares que se usan ocasionalmente para retuitear contenidos.
- screen_name: el nombre del usuario en Twitter. Lo pongo con el enlace para que podáis entrar en sus perfiles y comprobar el tipo de tuits que publican, todos falsos (menos los retuits de cuentas populares y los chistes).
- location: el campo que declara la ubicación del usuario. Como es texto libre, no es de mucha confianza como información, pero en este caso lo normal es que no exista, salvo en los cuatro primeros, que ya dije que parecen reales (o de otra remesa más antigua).
- description: el texto que se añade a la cuenta como descripción. Los fakes de este sistema no suelen tener.
Fecha creación Días Tuits T/día T1 Fw screen_name location description =================== ==== ===== ====== == === ==================================== ================ ============================ 2012-02-20 21:22:34 1203 7157 5.95 10 328 https://twitter.com/Meche_San_Cas Morelia Ni los avances tecnológic... 2012-02-20 22:35:00 1203 7038 5.85 9 83 https://twitter.com/LupitaOrnelasPl jiquilpan La Familia como el sol, i... 2012-11-02 01:53:43 947 7803 8.24 10 268 https://twitter.com/MerariCam Pátzcuaro, Mich Exhiliada de Chihuahu ado... 2012-11-03 12:14:32 946 13672 14.45 13 267 https://twitter.com/MariMarSosam Zitácuaro Siento tu cuerpo, siento ... 2014-10-25 14:23:15 225 17793 79.08 19 56 https://twitter.com/Claudia0789908 2014-11-03 10:30:15 216 22576 104.52 10 60 https://twitter.com/LizTerapeuta89 2014-11-03 16:32:09 216 22772 105.43 12 49 https://twitter.com/anaterapias89 2014-12-12 23:06:44 177 22770 128.64 8 74 https://twitter.com/estergonza89 2014-12-13 09:14:05 176 21927 124.59 12 70 https://twitter.com/Ivangonza84sf 2014-12-23 17:10:54 166 21323 128.45 14 69 https://twitter.com/anacabeza89 2015-01-03 20:14:50 155 16325 105.32 9 89 https://twitter.com/AndresMateoAndr 2015-01-11 12:30:57 147 20183 137.30 11 53 https://twitter.com/Gabriela_89_joh 2015-01-18 18:09:05 140 19879 141.99 12 45 https://twitter.com/AlexMaroto89 2015-01-18 18:33:38 140 19750 141.07 19 46 https://twitter.com/LidiaPujol89 2015-01-18 18:41:34 140 19788 141.34 10 46 https://twitter.com/MacarenaGomez_9 2015-01-19 12:36:37 139 19071 137.20 11 46 https://twitter.com/MiriamProfumo 2015-02-07 12:41:13 120 17570 146.42 11 49 https://twitter.com/MaiteFigueroa79 2015-02-07 13:01:22 120 17693 147.44 11 47 https://twitter.com/AnaMariaTerapia 2015-02-07 13:09:03 120 17568 146.40 9 47 https://twitter.com/MariaAlcantarez 2015-02-14 15:48:30 113 16461 145.67 11 44 https://twitter.com/AntonioRancio89 2015-02-14 16:09:45 113 16443 145.51 10 55 https://twitter.com/EstefaniaPati89 2015-02-17 10:33:19 110 16206 147.33 16 74 https://twitter.com/JuditGis 2015-02-27 14:10:10 100 15747 157.47 13 75 https://twitter.com/AnaAduana 2015-02-27 14:20:17 100 15734 157.34 10 45 https://twitter.com/SergiMirandaIcs 2015-03-01 09:09:51 98 15537 158.54 7 46 https://twitter.com/MartaTuniG 2015-03-01 09:38:09 98 15530 158.47 14 50 https://twitter.com/BethAtriu 2015-03-01 18:33:05 98 15469 157.85 13 43 https://twitter.com/LeonarRomani 2015-03-11 08:55:17 88 14438 164.07 7 42 https://twitter.com/BelenEsteban89 2015-03-12 13:28:08 87 14276 164.09 18 40 https://twitter.com/PacaPacheco89 2015-04-03 16:14:24 65 12581 193.55 18 15 https://twitter.com/RaquelFernan91 2015-04-04 06:57:38 64 13483 210.67 13 79 https://twitter.com/SaraTorresBcn 2015-04-05 07:21:22 63 13162 208.92 14 40 https://twitter.com/NievesGarcia85 2015-04-05 16:22:59 63 13870 220.16 17 63 https://twitter.com/InmaMarti90 2015-04-07 07:38:27 61 15110 247.70 14 57 https://twitter.com/LauriPari90 2015-04-07 13:56:21 61 15140 248.20 13 57 https://twitter.com/NinesChacon90 2015-04-08 07:14:06 60 15031 250.52 11 58 https://twitter.com/AinoaBotella 2015-04-08 15:51:23 60 15719 261.98 21 58 https://twitter.com/MonicaNaranjo90 2015-04-08 16:11:33 60 15613 260.22 22 61 https://twitter.com/MartaAbuelo86 2015-04-08 17:30:25 60 15722 262.03 12 64 https://twitter.com/EstelaReynnolds 2015-04-08 18:23:42 60 15733 262.22 18 65 https://twitter.com/AlbaAlonSilla 2015-04-08 18:41:28 60 15780 263.00 20 66 https://twitter.com/MartaMartona89 2015-04-08 18:51:14 60 15578 259.63 19 67 https://twitter.com/AmparoElCorreo 2015-04-09 18:29:19 59 15442 261.73 14 69 https://twitter.com/AidaColmenero90 2015-04-09 20:41:45 59 15409 261.17 16 69 https://twitter.com/LoreLaLore 2015-04-10 07:10:34 58 15310 263.97 17 69 https://twitter.com/AinoaDelRio 2015-04-11 08:17:55 57 15104 264.98 17 71 https://twitter.com/MarinaFageda 2015-04-11 13:12:43 57 14963 262.51 16 80 https://twitter.com/MartaTerapias 2015-04-12 07:08:46 56 14765 263.66 17 87 https://twitter.com/PazPadilla89 2015-04-13 10:03:56 55 14566 264.84 18 85 https://twitter.com/MisteriosUniv9 2015-04-13 11:47:17 55 14502 263.67 15 75 https://twitter.com/AlionaBolsova 2015-04-13 20:59:21 55 14369 261.25 22 87 https://twitter.com/MonicaSalazar89 2015-04-15 07:29:29 53 14010 264.34 15 84 https://twitter.com/AmadorRibasCuki 2015-04-15 10:04:30 53 14022 264.57 16 88 https://twitter.com/MercedesMilar 2015-04-16 08:59:09 52 13779 264.98 16 88 https://twitter.com/MariaLaPiedra90 2015-04-17 07:24:16 51 13446 263.65 21 91 https://twitter.com/BobMarley90Jr 2015-04-19 07:11:51 49 12948 264.24 19 97 https://twitter.com/PadreAngelTV 2015-04-20 08:59:00 48 12901 268.77 19 105 https://twitter.com/SaludYTerapias9 2015-04-21 08:47:33 47 12551 267.04 20 91 https://twitter.com/MileyCirrosis 2015-04-25 12:10:56 43 11469 266.72 20 94 https://twitter.com/MonicaSalcedoCa 2015-04-26 19:48:43 42 11078 263.76 16 102 https://twitter.com/VanesaRomeroBcn 2015-04-26 21:03:09 42 11142 265.29 18 96 https://twitter.com/IkerJimenez80 2015-04-26 21:51:15 42 11150 265.48 11 108 https://twitter.com/IkerJimenezNews 2015-04-27 19:52:41 41 10718 261.41 13 64 https://twitter.com/SorayaGarciaFDF 2015-04-28 08:14:18 40 10571 264.27 23 104 https://twitter.com/BelenEstebanVlP 2015-04-28 22:38:31 40 10387 259.68 22 109 https://twitter.com/AntonioRecioTV5 2015-04-29 08:46:01 39 9571 245.41 20 73 https://twitter.com/EduardPunsetTV 2015-05-01 10:56:07 37 9474 256.05 22 109 https://twitter.com/PilarRubioTV 2015-05-01 11:49:20 37 9537 257.76 13 117 https://twitter.com/FerminTrujilloT 2015-05-01 13:03:01 37 9453 255.49 19 111 https://twitter.com/FerminTrujillo0 2015-05-01 14:19:40 37 9420 254.59 21 120 https://twitter.com/EnriquePastorTV 2015-05-02 20:34:58 36 9002 250.06 16 108 https://twitter.com/CoqueCalatrava 2015-05-03 21:32:34 35 8617 246.20 12 126 https://twitter.com/SantiagoCamachM 2015-05-04 08:29:13 34 8393 246.85 16 112 https://twitter.com/AntonioRecioLQa 2015-05-07 19:20:59 31 7325 236.29 12 117 https://twitter.com/ChusaLaChusa 2015-05-08 21:04:48 30 6897 229.90 7 123 https://twitter.com/LaChusaLQSAve 2015-05-09 06:06:02 29 6852 236.28 18 122 https://twitter.com/ChusaLQSAChusa 2015-05-09 14:27:40 29 6680 230.34 18 123 https://twitter.com/PunsetEdu 2015-05-09 14:43:25 29 6645 229.14 15 117 https://twitter.com/PunsetEduardo 2015-05-12 08:26:10 26 5846 224.85 13 124 https://twitter.com/MarinaDelMar90 2015-05-20 21:02:29 18 3574 198.56 12 130 https://twitter.com/EvaHacheHumor
Líneas de tiempo
Respecto a las líneas de tiempo, se reconocían los tuits publicitarios antes descritos, pero también había dos tipos de tuits distintos:
- Retuits de otras cuentas, principalmente de las cuentas recomendadas. Entiendo que pretenden dar una apariencia humana a la cuenta, retuiteando contenido de terceros para dar a entender que el usuario fake lee otras cuentas. Mirando con atención, no hay mucho criterio en la selección de los tuits; basta ceñirse a las cuentas recomendadas para obtener contenidos razonablemente lógicos.
- Tuits de frases ingeniosas, combinadas con un TT para darles visibilidad. La estrategia aquí es aparecer en las búsquedas por TT gracias al HT, focalizar la atención de los usuarios por su naturaleza ingeniosa (hay infinidad de cuentas de las que se puede obtener esas frases) hacia el usuario fake y lograr en consecuencia que un usuario termine por entrar a curiosear en la TL del usuario fake, donde encontrará todos los tuits publicitarios.
Análisis de variabilidad de los tuits
He hecho una búsqueda de tuits conteniendo las palabras comida alcalina, y me salen 531. Sin embargo, se observa que se han tomado precauciones para que no se reconozcan fácilmente que se trata de tuits repetidos, y menos de forma mecánica.
- En rojo se marca el texto del tuit. Si los examinas, verás que son ligeramente distintos, como analizaremos a continuación.
- En azul están los HT, que una vez más remarcaré que son TT que no tienen nada que ver con el contenido del tuit. Además, el sistema a veces sitúa el HT al principio en vez de al final.
- Existen añadidos al tuit como un texto de introducción (en amarillo) y un emoticono (en rosa) al final, antes del HT cuando éste aparece al final.
- Algunos tuits son RT de otros usuarios fake.
Todas estas variaciones pretenden simular que los tuits no provienen de la misma fuente, y de hecho funciona muy bien; yo descubrí todo esto gracias al uso de los TT inconsistentes: sólo al cabo de un tiempo inspeccionando los tuits fui descubriendo las distintas regularidades que presentan.
El análisis de las frases en rojo, que son el núcleo del tuit, presenta las siguientes variaciones:
Esto revela una combinación mecánica de tres grupos, cada uno de ellos formado por dos o tres subfrases:
- preven las enfermedades / Prevenir enfermedades
- gracias a comida alcalina / con comida alcalina
- y sus propiedades beneficiosas / y sus beneficios / y sus múltiples propiedades
En el caso de los ovnis de Massachusetts, las variaciones se obtienen igual:
- Los ovnis de Massachusetts/Las luces de Massachusetts
- grabados en vídeo/capturados en vídeo
- sobre la ciudad/sobrevolando la ciudad/maniobrando sobre la ciudad
Hay que reconocer que los diseñadores del sistema han dedicado un considerable esfuerzo en disimular su naturaleza mecánica.
A dónde remiten los links
Ya he mencionado antes la revista cuerpoymente.es, pero aquí voy a estudiar los enlaces que existen en estos tuits, para ver a quién pertenecen y qué pretenden publicitar. La estrategia para ello es capturar la TL de uno de estos usuarios fake y extraer de sus tuits los enlaces que contienen.
He usado a MonicaNaranjo90, un usuario cualquiera de la lista de más arriba. He recuperado unos 3200 tuits, de los cuales he descartado los RT (porque algunos son de las cuentas populares, y remiten a otros enlaces que no nos interesan) y los que no tienen enlaces. En total hay unos 1600 tuits con enlaces válidos, la mitad, lo que no sé si interpretar como una casualidad o como un criterio de diseño. En cualquier caso, estos 1600 tuits se corresponden con sólo 80 enlaces distintos, que se repiten, por tanto, unas 200 veces cada uno. Y esto en un periodo de análisis de 17 días, lo que da una idea del volumen de tuits fraudulentos que esta red introduce en Twitter.
Los 80 enlaces (bueno, 79 en realidad) se corresponden con tres dominios:
- cuerpoymente.es: una revista o blog de medicina natural, salud y terapias alternativas. Hay 22 enlaces.
- archivoparanormal.com: como su nombre indica, un blog sobre temas paranormales. 38 enlaces.
- play.google.com: el almacén de aplicaciones de Google, desde donde se pueden descargar aplicaciones de un desarrollador: NatureSoft Games. 19 enlaces.