Les bots sur Twitter peuvent être utilisés à des fins malveillantes, telles que la distribution de maliciels, la diffusion de fausses informations, la simulation de mouvements politiques populaires et l’interférence de mouvements sociaux.
Twitter permet à ses utilisateurs d’accéder à ses services via une page Web, des applications mobiles et une interface de programmation d’application (IPA). Même si l’IPA permet d’améliorer l’expérience des utilisateurs avec le contenu de Twitter, elle permet également la création d’applications qui contrôlent les comptes et automatisent la publication de tweets.
L’automatisation dans Twitter peut être effectuée de plusieurs manières. Les comptes (bots) entièrement automatisés peuvent être utilisés pour retweeter du contenu pertinent pour des communautés spécifiques ou pour agréger des tweets sur un sujet. Les comptes partiellement automatisés (cyborgs) permettent aux utilisateurs d’automatiser des tâches spécifiques, telles que la recherche de mentions, la planification de publications et la réponse automatique aux messages individuels.
La détection des bots est une tâche essentielle pour Twitter afin de suspendre les comptes qui enfreignent leurs conditions. Cette détection repose sur des mécanismes, tels que permettre aux utilisateurs de signaler ou notifier des comptes suspects. Cependant, les bots deviennent plus sophistiqués pour éviter la détection.
Dans cette étude, Jorge Rodriguez-Ruiz et ses collègues ont utilisé une classification à une classe pour la détection des bots sur Twitter. Les classificateurs à une classe ne nécessitent pas d’exemples de comportement anormal pour discerner les bots et les utilisateurs humains. Les auteurs comparent les performances de leur modèle aux classificateurs populaires à classes multiples et à classe unique rapportés dans la littérature.
La classification à une classe est une sorte de classification supervisée, où les classificateurs à une seule classe n’ont besoin que d’exemples de la classe normale pour en apprendre les représentations et identifier si un nouvel exemple appartient ou non à cette classe. La classification à une classe est couramment utilisée lorsque l’objectif est de trouver des écarts par rapport au comportement normal ou attendu (détection d’anomalies).
Les résultats ont montré que les classificateurs à une classe ont des performances plus élevées que les autres types de classificateurs lors de la détection des comptes bots avec des comportements non identifiés lors de la session de formation des classificateurs. Cependant, les classificateurs conçus pour identifier un type spécifique de bot avaient des performances plus élevées que les classificateurs à une classe.
Les auteurs concluent que les classificateurs à une classe pourraient compléter les approches existantes pour la détection de nouveaux robots.