Situation
Solution
search Tweets et Tweets lookup de la X API v2, l’équipe a pu rechercher des statuts de publications et identifier les moments où des personnes signalaient un incident motivé par la haine (et même les hashtags qu’elles utilisaient). Cela a aidé l’équipe à concevoir une requête de recherche de 1023 caractères qui a permis de réduire des milliards de publications à un volume avec lequel l’équipe pouvait travailler.
Vint ensuite la tâche de vérifier que les publications portaient bien sur des incidents haineux. L’équipe a développé un outil de traitement automatique du langage naturel pour l’aider à passer au crible des milliers de publications afin de trouver celles qui étaient pertinentes pour le projet. Après l’application de leur modèle d’apprentissage automatique entraîné, les publications étaient ensuite vérifiées par un humain pour augmenter encore la précision.
En 2021, TAAF a également co‑rédigé le Documenting Anti-AAPI Hate Codebook avec la coalition Stop AAPI Hate. Cette ressource comprend des normes et pratiques préliminaires pour la collecte de données communautaires, qui ont aidé l’équipe à classifier les incidents que les gens partageaient sur X.
À partir de là, le défi suivant consistait à présenter ces données d’une manière facilement assimilable. TAAF a créé un outil de visualisation de données, Decoding Hate, qui affiche leur vaste volume de données de manière interactive. Avec l’aide d’un studio de visualisation de données, ils ont pu prendre les données X annotées et transformer des milliers de publications en récits riches en enseignements qui révèlent la vérité sur ce qui se passait au sein des communautés AAPI.