Les annotations fournissent des métadonnées sémantiques sur le contenu des publications. X analyse les publications pour identifier les entités (personnes, lieux, produits) et le contexte (sujets, domaines), afin de vous aider à mieux comprendre et filtrer le contenu.
La reconnaissance d’entités nommées (NER) repère des mentions spécifiques dans le texte d’une publication :
Type Exemples Person Barack Obama, Elon Musk Place San Francisco, Japon Product iPhone, ChatGPT Organization NASA, Google Other Super Bowl, Diabète
Les annotations d’entités comprennent un score de confiance et la position dans le texte.
Analyse sémantique permettant de classer les publications par sujet et par domaine :
Domaine : Catégorie générale (Sports, Divertissement, Technologie)
Entité : Sujet spécifique au sein d’un domaine (NBA, films Marvel, IA)
Les annotations de contexte aident à filtrer et à catégoriser les publications sans s’appuyer sur des mots-clés.
Ajoutez context_annotations et entities à vos tweet.fields :
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
-H "Authorization: Bearer $TOKEN "
{
"data" : {
"id" : "1234567890" ,
"text" : "Just saw the new Marvel movie - it was amazing!" ,
"entities" : {
"annotations" : [
{
"start" : 17 ,
"end" : 22 ,
"probability" : 0.9234 ,
"type" : "Organization" ,
"normalized_text" : "Marvel"
}
]
},
"context_annotations" : [
{
"domain" : {
"id" : "86" ,
"name" : "Movie" ,
"description" : "Un film"
},
"entity" : {
"id" : "1234567890" ,
"name" : "Marvel Cinematic Universe"
}
},
{
"domain" : {
"id" : "65" ,
"name" : "Interests and Hobbies Vertical"
},
"entity" : {
"id" : "781974596752842752" ,
"name" : "Entertainment"
}
}
]
}
}
Champs d’annotation d’entités
Champ Description startPosition de début dans le texte endPosition de fin dans le texte probabilityScore de confiance (0-1) typeType d’entité (Person, Place, etc.) normalized_textNom d’entité normalisé
X utilise plus de 80 domaines pour catégoriser les Publications. Les domaines courants incluent :
Divertissement
Sports
Business et technologie
Autre
ID Domaine 3 Séries TV 4 Épisodes TV 54 Musicien 56 Acteur 86 Film 91 Podcast
ID Domaine 6 Événements sportifs 11 Sport 12 Équipe sportive 26 Ligue sportive 60 Athlète 93 Entraîneur
ID Domaine 45 Secteur de marque 46 Catégorie de marque 47 Marque 48 Produit 165 Technologie 166 Actions
ID Domaine 10 Personne 13 Lieu 29 Événements 35 Politiciens 119 Jour férié 131 Unified Twitter Taxonomy
Le domaine 131 (Unified Twitter Taxonomy) alimente la fonctionnalité Thèmes de X, visible par les utilisateurs sur la plateforme.
Utiliser les annotations dans les filtres
Filtrer les Publications par ID d’entité d’annotation de contexte :
# Publications concernant une entité spécifique
context:86.1234567890
# Publications dans un domaine spécifique
context:86.*
# Posts about the NBA
query = context:26.852137520
# Publications à propos des produits Apple
query = context:47.10026792024
# Posts about movies
query = context:86.*
Prise en charge des langues
Les annotations sont disponibles pour plusieurs langues :
Langue Couverture Anglais Maximale Japonais Élevée Espagnol Élevée Portugais Moyenne Français Moyenne Hindi Moyenne
La couverture varie selon les domaines et les marchés.
Toutes les publications ne sont pas annotées. La couverture des annotations dépend de :
La prise en charge linguistique
La couverture des sujets dans la taxonomie de X
La richesse sémantique du texte de la publication
Les annotations ne sont pas rétroactives — elles ne sont appliquées que lorsque les entités sont suivies
La même entité peut apparaître dans plusieurs domaines (par exemple, une célébrité est à la fois Person et Actor)
Les id d’entité restent stables d’un domaine à l’autre
Explorateur d’entités Outil interactif pour découvrir les annotations.
Liste d’entités de contexte CSV des entités d’annotation contextuelle disponibles.