Passer au contenu principal
Les annotations fournissent des métadonnées sémantiques sur le contenu des publications. X analyse les publications pour identifier les entités (personnes, lieux, produits) et le contexte (sujets, domaines), afin de vous aider à mieux comprendre et filtrer le contenu.

Types d’annotation

Annotations d’entités

La reconnaissance d’entités nommées (NER) repère des mentions spécifiques dans le texte d’une publication :
TypeExemples
PersonBarack Obama, Elon Musk
PlaceSan Francisco, Japon
ProductiPhone, ChatGPT
OrganizationNASA, Google
OtherSuper Bowl, Diabète
Les annotations d’entités comprennent un score de confiance et la position dans le texte.

Annotations de contexte

Analyse sémantique permettant de classer les publications par sujet et par domaine :
  • Domaine : Catégorie générale (Sports, Divertissement, Technologie)
  • Entité : Sujet spécifique au sein d’un domaine (NBA, films Marvel, IA)
Les annotations de contexte aident à filtrer et à catégoriser les publications sans s’appuyer sur des mots-clés.

Demande d’annotations

Ajoutez context_annotations et entities à vos tweet.fields :
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
  -H "Authorization: Bearer $TOKEN"

Structure de la réponse

{
  "data": {
    "id": "1234567890",
    "text": "Just saw the new Marvel movie - it was amazing!",
    "entities": {
      "annotations": [
        {
          "start": 17,
          "end": 22,
          "probability": 0.9234,
          "type": "Organization",
          "normalized_text": "Marvel"
        }
      ]
    },
    "context_annotations": [
      {
        "domain": {
          "id": "86",
          "name": "Movie",
          "description": "Un film"
        },
        "entity": {
          "id": "1234567890",
          "name": "Marvel Cinematic Universe"
        }
      },
      {
        "domain": {
          "id": "65",
          "name": "Interests and Hobbies Vertical"
        },
        "entity": {
          "id": "781974596752842752",
          "name": "Entertainment"
        }
      }
    ]
  }
}

Champs d’annotation d’entités

ChampDescription
startPosition de début dans le texte
endPosition de fin dans le texte
probabilityScore de confiance (0-1)
typeType d’entité (Person, Place, etc.)
normalized_textNom d’entité normalisé

Domaines de contexte

X utilise plus de 80 domaines pour catégoriser les Publications. Les domaines courants incluent :
IDDomaine
3Séries TV
4Épisodes TV
54Musicien
56Acteur
86Film
91Podcast
Le domaine 131 (Unified Twitter Taxonomy) alimente la fonctionnalité Thèmes de X, visible par les utilisateurs sur la plateforme.

Utiliser les annotations dans les filtres

Recherche et flux filtré

Filtrer les Publications par ID d’entité d’annotation de contexte :
# Publications concernant une entité spécifique
context:86.1234567890

# Publications dans un domaine spécifique
context:86.*

Exemples pratiques

# Posts about the NBA
query=context:26.852137520

# Publications à propos des produits Apple
query=context:47.10026792024

# Posts about movies
query=context:86.*

Prise en charge des langues

Les annotations sont disponibles pour plusieurs langues :
LangueCouverture
AnglaisMaximale
JaponaisÉlevée
EspagnolÉlevée
PortugaisMoyenne
FrançaisMoyenne
HindiMoyenne
La couverture varie selon les domaines et les marchés.

Notes importantes

Toutes les publications ne sont pas annotées. La couverture des annotations dépend de :
  • La prise en charge linguistique
  • La couverture des sujets dans la taxonomie de X
  • La richesse sémantique du texte de la publication
  • Les annotations ne sont pas rétroactives — elles ne sont appliquées que lorsque les entités sont suivies
  • La même entité peut apparaître dans plusieurs domaines (par exemple, une célébrité est à la fois Person et Actor)
  • Les id d’entité restent stables d’un domaine à l’autre

Ressources

Explorateur d’entités

Outil interactif pour découvrir les annotations.

Liste d’entités de contexte

CSV des entités d’annotation contextuelle disponibles.