मुख्य सामग्री पर जाएं
एनोटेशन पोस्ट सामग्री के बारे में सिमैंटिक मेटाडेटा प्रदान करते हैं। X, एंटिटियों (लोग, स्थान, उत्पाद) और संदर्भ (विषय, डोमेन) की पहचान करने के लिए पोस्ट्स का विश्लेषण करता है, ताकि आपको सामग्री को समझने और फ़िल्टर करने में मदद मिल सके।

एनोटेशन के प्रकार

एंटिटी एनोटेशन

नामित एंटिटी पहचान (NER) पोस्ट के टेक्स्ट में विशिष्ट उल्लेखों की पहचान करती है:
TypeExamples
PersonBarack Obama, Elon Musk
PlaceSan Francisco, Japan
ProductiPhone, ChatGPT
OrganizationNASA, Google
OtherSuper Bowl, Diabetes
एंटिटी एनोटेशन में एक कॉन्फिडेंस स्कोर और टेक्स्ट में उसकी स्थिति शामिल होती है।

संदर्भ एनोटेशन

विषय और डोमेन के आधार पर पोस्ट्स को वर्गीकृत करने वाला अर्थगत विश्लेषण:
  • डोमेन: व्यापक श्रेणी (खेल, मनोरंजन, प्रौद्योगिकी)
  • एंटिटी: डोमेन के भीतर का विशिष्ट विषय (NBA, Marvel Movies, AI)
संदर्भ एनोटेशन, कीवर्ड्स पर निर्भर हुए बिना, पोस्ट्स को फ़िल्टर और वर्गीकृत करने में मदद करते हैं।

एनोटेशन का अनुरोध

अपने tweet.fields में context_annotations और entities जोड़ें:
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
  -H "Authorization: Bearer $TOKEN"

रिस्पॉन्स संरचना

{
  "data": {
    "id": "1234567890",
    "text": "Just saw the new Marvel movie - it was amazing!",
    "entities": {
      "annotations": [
        {
          "start": 17,
          "end": 22,
          "probability": 0.9234,
          "type": "Organization",
          "normalized_text": "Marvel"
        }
      ]
    },
    "context_annotations": [
      {
        "domain": {
          "id": "86",
          "name": "Movie",
          "description": "A film"
        },
        "entity": {
          "id": "1234567890",
          "name": "Marvel Cinematic Universe"
        }
      },
      {
        "domain": {
          "id": "65",
          "name": "Interests and Hobbies Vertical"
        },
        "entity": {
          "id": "781974596752842752",
          "name": "Entertainment"
        }
      }
    ]
  }
}

एंटिटी एनोटेशन फ़ील्ड्स

FieldDescription
startपाठ में प्रारंभ स्थिति
endपाठ में अंतिम स्थिति
probabilityविश्वसनीयता स्कोर (0-1)
typeएंटिटी type (Person, Place आदि)
normalized_textमानकीकृत एंटिटी नाम

संदर्भ डोमेन

X पोस्ट्स को वर्गीकृत करने के लिए 80+ डोमेन का उपयोग करता है। सामान्य डोमेन में शामिल हैं:
IDडोमेन
3टीवी शो
4टीवी एपिसोड
54संगीतकार
56अभिनेता
86फ़िल्म
91पॉडकास्ट
डोमेन 131 (Unified Twitter Taxonomy) X के Topics फ़ीचर को सक्षम बनाता है, जो प्लेटफ़ॉर्म पर उपयोगकर्ताओं को दिखाई देता है।

फ़िल्टर में एनोटेशन का उपयोग

खोज और फ़िल्टर्ड स्ट्रीम

संदर्भ एनोटेशन एंटिटी ID के आधार पर पोस्ट्स फ़िल्टर करें:
# किसी विशिष्ट entity के बारे में पोस्ट्स
context:86.1234567890

# किसी विशिष्ट domain में पोस्ट्स
context:86.*

व्यावहारिक उदाहरण

# NBA के बारे में पोस्ट्स
query=context:26.852137520

# Apple उत्पादों के बारे में पोस्ट्स
query=context:47.10026792024

# फ़िल्मों के बारे में पोस्ट्स
query=context:86.*

भाषा समर्थन

एनोटेशन कई भाषाओं में उपलब्ध हैं:
भाषाकवरेज
अंग्रेज़ीसर्वाधिक
जापानीउच्च
स्पेनिशउच्च
पुर्तगालीमध्यम
फ़्रेंचमध्यम
हिंदीमध्यम
कवरेज डोमेन और बाज़ार के अनुसार अलग-अलग हो सकती है।

महत्वपूर्ण नोट्स

सभी पोस्ट्स एनोटेटेड नहीं होते। एनोटेशन कवरेज इन बातों पर निर्भर करती है:
  • भाषा समर्थन
  • X की टैक्सोनॉमी में विषय कवरेज
  • पोस्ट के टेक्स्ट की अर्थगत समृद्धि
  • एनोटेशन पूर्वव्यापी नहीं होते—वे केवल तभी लागू किए जाते हैं जब एंटिटीज़ को ट्रैक किया जाता है
  • एक ही एंटिटी कई डोमेन्स में दिखाई दे सकती है (उदा., कोई सेलिब्रिटी Person और Actor दोनों हो सकता/सकती है)
  • एंटिटी IDs सभी डोमेन्स में स्थिर रहती हैं

संसाधन

एंटिटी एक्सप्लोरर

एनोटेशन खोजने के लिए एक इंटरैक्टिव टूल।

संदर्भ एंटिटी सूची

उपलब्ध संदर्भ एनोटेशन एंटिटी की CSV।