एनोटेशन पोस्ट सामग्री के बारे में सिमैंटिक मेटाडेटा प्रदान करते हैं। X, एंटिटियों (लोग, स्थान, उत्पाद) और संदर्भ (विषय, डोमेन) की पहचान करने के लिए पोस्ट्स का विश्लेषण करता है, ताकि आपको सामग्री को समझने और फ़िल्टर करने में मदद मिल सके।
नामित एंटिटी पहचान (NER) पोस्ट के टेक्स्ट में विशिष्ट उल्लेखों की पहचान करती है:
Type Examples Person Barack Obama, Elon Musk Place San Francisco, Japan Product iPhone, ChatGPT Organization NASA, Google Other Super Bowl, Diabetes
एंटिटी एनोटेशन में एक कॉन्फिडेंस स्कोर और टेक्स्ट में उसकी स्थिति शामिल होती है।
विषय और डोमेन के आधार पर पोस्ट्स को वर्गीकृत करने वाला अर्थगत विश्लेषण:
डोमेन : व्यापक श्रेणी (खेल, मनोरंजन, प्रौद्योगिकी)
एंटिटी : डोमेन के भीतर का विशिष्ट विषय (NBA, Marvel Movies, AI)
संदर्भ एनोटेशन, कीवर्ड्स पर निर्भर हुए बिना, पोस्ट्स को फ़िल्टर और वर्गीकृत करने में मदद करते हैं।
अपने tweet.fields में context_annotations और entities जोड़ें:
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
-H "Authorization: Bearer $TOKEN "
{
"data" : {
"id" : "1234567890" ,
"text" : "Just saw the new Marvel movie - it was amazing!" ,
"entities" : {
"annotations" : [
{
"start" : 17 ,
"end" : 22 ,
"probability" : 0.9234 ,
"type" : "Organization" ,
"normalized_text" : "Marvel"
}
]
},
"context_annotations" : [
{
"domain" : {
"id" : "86" ,
"name" : "Movie" ,
"description" : "A film"
},
"entity" : {
"id" : "1234567890" ,
"name" : "Marvel Cinematic Universe"
}
},
{
"domain" : {
"id" : "65" ,
"name" : "Interests and Hobbies Vertical"
},
"entity" : {
"id" : "781974596752842752" ,
"name" : "Entertainment"
}
}
]
}
}
Field Description startपाठ में प्रारंभ स्थिति endपाठ में अंतिम स्थिति probabilityविश्वसनीयता स्कोर (0-1) typeएंटिटी type (Person, Place आदि) normalized_textमानकीकृत एंटिटी नाम
X पोस्ट्स को वर्गीकृत करने के लिए 80+ डोमेन का उपयोग करता है। सामान्य डोमेन में शामिल हैं:
मनोरंजन
खेल
व्यवसाय और तकनीक
अन्य
ID डोमेन 3 टीवी शो 4 टीवी एपिसोड 54 संगीतकार 56 अभिनेता 86 फ़िल्म 91 पॉडकास्ट
ID डोमेन 6 खेल आयोजन 11 खेल 12 खेल टीम 26 खेल लीग 60 खिलाड़ी 93 कोच
ID डोमेन 45 ब्रांड वर्टिकल 46 ब्रांड श्रेणी 47 ब्रांड 48 उत्पाद 165 प्रौद्योगिकी 166 स्टॉक्स
ID डोमेन 10 व्यक्ति 13 स्थान 29 आयोजन 35 राजनेता 119 अवकाश 131 Unified Twitter Taxonomy
डोमेन 131 (Unified Twitter Taxonomy) X के Topics फ़ीचर को सक्षम बनाता है, जो प्लेटफ़ॉर्म पर उपयोगकर्ताओं को दिखाई देता है।
फ़िल्टर में एनोटेशन का उपयोग
संदर्भ एनोटेशन एंटिटी ID के आधार पर पोस्ट्स फ़िल्टर करें:
# किसी विशिष्ट entity के बारे में पोस्ट्स
context:86.1234567890
# किसी विशिष्ट domain में पोस्ट्स
context:86.*
# NBA के बारे में पोस्ट्स
query = context:26.852137520
# Apple उत्पादों के बारे में पोस्ट्स
query = context:47.10026792024
# फ़िल्मों के बारे में पोस्ट्स
query = context:86.*
एनोटेशन कई भाषाओं में उपलब्ध हैं:
भाषा कवरेज अंग्रेज़ी सर्वाधिक जापानी उच्च स्पेनिश उच्च पुर्तगाली मध्यम फ़्रेंच मध्यम हिंदी मध्यम
कवरेज डोमेन और बाज़ार के अनुसार अलग-अलग हो सकती है।
सभी पोस्ट्स एनोटेटेड नहीं होते। एनोटेशन कवरेज इन बातों पर निर्भर करती है:
भाषा समर्थन
X की टैक्सोनॉमी में विषय कवरेज
पोस्ट के टेक्स्ट की अर्थगत समृद्धि
एनोटेशन पूर्वव्यापी नहीं होते—वे केवल तभी लागू किए जाते हैं जब एंटिटीज़ को ट्रैक किया जाता है
एक ही एंटिटी कई डोमेन्स में दिखाई दे सकती है (उदा., कोई सेलिब्रिटी Person और Actor दोनों हो सकता/सकती है)
एंटिटी IDs सभी डोमेन्स में स्थिर रहती हैं
एंटिटी एक्सप्लोरर एनोटेशन खोजने के लिए एक इंटरैक्टिव टूल।
संदर्भ एंटिटी सूची उपलब्ध संदर्भ एनोटेशन एंटिटी की CSV।