アノテーションは、ポストの内容に関する意味的なメタデータを提供します。X はポストを解析して、エンティティ(人物、場所、製品)やコンテキスト(トピック、ドメイン)を特定し、コンテンツの理解やフィルタリングを支援します。
固有表現認識(NER)は、ポスト本文中の特定の対象を識別します。
| Type | 例 |
|---|
| Person | Barack Obama、Elon Musk |
| Place | San Francisco、日本 |
| Product | iPhone、ChatGPT |
| Organization | NASA、Google |
| Other | Super Bowl、Diabetes |
エンティティアノテーションには、各エンティティの信頼度スコアとテキスト内での位置が含まれます。
投稿をトピックやドメインごとに分類するセマンティック解析です:
- ドメイン: 広いカテゴリ (Sports、Entertainment、Technology)
- エンティティ: ドメイン内の特定のトピック (NBA、Marvel Movies、AI)
コンテキストアノテーションを使用すると、キーワードに依存することなく投稿をフィルタリングおよび分類できます。
tweet.fields に context_annotations と entities を追加します:
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
-H "Authorization: Bearer $TOKEN"
{
"data": {
"id": "1234567890",
"text": "Just saw the new Marvel movie - it was amazing!",
"entities": {
"annotations": [
{
"start": 17,
"end": 22,
"probability": 0.9234,
"type": "Organization",
"normalized_text": "Marvel"
}
]
},
"context_annotations": [
{
"domain": {
"id": "86",
"name": "Movie",
"description": "A film"
},
"entity": {
"id": "1234567890",
"name": "Marvel Cinematic Universe"
}
},
{
"domain": {
"id": "65",
"name": "Interests and Hobbies Vertical"
},
"entity": {
"id": "781974596752842752",
"name": "Entertainment"
}
}
]
}
}
| Field | Description |
|---|
start | テキスト内の開始位置 |
end | テキスト内の終了位置 |
probability | 信頼度スコア (0〜1) |
type | エンティティの種別 (Person、Place など) |
normalized_text | 正規化されたエンティティ名 |
X では、投稿を分類するために 80 個以上のドメインを使用しています。一般的なドメインには次のようなものがあります。
エンターテインメント
スポーツ
ビジネスとテクノロジー
その他
| ID | ドメイン |
|---|
| 3 | テレビ番組 |
| 4 | テレビエピソード |
| 54 | ミュージシャン |
| 56 | 俳優 |
| 86 | 映画 |
| 91 | ポッドキャスト |
| ID | ドメイン |
|---|
| 6 | スポーツイベント |
| 11 | スポーツ |
| 12 | スポーツチーム |
| 26 | スポーツリーグ |
| 60 | アスリート |
| 93 | コーチ |
| ID | ドメイン |
|---|
| 45 | ブランドバーティカル |
| 46 | ブランドカテゴリ |
| 47 | ブランド |
| 48 | プロダクト |
| 165 | テクノロジー |
| 166 | 株式 |
| ID | ドメイン |
|---|
| 10 | 人物 |
| 13 | 場所 |
| 29 | イベント |
| 35 | 政治家 |
| 119 | 祝日 |
| 131 | Unified Twitter Taxonomy |
ドメイン 131(Unified Twitter Taxonomy)は、プラットフォーム上でユーザーに表示される X のトピック機能の基盤となっています。
コンテキスト注釈エンティティ ID で投稿をフィルターします。
# 特定のエンティティに関する投稿
context:86.1234567890
# Posts in a specific domain
context:86.*
# Posts about the NBA
query=context:26.852137520
# Apple製品に関する投稿
query=context:47.10026792024
# Posts about movies
query=context:86.*
アノテーションは複数の言語で利用できます。
| 言語 | 対応状況 |
|---|
| English | 最高 |
| Japanese | 高 |
| Spanish | 高 |
| Portuguese | 中 |
| French | 中 |
| Hindi | 中 |
対応状況はドメインや市場によって異なります。
すべての投稿にアノテーションが付与されているわけではありません。 アノテーションの付与範囲は次の要因に依存します:
- 対応している言語
- X のタクソノミーでカバーされているトピック
- 投稿本文の意味的な情報量
- アノテーションは遡及適用されません — エンティティがトラッキングされている場合にのみ付与されます
- 同じエンティティが複数のドメインに属することがあります(例: 有名人は Person と Actor の両方になり得る)
- エンティティの id はドメインをまたいでも変わりません
Entity Explorer
アノテーションを調査できるインタラクティブツールです。
Context Entity リスト
利用可能なコンテキストアノテーションエンティティの CSV ファイル。