주석은 게시물 콘텐츠에 대한 의미론적 메타데이터를 제공합니다. X는 게시물을 분석하여 엔터티(사람, 장소, 상품)와 컨텍스트(주제, 도메인)를 식별해, 여러분이 콘텐츠를 이해하고 필터링하는 데 도움을 줍니다.
개체명 인식(NER)은 게시물 텍스트에서 특정 언급을 식별합니다.
| Type | Examples |
|---|
| 사람 | Barack Obama, Elon Musk |
| 장소 | San Francisco, Japan |
| 제품 | iPhone, ChatGPT |
| 조직 | NASA, Google |
| 기타 | Super Bowl, Diabetes |
개체 주석에는 신뢰도 점수와 텍스트 내 위치 정보가 포함됩니다.
포스트를 주제와 도메인별로 분류하는 의미 분석:
- 도메인: 상위 범주 (스포츠, 엔터테인먼트, 기술)
- 엔티티: 도메인 내의 구체적인 주제 (NBA, 마블 영화, AI)
컨텍스트 주석은 키워드에 의존하지 않고 포스트를 필터링하고 분류하는 데 도움이 됩니다.
tweet.fields에 context_annotations와 entities를 추가하세요:
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
-H "Authorization: Bearer $TOKEN"
{
"data": {
"id": "1234567890",
"text": "Just saw the new Marvel movie - it was amazing!",
"entities": {
"annotations": [
{
"start": 17,
"end": 22,
"probability": 0.9234,
"type": "Organization",
"normalized_text": "Marvel"
}
]
},
"context_annotations": [
{
"domain": {
"id": "86",
"name": "Movie",
"description": "A film"
},
"entity": {
"id": "1234567890",
"name": "Marvel Cinematic Universe"
}
},
{
"domain": {
"id": "65",
"name": "Interests and Hobbies Vertical"
},
"entity": {
"id": "781974596752842752",
"name": "Entertainment"
}
}
]
}
}
| 필드 | 설명 |
|---|
start | 텍스트에서의 시작 위치 |
end | 텍스트에서의 끝 위치 |
probability | 신뢰도 점수(0-1) |
type | 엔티티 유형(Person, Place 등) |
normalized_text | 정규화된 엔티티 이름 |
X는 게시물을 분류하기 위해 80개 이상의 도메인을 사용합니다. 일반적인 도메인은 다음과 같습니다.
| ID | 도메인 |
|---|
| 3 | TV 프로그램 |
| 4 | TV 에피소드 |
| 54 | 음악가 |
| 56 | 배우 |
| 86 | 영화 |
| 91 | 팟캐스트 |
| ID | 도메인 |
|---|
| 6 | 스포츠 이벤트 |
| 11 | 스포츠 |
| 12 | 스포츠 팀 |
| 26 | 스포츠 리그 |
| 60 | 선수 |
| 93 | 코치 |
| ID | 도메인 |
|---|
| 45 | 브랜드 세부 분야 |
| 46 | 브랜드 카테고리 |
| 47 | 브랜드 |
| 48 | 제품 |
| 165 | 기술 |
| 166 | 주식 |
| ID | 도메인 |
|---|
| 10 | 사람 |
| 13 | 장소 |
| 29 | 이벤트 |
| 35 | 정치인 |
| 119 | 공휴일 |
| 131 | Unified Twitter Taxonomy |
131번 도메인(Unified Twitter Taxonomy)은 플랫폼에서 이용자가 볼 수 있는 X의 Topics 기능의 기반이 됩니다.
Context annotation 엔티티 id로 포스트를 필터링합니다:
# 특정 엔티티에 관한 포스트
context:86.1234567890
# 특정 도메인 내 포스트
context:86.*
# Posts about the NBA
query=context:26.852137520
# Apple 제품에 관한 포스트
query=context:47.10026792024
# Posts about movies
query=context:86.*
어노테이션(Annotations)은 여러 언어를 지원합니다:
| 언어 | 지원 수준 |
|---|
| English | 최고 |
| Japanese | 높음 |
| Spanish | 높음 |
| Portuguese | 중간 |
| French | 중간 |
| Hindi | 중간 |
지원 수준은 도메인과 시장에 따라 달라집니다.
모든 게시물이 애노테이션되는 것은 아닙니다. 애노테이션 적용 범위는 다음에 따라 달라집니다:
- 언어 지원 여부
- X 분류 체계에서의 토픽 범위
- 게시물 텍스트의 의미적 풍부함
- 애노테이션은 소급 적용되지 않으며, 엔티티가 추적될 때만 적용됩니다
- 동일한 엔티티가 여러 도메인에 나타날 수 있습니다 (예: 유명인은 Person이자 Actor일 수 있음)
- 엔티티 id는 도메인 간에 안정적으로 유지됩니다
엔터티 탐색기
주석을 발견하고 살펴볼 수 있는 대화형 도구입니다.
컨텍스트 엔터티 리스트
사용 가능한 컨텍스트 주석 엔터티 목록이 담긴 CSV입니다.