메인 콘텐츠로 건너뛰기
주석은 게시물 콘텐츠에 대한 의미론적 메타데이터를 제공합니다. X는 게시물을 분석하여 엔터티(사람, 장소, 상품)와 컨텍스트(주제, 도메인)를 식별해, 여러분이 콘텐츠를 이해하고 필터링하는 데 도움을 줍니다.

어노테이션 유형

개체 주석

개체명 인식(NER)은 게시물 텍스트에서 특정 언급을 식별합니다.
TypeExamples
사람Barack Obama, Elon Musk
장소San Francisco, Japan
제품iPhone, ChatGPT
조직NASA, Google
기타Super Bowl, Diabetes
개체 주석에는 신뢰도 점수와 텍스트 내 위치 정보가 포함됩니다.

컨텍스트 주석

포스트를 주제와 도메인별로 분류하는 의미 분석:
  • 도메인: 상위 범주 (스포츠, 엔터테인먼트, 기술)
  • 엔티티: 도메인 내의 구체적인 주제 (NBA, 마블 영화, AI)
컨텍스트 주석은 키워드에 의존하지 않고 포스트를 필터링하고 분류하는 데 도움이 됩니다.

애노테이션 요청

tweet.fieldscontext_annotationsentities를 추가하세요:
curl "https://api.x.com/2/tweets/1234567890?tweet.fields=context_annotations,entities" \
  -H "Authorization: Bearer $TOKEN"

응답 구조

{
  "data": {
    "id": "1234567890",
    "text": "Just saw the new Marvel movie - it was amazing!",
    "entities": {
      "annotations": [
        {
          "start": 17,
          "end": 22,
          "probability": 0.9234,
          "type": "Organization",
          "normalized_text": "Marvel"
        }
      ]
    },
    "context_annotations": [
      {
        "domain": {
          "id": "86",
          "name": "Movie",
          "description": "A film"
        },
        "entity": {
          "id": "1234567890",
          "name": "Marvel Cinematic Universe"
        }
      },
      {
        "domain": {
          "id": "65",
          "name": "Interests and Hobbies Vertical"
        },
        "entity": {
          "id": "781974596752842752",
          "name": "Entertainment"
        }
      }
    ]
  }
}

엔티티 주석 필드

필드설명
start텍스트에서의 시작 위치
end텍스트에서의 끝 위치
probability신뢰도 점수(0-1)
type엔티티 유형(Person, Place 등)
normalized_text정규화된 엔티티 이름

컨텍스트 도메인

X는 게시물을 분류하기 위해 80개 이상의 도메인을 사용합니다. 일반적인 도메인은 다음과 같습니다.
ID도메인
3TV 프로그램
4TV 에피소드
54음악가
56배우
86영화
91팟캐스트
131번 도메인(Unified Twitter Taxonomy)은 플랫폼에서 이용자가 볼 수 있는 X의 Topics 기능의 기반이 됩니다.

필터에서 annotations 활용하기

검색 및 필터링 스트림

Context annotation 엔티티 id로 포스트를 필터링합니다:
# 특정 엔티티에 관한 포스트
context:86.1234567890

# 특정 도메인 내 포스트
context:86.*

실제 예시

# Posts about the NBA
query=context:26.852137520

# Apple 제품에 관한 포스트
query=context:47.10026792024

# Posts about movies
query=context:86.*

언어 지원

어노테이션(Annotations)은 여러 언어를 지원합니다:
언어지원 수준
English최고
Japanese높음
Spanish높음
Portuguese중간
French중간
Hindi중간
지원 수준은 도메인과 시장에 따라 달라집니다.

중요 참고 사항

모든 게시물이 애노테이션되는 것은 아닙니다. 애노테이션 적용 범위는 다음에 따라 달라집니다:
  • 언어 지원 여부
  • X 분류 체계에서의 토픽 범위
  • 게시물 텍스트의 의미적 풍부함
  • 애노테이션은 소급 적용되지 않으며, 엔티티가 추적될 때만 적용됩니다
  • 동일한 엔티티가 여러 도메인에 나타날 수 있습니다 (예: 유명인은 Person이자 Actor일 수 있음)
  • 엔티티 id는 도메인 간에 안정적으로 유지됩니다

리소스

엔터티 탐색기

주석을 발견하고 살펴볼 수 있는 대화형 도구입니다.

컨텍스트 엔터티 리스트

사용 가능한 컨텍스트 주석 엔터티 목록이 담긴 CSV입니다.