배경
문자 정의
- 첫 번째 범위는 Latin-1 코드 페이지 전반의 문자를 포함합니다 (U+0000 - U+10FF).
- 두 번째 범위는 Zero Width Joiner(이모지 및 기타 글리프 결합에 사용됨)를 포함한 일반 구두점을 포괄합니다 (U+2000-U+200D).
- 세 번째 범위는 Unicode 방향 표식인 U+200E 및 U+200F를 제외한 일반 구두점입니다 (U+2010-U+201F).
- 마지막 범위는 따옴표 문자 범위를 포함합니다 (U+2032-U+2037).
| 표시된 문자 | 길이 | 설명 | Unicode 시퀀스 |
|---|---|---|---|
| a | 1 | 라틴 소문자 a | U+0061 |
| á | 1 | 악센트가 있는 라틴 소문자 a | U+00E1 |
| ӑ | 1 | 브레브가 있는 키릴 소문자 a | U+04D1 |
| Ồ | 1 | 서컴플렉스와 악센트가 있는 라틴 문자 o | U+1ED2 |
이모지
중국어/일본어/한국어 글리프
엔터티 객체
transformedURLLength 매개변수로 정의됨을 의미합니다. 트윗 내 URL의 현재 길이는 실제 URL이 더 짧더라도 23자로 계산됩니다.
답글: 답글 트윗 시작 부분에 자동으로 채워지는 @이름은 글자 수 제한에 포함되지 않습니다. 새로 작성하는 비-답글 트윗이 @멘션으로 시작하는 경우에는 포함되며, 사용자가 트윗 본문에 명시적으로 추가한 @멘션도 포함됩니다.
미디어: 공식 클라이언트에서 게시된 경우 pic.x.com URL로 표시되는, 트윗에 첨부된 미디어는 글자 수 0으로 계산됩니다.
엔터티 객체에 대한 자세한 내용은 개발자 문서를 참고하세요.
X 문자 인코딩
| café | 0x63 0x61 0x66 0xC3 0xA9 | ”é” 문자, 즉 “조합된 문자(composed character)”를 사용 |
| café | 0x63 0x61 0x66 0x65 0xCC 0x81 | 결합 분음 부호를 사용하여 “e” 위에 겹침 |