背景
文字の定義
- 最初の範囲は Latin-1 コードページ全体を対象とします (U+0000 - U+10FF)。
- 2 番目の範囲は、Zero Width Joiner(絵文字や他のグリフを結合するために使用)までを含む一般的な句読点です (U+2000-U+200D)。
- 3 番目の範囲は、Unicode の方向マークである U+200E と U+200F を除く一般的な句読点です (U+2010-U+201F)。
- 最後の範囲は引用符を対象とします (U+2032-U+2037)。
| 表示される文字 | 長さ | 説明 | Unicode シーケンス |
|---|---|---|---|
| a | 1 | ラテン小文字 a | U+0061 |
| á | 1 | ラテン小文字 a(アキュート付き) | U+00E1 |
| ӑ | 1 | キリル小文字 a(ブレーブ付き) | U+04D1 |
| Ồ | 1 | ラテン小文字 o(サーカムフレックスとアキュート付き) | U+1ED2 |
絵文字
中国語 / 日本語 / 韓国語のグリフ
エンティティオブジェクト
transformedURLLength パラメータで定義されることを意味します。Tweet 内の URL の現在の長さは 23 文字で、通常の URL がそれより短い場合でも同じです。
返信: 返信 Tweet の先頭に自動入力される @name は文字数制限にカウントされません。新規の非返信 Tweet が @メンションで始まる場合はカウントされ、ユーザーが Tweet の本文に明示的に追加した @メンションもカウントされます。
メディア: 公式クライアントから投稿された場合、pic.x.com の URL として表される Tweet 添付メディアは、文字数 0 として扱われます。
エンティティオブジェクトの詳細は、開発者向けドキュメントをご覧ください。
X の文字エンコーディング
| café | 0x63 0x61 0x66 0xC3 0xA9 | 「é」文字(合成済み文字)を使用 |
| café | 0x63 0x61 0x66 0x65 0xCC 0x81 | 合成用ダイアクリティカルマークを使用し、「e」に重ねる |