背景
文字の定義
- 最初の範囲は、Latin-1 コードページ全体の文字を対象とします(U+0000〜U+10FF)。
- 2 番目の範囲は、Zero Width Joiner(絵文字やその他のグリフの結合に使用)を含む一般的な句読点です(U+2000〜U+200D)。
- 3 番目の範囲は、Unicode の双方向制御記号である U+200E および U+200F を除く一般的な句読点です(U+2010〜U+201F)。
- 最後の範囲は、引用記号を対象とします(U+2032〜U+2037)。
表示される文字 | 長さ | 説明 | Unicode シーケンス |
---|---|---|---|
a | 1 | ラテン小文字 a | U+0061 |
á | 1 | アキュート付きラテン小文字 a | U+00E1 |
ӑ | 1 | ブリーブ付きキリル小文字 a | U+04D1 |
Ồ | 1 | サーカムフレックスとアキュート付きラテン小文字 o | U+1ED2 |
絵文字
表示される絵文字 | 長さ | 説明 | Unicode シーケンス |
---|---|---|---|
👾 | 2 | 既知の絵文字の既定の長さ | — |
🙋🏽 | 2 | 肌の色調修飾子付きの絵文字 | 🙋 U+1F64B, 🏽 U+1F3FD |
👨🎤 | 2 | 結合用グリフ(ゼロ幅接合子)を用いる絵文字シーケンス | 👨 U+1F468, U+200D, 🎤 U+1F3A4 |
👨👩👧👦 | 2 | 複数の結合用グリフ(ゼロ幅接合子)を用いる絵文字シーケンス | 👨 U+1F468, U+200D, 👩 U+1F469, U+200D, 👧 U+1F467, U+200D, 👦 U+1F466 |
中国語 / 日本語 / 韓国語の文字
エンティティオブジェクト
transformedURLLength
パラメータで定義されることを意味します。Tweet 内の URL の現在の長さは 23 文字で、通常の URL がそれより短い場合でも同様です。
返信: 返信の Tweet の冒頭に自動入力される @name は文字数制限に含まれません。@メンションで始まる新規の返信ではない Tweet はカウント対象であり、ユーザーが Tweet 本文に明示的に追加した @メンションもカウントされます。
メディア: 公式クライアントから投稿された場合、pic.x.com の URL として表される、Tweet に添付されたメディアは文字数 0 として扱われます。
エンティティオブジェクトの詳細については、開発者向けドキュメントをご覧ください。
X の文字エンコーディング
café | 0x63 0x61 0x66 0xC3 0xA9 | 「é」文字、いわゆる「合成済み文字」を使用。 |
café | 0x63 0x61 0x66 0x65 0xCC 0x81 | 結合分音記号を用いて「e」に重ねる方式。 |