Contexte
Définition d’un caractère
- La première plage couvre des caractères des jeux de codes Latin‑1 (U+0000 - U+10FF).
- La deuxième plage correspond à la ponctuation générale jusqu’au Zero Width Joiner inclus (utilisé pour combiner des émojis et d’autres glyphes) (U+2000-U+200D).
- La troisième plage correspond à la ponctuation générale à l’exception de U+200E et U+200F, qui sont des marques directionnelles Unicode (U+2010-U+201F).
- La dernière plage couvre les guillemets (U+2032-U+2037).
Caractère affiché | Longueur | Description | Séquence Unicode |
---|---|---|---|
a | 1 | Lettre minuscule latine a | U+0061 |
á | 1 | Lettre minuscule latine a avec accent aigu | U+00E1 |
ӑ | 1 | Lettre minuscule cyrillique a avec brève | U+04D1 |
Ồ | 1 | Lettre majuscule latine O avec accent circonflexe et accent aigu | U+1ED2 |
Emoji
Emoji affiché | Longueur | Description | Séquence Unicode |
---|---|---|---|
👾 | 2 | Longueur par défaut des emoji connus | — |
🙋🏽 | 2 | Emoji avec modificateur de teinte de peau | 🙋 U+1F64B, 🏽 U+1F3FD |
👨🎤 | 2 | Séquence d’emoji utilisant un glyphe de combinaison (jointure sans chasse) | 👨 U+1F468, U+200D, 🎤 U+1F3A4 |
👨👩👧👦 | 2 | Séquence d’emoji utilisant plusieurs glyphes de combinaison (jointures sans chasse) | 👨 U+1F468, U+200D, 👩 U+1F469, U+200D, 👧 U+1F467, U+200D, 👦 U+1F466 |
Glyphes chinois / japonais / coréens
Objets d’entité
transformedURLLength
dans le fichier de configuration twitter-text. La longueur actuelle d’une URL dans un Tweet est de 23 caractères, même si l’URL serait normalement plus courte.
Réponses : les @noms qui sont renseignés automatiquement au début d’un Tweet en réponse ne comptent pas dans la limite de caractères. Les nouveaux Tweets qui ne sont pas des réponses et qui commencent par une @mention compteront, tout comme les @mentions ajoutées explicitement par l’utilisateur dans le corps du Tweet.
Médias : les médias joints à un Tweet, représentés sous forme d’URL pic.x.com s’ils sont publiés depuis un client officiel, comptent pour 0 caractère.
Pour en savoir plus sur les objets d’entité, consultez la documentation développeur.
Encodage des caractères sur X
café | 0x63 0x61 0x66 0xC3 0xA9 | En utilisant le caractère « é », le « caractère composé ». |
café | 0x63 0x61 0x66 0x65 0xCC 0x81 | En utilisant le diacritique combinant, qui se superpose au « e » |