Hintergrund
Definition eines Zeichens
- Der erste Bereich umfasst Zeichen aus den Latin-1-Codepages (U+0000–U+10FF).
- Der zweite Bereich umfasst allgemeine Interpunktionszeichen bis einschließlich des Zero Width Joiner (zum Kombinieren von Emoji und anderen Glyphen) (U+2000–U+200D).
- Der dritte Bereich umfasst allgemeine Interpunktionszeichen, ausgenommen U+200E und U+200F, bei denen es sich um Unicode-Richtungszeichen handelt (U+2010–U+201F).
- Der letzte Bereich umfasst Anführungszeichen (U+2032–U+2037).
Angezeigtes Zeichen | Länge | Beschreibung | Unicode-Sequenz |
---|---|---|---|
a | 1 | Lateinischer Kleinbuchstabe a | U+0061 |
á | 1 | Lateinischer Kleinbuchstabe a mit Akut | U+00E1 |
ӑ | 1 | Kyrillischer Kleinbuchstabe a mit Breve | U+04D1 |
Ồ | 1 | Lateinischer Großbuchstabe O mit Zirkumflex und Akut | U+1ED2 |
Emojis
Angezeigtes Emoji | Länge | Beschreibung | Unicode-Sequenz |
---|---|---|---|
👾 | 2 | Standardlänge bekannter Emoji | — |
🙋🏽 | 2 | Emoji mit Hauttonmodifikator | 🙋 U+1F64B, 🏽 U+1F3FD |
👨🎤 | 2 | Emoji-Sequenz mit kombiniertem Glyph (Zero-Width-Joiner) | 👨 U+1F468, U+200D, 🎤 U+1F3A4 |
👨👩👧👦 | 2 | Emoji-Sequenz mit mehreren kombinierten Glyphen (Zero-Width-Joiners) | 👨 U+1F468, U+200D, 👩 U+1F469, U+200D, 👧 U+1F467, U+200D, 👦 U+1F466 |
Chinesische/Japanische/Koreanische Glyphen
Entitätsobjekte
transformedURLLength
in der twitter-text-Konfigurationsdatei definiert ist. Die aktuelle Länge einer URL in einem Tweet beträgt 23 Zeichen, selbst wenn die URL normalerweise kürzer wäre.
Antworten: @Handles, die am Anfang eines Antwort-Tweets automatisch eingefügt werden, zählen nicht zum Zeichenlimit. Neue Tweets ohne Bezug, die mit einer @Mention beginnen, werden gezählt; ebenso @Mentions, die vom Nutzer ausdrücklich im Text des Tweets hinzugefügt werden.
Medien: Medien, die an einen Tweet angehängt sind und bei Veröffentlichung über einen offiziellen Client als pic.x.com-URL dargestellt werden, zählen mit 0 Zeichen.
Weitere Informationen zu Entitätsobjekten finden Sie in der Entwicklerdokumentation.
X-Zeichenkodierung
café | 0x63 0x61 0x66 0xC3 0xA9 | Verwendung des Zeichens „é“, des „komponierten Zeichens“. |
café | 0x63 0x61 0x66 0x65 0xCC 0x81 | Verwendung des kombinierenden diakritischen Zeichens, das das „e“ überlagert |