Antecedentes
Definición de un carácter
- El primer rango abarca caracteres de las páginas de códigos Latin-1 (U+0000 - U+10FF).
- El segundo rango es puntuación general hasta el Zero Width Joiner inclusive (usado para combinar emoji y otros glifos) (U+2000-U+200D).
- El tercer rango es puntuación general, excluyendo U+200E y U+200F, que son marcas direccionales de Unicode (U+2010-U+201F).
- El último rango abarca las comillas (U+2032-U+2037).
| Carácter mostrado | Longitud | Descripción | Secuencia Unicode |
|---|---|---|---|
| a | 1 | Letra latina minúscula a | U+0061 |
| á | 1 | Letra latina minúscula a con acento agudo | U+00E1 |
| ӑ | 1 | Letra cirílica minúscula a con breve | U+04D1 |
| Ồ | 1 | Letra latina mayúscula o con circunflejo y acento agudo | U+1ED2 |
Emojis
| Emoji mostrado | Longitud | Descripción | Secuencia Unicode |
|---|---|---|---|
| 👾 | 2 | Longitud predeterminada de emoji conocidos | — |
| 🙋🏽 | 2 | Emoji con modificador de tono de piel | 🙋 U+1F64B, 🏽 U+1F3FD |
| 👨🎤 | 2 | Secuencia de emoji que usa glifo combinador (unidor de ancho cero) | 👨 U+1F468, U+200D, 🎤 U+1F3A4 |
| 👨👩👧👦 | 2 | Secuencia de emoji que usa múltiples glifos combinadores (unidores de ancho cero) | 👨 U+1F468, U+200D, 👩 U+1F469, U+200D, 👧 U+1F467, U+200D, 👦 U+1F466 |
Glifos chinos/japoneses/coreanos
Objetos de entidad
transformedURLLength en el archivo de configuración de twitter-text. La longitud actual de una URL en un Tweet es de 23 caracteres, incluso si la URL normalmente sería más corta.
Respuestas: los @nombres que se autocompletan al inicio de un Tweet de respuesta no cuentan para el límite de caracteres. Los Tweets nuevos que no son respuesta y que comienzan con una @mención sí cuentan, al igual que las @menciones agregadas explícitamente por el usuario en el cuerpo del Tweet.
Multimedia: el contenido multimedia adjunto a un Tweet, representado como una URL de pic.x.com si se publica desde un cliente oficial, cuenta como 0 caracteres.
Para más información sobre los Objetos de entidad, consulta la documentación para desarrolladores.
Codificación de caracteres de X
| café | 0x63 0x61 0x66 0xC3 0xA9 | Usando el carácter “é”, el “carácter compuesto”. |
| café | 0x63 0x61 0x66 0x65 0xCC 0x81 | Usando el diacrítico combinante, que se superpone a la “e”. |