背景
字符的定义
- 第一范围涵盖 Latin-1 代码页中的字符(U+0000 - U+10FF)。
- 第二范围是通用标点,直到并包含零宽连接符(用于组合表情符号和其他字形)(U+2000 - U+200D)。
- 第三范围是通用标点,但不包括 U+200E 和 U+200F,这两个是 Unicode 方向性标记(U+2010 - U+201F)。
- 最后一范围涵盖引号(U+2032 - U+2037)。
| 显示字符 | 长度 | 描述 | Unicode 序列 |
|---|---|---|---|
| a | 1 | 拉丁小写字母 a | U+0061 |
| á | 1 | 拉丁小写字母 a(带尖音符) | U+00E1 |
| ӑ | 1 | 西里尔小写字母 a(带短音符) | U+04D1 |
| Ồ | 1 | 拉丁大写字母 O(带抑扬符和尖音符) | U+1ED2 |
表情符号
中文 / 日文 / 韩文字形
实体对象
transformedURLLength 参数定义。目前 Tweet 中的 URL 统一计为 23 个字符,即使其实际长度更短。
回复:在回复 Tweet 开头自动填入的 @名称 不计入字符上限。新发布的非回复 Tweet 若以 @提及 开头会计入,用户在 Tweet 正文中主动添加的 @提及 也同样计入。
媒体:附加到 Tweet 的媒体(若由官方客户端发布,将以 pic.x.com URL 呈现)计为 0 个字符。
有关实体对象的更多信息,请参阅开发者文档。
X 字符编码
| café | 0x63 0x61 0x66 0xC3 0xA9 | 使用“é”字符,即合成字符(composed character)。 |
| café | 0x63 0x61 0x66 0x65 0xCC 0x81 | 使用组合变音符(combining diacritical),叠加在“e”上。 |