背景
字符的定义
- 第一个范围涵盖 Latin-1 代码页中的字符(U+0000 - U+10FF)。
- 第二个范围为一般标点,直至并包含零宽连接符(用于组合表情符号和其他字形)(U+2000-U+200D)。
- 第三个范围为一般标点,但不包含 U+200E 和 U+200F(Unicode 方向性标记)(U+2010-U+201F)。
- 最后一个范围涵盖引号(U+2032-U+2037)。
显示字符 | 长度 | 描述 | Unicode 序列 |
---|---|---|---|
a | 1 | 拉丁小写字母 a | U+0061 |
á | 1 | 带尖音符的拉丁小写字母 a | U+00E1 |
ӑ | 1 | 带短音符的西里尔小写字母 a | U+04D1 |
Ồ | 1 | 带抑扬符与尖音符的拉丁大写字母 O | U+1ED2 |
Emoji
显示的 Emoji | 长度 | 说明 | Unicode 序列 |
---|---|---|---|
👾 | 2 | 已知 Emoji 的默认长度 | — |
🙋🏽 | 2 | 带有肤色修饰符的 Emoji | 🙋 U+1F64B, 🏽 U+1F3FD |
👨🎤 | 2 | 使用组合字形(零宽连字器)的 Emoji 序列 | 👨 U+1F468, U+200D, 🎤 U+1F3A4 |
👨👩👧👦 | 2 | 使用多个组合字形(零宽连字器)的 Emoji 序列 | 👨 U+1F468, U+200D, 👩 U+1F469, U+200D, 👧 U+1F467, U+200D, 👦 U+1F466 |
中文 / 日文 / 韩文字形
实体对象
transformedURLLength
参数定义。当前在 Tweet 中,一个 URL 计为 23 个字符,即使该 URL 的实际长度更短。
Replies:在回复 Tweet 开头自动填充的 @name 不计入字符上限。以 @mention 开头的新非回复 Tweet 会计入,用户在 Tweet 正文中明确添加的 @mentions 也会计入。
Media:附加在 Tweet 上的媒体(若由官方客户端发布,会以 pic.x.com URL 表示)计为 0 个字符。
有关实体对象的更多信息,请参阅开发者文档。
X 字符编码
café | 0x63 0x61 0x66 0xC3 0xA9 | 使用“é”字符,即“预组字符”。 |
café | 0x63 0x61 0x66 0x65 0xCC 0x81 | 使用组合变音符号,叠加在“e”上。 |