▷ Unicode控制字符

主条目:標籤 (Unicode區段)
Unicode以前定义了标签,包含了128个字符表示语言标签,但现在已经过时了。这些字符实际上镜像了128个ASCII字符。用于表示随后的文本属于IETF語言標籤(BCP 47)所指的特定语言。例如,表示随后文本使用美国英语(en-us),用字符串开始为Language Tag character(U+E0001)后跟序列:Tag Small Letter e(U+E0065)、Tag Small Letter n(U+E006E)、Tag Hyphen-minus(U+E002D)、Tag Small Letter u(U+E0075)、Tag Small Letter s(U+E0073)。
这种语言标签自身不会被显示。但可提供用于文本处理的信息。例如,中日韩统一汉字的文本,指明是韩语而非日文,可以把一些字符用韩语特有的字形来表示。另一个例子,把数字0‐9用语言特定的字形表示。
语言标记字符U+E0001、U+E0020‐U+E007E、U+E007F 已经被Unicode 5.1(2008)宣布过时,不再作为语言标记使用。[1]
Unicode 8.0(2015)宣布U+E0020‐U+E007E不再是过时,用于未来表示除了语言标签以外的的其他用途。[2](U+E0001 LANGUAGE TAG与U+E007F CANCEL TAG仍然过时)。