字节顺序标记
您在使用 Unicode 时另一个常出现的概念是字节顺序标记。BOM 用于指示处理器如何将连续文本置于字节序列中。如果将最不重要的字节置于初始位置,这称为 “little-endian”;如果将最重要的字节置于初始位置,此方法称为 “big-endian”。BOM 也可用作识别文本文件编码的参考。例如,记事本根据保存文件时所用的编码,将 BOM 添加到每个文件的开头。此签名将允许记事本在稍后重新打开该文件。表 2 显示了各种编码的字节顺序标记。UTF-8 BOM 标识编码格式而非文档的 BOM – 因为每个字符由一个字节序列表示。
![]() |
表 2:特定编码的字节顺序标记 (U+FEFF) 的二进制表示。 |
近期评论