”该文件有Unicode格式的字符,当文件保存为ANSI编码的文本时,该字符将丢失“这句话是什么意思?


Unicode和ANSI是两种不同的字符编码方式。Unicode(统一码、万国码、单一码)使用猜碰绝全16位元字元集吵坦来表示字符,而ANSI编码通常使用 0x80~0xFF 范围的 2 个字节(8位)来表示 1 个字符。对于字符来说ANSI以单字节存放英文字符,以双字节存放中文等字符,而Unicode下,英文和中文的字符都以双字节存放。有些Unicode字符无法用ANSI编码穗姿来表示,因此文件中含有Unicode格式的字符保存为ANSI编码的文本时,该Unicode字符将丢失或被错误表示。这样文本保存以后,再次打开将会发现里面少了一些内容或是会出现乱码。