ISO-10646-UCS-4 | ISO 10646 |
31位编码空间的通用字符集,以 ISO/IEC 10646 标准化为 UCS-4。
它和最新的 Unicode 代码映射表保持同步。
|
如果在编码转化程序中使用了这个名字,转换器将尝试识别前缀的 BOM头(字节顺序标记),即表示后续字节的字节序。
|
ISO-10646-UCS-4 | UCS-4 |
参见以上。
|
和 UCS-4 相比较,字符串总是设为大端序(big endian)的形式。
|
ISO-10646-UCS-4 | UCS-4 |
参见以上。
|
和 UCS-4 相比较,字符串总是设为小端序(little endian)的形式。
|
ISO-10646-UCS-2 | UCS-2 |
16位编码空间的通用字符集,以 ISO/IEC 10646 标准化为 UCS-2。它和最新的 Unicode 代码映射表保持同步。
|
如果在编码转化程序中使用了这个名字,转换器将尝试识别前缀的 BOM头(字节顺序标记),即表示后续字节的字节序。
|
ISO-10646-UCS-2 | UCS-2 |
参见以上。
|
和 UCS-2 相比较,字符串总是设为大端序(big endian)的形式。
|
ISO-10646-UCS-2 | UCS-2 |
参见以上。
|
和 UCS-2 相比较,字符串总是设为小端序(little endian)的形式。
|
UTF-32 | Unicode |
32 位单位宽度的 Unicode 转换格式,涉及到了 Unicode 字符集标准。该编码方案和 UCS-4 没有完全相同,因为 Unicode 编码空间限制为 21 位的值。
|
如果在编码转化程序中使用了这个名字,转换器将尝试识别前缀的 BOM头(字节顺序标记),即表示后续字节的字节序。
|
UTF-32BE | Unicode | 参见以上 |
和 UTF-32 相比较,字符串总是设为大端序(big endian)的形式。
|
UTF-32LE | Unicode | 参见以上 |
和 UTF-32 相比较,字符串总是设为小端序(little endian)的形式。
|
UTF-16 | Unicode |
16 位单位宽度的 Unicode 转换格式。值得一记的是,UTF-16 的规格不再和 UCS-2 一样,
因为 Unicode 2.0 引入了代理机制(surrogate mechanism),UTF-16 现在指向了 21 位的编码空间。
|
如果在编码转化程序中使用了这个名字,转换器将尝试识别前缀的 BOM头(字节顺序标记),即表示后续字节的字节序。
|
UTF-16BE | Unicode |
参见以上。
|
和 UTF-16 相比较,字符串总是设为大端序(big endian)的形式。
|
UTF-16LE | Unicode |
参见以上。
|
和 UTF-16 相比较,字符串总是设为小端序(little endian)的形式。
|
UTF-8 | Unicode / UCS |
8 位单位宽度的 Unicode 转换格式。
| none |
UTF-7 | Unicode |
一种邮件安全的 Unicode 转换格式,规格是 » RFC2152。
| none |
(none) | Unicode |
UTF-7 的一种变体,其规格在 » IMAP 协议 中用到了。
| none |
US-ASCII (首选 MIME 名称) / iso-ir-6 / ANSI_X3.4-1986 /
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
| ASCII / ISO 646 |
美国标准代码(American Standard Code)是一种常用的 7-bit 信息交换编码。同样,标准化为 ISO 646 国际标准。
| (none) |
EUC-JP (首选 MIME 名称) /
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
US-ASCII / JIS X0201:1997 (半角假名部分) /
JIS X0208:1990 / JIS X0212:1990 的复合
|
就像你所看到的,名字来源于扩展 Extended UNIX Code Packed Format for Japanese 的缩写,该编码常用于 UNIX 或类似平台。原始编码方案 Extended UNIX Code 基于 ISO 2022 而设计。
|
EUC-JP 涉及的字符集和 IBM932 / CP932 是不一样的,后者使用于 OS/2? 和 Microsoft? Windows?。
这些平台上的信息交换,使用 EUCJP-WIN 来代替。
|
Shift_JIS (首选 MIME 名称) / MS_Kanji / csShift_JIS | JIS X0201:1997 / JIS X0208:1997 的复合 |
80 年代初,个人日文文字处理软件进入了市场之时,为了兼容传统编码方案 JIS X 0201:1976,开发了 Shift_JIS。
根据 IANA 对 Shift_JIS 编码集的定义,和 IBM932 / CP932 稍有不同。但 "SJIS"、"Shift_JIS" 的名称常被错误得指向这些编码集。
| 要使用 CP932,使用 SJIS-WIN 作为替代。 |
(none) |
JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的复合
|
虽然此 "encoding" 使用了 EUC-JP 同样的方案,一些字符集有所不同。
也就是说,一些编码映射到了和 EUC-JP 不同的字符。
| none |
Windows-31J / csWindows31J |
JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的符合
|
虽然此 "encoding" 使用了 Shift_JIS 同样的方案,一些字符集有所不同。
也就是说,一些编码映射到了和 Shift_JIS 不同的字符。
| (none) |
ISO-2022-JP (首选 MIME 名称) / csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
| » RFC1468 | (none) |
JIS | |
|
|
ISO-8859-1 | |
|
|
ISO-8859-2 | |
|
|
ISO-8859-3 | |
|
|
ISO-8859-4 | |
|
|
ISO-8859-5 | |
|
|
ISO-8859-6 | |
|
|
ISO-8859-7 | |
|
|
ISO-8859-8 | |
|
|
ISO-8859-9 | |
|
|
ISO-8859-10 | |
|
|
ISO-8859-13 | |
|
|
ISO-8859-14 | |
|
|
ISO-8859-15 | |
|
|
byte2be | |
|
|
byte2le | |
|
|
byte4be | |
|
|
byte4le | |
|
|
BASE64 | |
|
|
HTML-ENTITIES | |
|
|
7bit | |
|
|
8bit | |
|
|
EUC-CN | |
|
|
CP936 | |
|
|
HZ | |
|
|
EUC-TW | |
|
|
CP950 | |
|
|
BIG-5 | |
|
|
EUC-KR | |
|
|
UHC (CP949) | |
|
|
ISO-2022-KR | |
|
|
Windows-1251 (CP1251) | |
|
|
Windows-1252 (CP1252) | |
|
|
CP866 (IBM866) | |
|
|
KOI8-R | |
|
|