支持编码的摘要 - [ php中文手册 ] - 在线原生手册

**支持编码的摘要**
IANA 字符集注册表内的名称	相关字符集	描述	额外的说明
ISO-10646-UCS-4	ISO 10646	31位编码空间的通用字符集，以 ISO/IEC 10646 标准化为 UCS-4。它和最新的 Unicode 代码映射表保持同步。	如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。
ISO-10646-UCS-4	UCS-4	参见以上。	和 UCS-4 相比较，字符串总是设为大端序（big endian）的形式。
ISO-10646-UCS-4	UCS-4	参见以上。	和 UCS-4 相比较，字符串总是设为小端序（little endian）的形式。
ISO-10646-UCS-2	UCS-2	16位编码空间的通用字符集，以 ISO/IEC 10646 标准化为 UCS-2。它和最新的 Unicode 代码映射表保持同步。	如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。
ISO-10646-UCS-2	UCS-2	参见以上。	和 UCS-2 相比较，字符串总是设为大端序（big endian）的形式。
ISO-10646-UCS-2	UCS-2	参见以上。	和 UCS-2 相比较，字符串总是设为小端序（little endian）的形式。
UTF-32	Unicode	32 位单位宽度的 Unicode 转换格式，涉及到了 Unicode 字符集标准。该编码方案和 UCS-4 没有完全相同，因为 Unicode 编码空间限制为 21 位的值。	如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。
UTF-32BE	Unicode	参见以上	和 UTF-32 相比较，字符串总是设为大端序（big endian）的形式。
UTF-32LE	Unicode	参见以上	和 UTF-32 相比较，字符串总是设为小端序（little endian）的形式。
UTF-16	Unicode	16 位单位宽度的 Unicode 转换格式。值得一记的是，UTF-16 的规格不再和 UCS-2 一样，因为 Unicode 2.0 引入了代理机制（surrogate mechanism），UTF-16 现在指向了 21 位的编码空间。	如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。
UTF-16BE	Unicode	参见以上。	和 UTF-16 相比较，字符串总是设为大端序（big endian）的形式。
UTF-16LE	Unicode	参见以上。	和 UTF-16 相比较，字符串总是设为小端序（little endian）的形式。
UTF-8	Unicode / UCS	8 位单位宽度的 Unicode 转换格式。	none
UTF-7	Unicode	一种邮件安全的 Unicode 转换格式，规格是 » RFC2152。	none
(none)	Unicode	UTF-7 的一种变体，其规格在 » IMAP 协议中用到了。	none
US-ASCII (首选 MIME 名称) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII	ASCII / ISO 646	美国标准代码（American Standard Code）是一种常用的 7-bit 信息交换编码。同样，标准化为 ISO 646 国际标准。	(none)
EUC-JP (首选 MIME 名称) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese	US-ASCII / JIS X0201:1997 (半角假名部分) / JIS X0208:1990 / JIS X0212:1990 的复合	就像你所看到的，名字来源于扩展 Extended UNIX Code Packed Format for Japanese 的缩写，该编码常用于 UNIX 或类似平台。原始编码方案 Extended UNIX Code 基于 ISO 2022 而设计。	EUC-JP 涉及的字符集和 IBM932 / CP932 是不一样的，后者使用于 OS/2? 和 Microsoft? Windows?。这些平台上的信息交换，使用 EUCJP-WIN 来代替。
Shift_JIS (首选 MIME 名称) / MS_Kanji / csShift_JIS	JIS X0201:1997 / JIS X0208:1997 的复合	80 年代初，个人日文文字处理软件进入了市场之时，为了兼容传统编码方案 JIS X 0201:1976，开发了 Shift_JIS。根据 IANA 对 Shift_JIS 编码集的定义，和 IBM932 / CP932 稍有不同。但 "SJIS"、"Shift_JIS" 的名称常被错误得指向这些编码集。	要使用 CP932，使用 SJIS-WIN 作为替代。
(none)	JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的复合	虽然此 "encoding" 使用了 EUC-JP 同样的方案，一些字符集有所不同。也就是说，一些编码映射到了和 EUC-JP 不同的字符。	none
Windows-31J / csWindows31J	JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的符合	虽然此 "encoding" 使用了 Shift_JIS 同样的方案，一些字符集有所不同。也就是说，一些编码映射到了和 Shift_JIS 不同的字符。	(none)
ISO-2022-JP (首选 MIME 名称) / csISO2022JP	US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983	» RFC1468	(none)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R

ISO-10646-UCS-4

ISO 10646

31位编码空间的通用字符集，以 ISO/IEC 10646 标准化为 UCS-4。它和最新的 Unicode 代码映射表保持同步。

如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。

ISO-10646-UCS-4

UCS-4

参见以上。

和 UCS-4 相比较，字符串总是设为大端序（big endian）的形式。

ISO-10646-UCS-4

UCS-4

参见以上。

和 UCS-4 相比较，字符串总是设为小端序（little endian）的形式。

ISO-10646-UCS-2

UCS-2

16位编码空间的通用字符集，以 ISO/IEC 10646 标准化为 UCS-2。它和最新的 Unicode 代码映射表保持同步。

如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。

ISO-10646-UCS-2

UCS-2

参见以上。

和 UCS-2 相比较，字符串总是设为大端序（big endian）的形式。

ISO-10646-UCS-2

UCS-2

参见以上。

和 UCS-2 相比较，字符串总是设为小端序（little endian）的形式。

UTF-32

Unicode

32 位单位宽度的 Unicode 转换格式，涉及到了 Unicode 字符集标准。该编码方案和 UCS-4 没有完全相同，因为 Unicode 编码空间限制为 21 位的值。

如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。

UTF-32BE

Unicode

参见以上

和 UTF-32 相比较，字符串总是设为大端序（big endian）的形式。

UTF-32LE

Unicode

参见以上

和 UTF-32 相比较，字符串总是设为小端序（little endian）的形式。

UTF-16

Unicode

16 位单位宽度的 Unicode 转换格式。值得一记的是，UTF-16 的规格不再和 UCS-2 一样，因为 Unicode 2.0 引入了代理机制（surrogate mechanism），UTF-16 现在指向了 21 位的编码空间。

如果在编码转化程序中使用了这个名字，转换器将尝试识别前缀的 BOM头（字节顺序标记），即表示后续字节的字节序。

UTF-16BE

Unicode

参见以上。

和 UTF-16 相比较，字符串总是设为大端序（big endian）的形式。

UTF-16LE

Unicode

参见以上。

和 UTF-16 相比较，字符串总是设为小端序（little endian）的形式。

UTF-8

Unicode / UCS

8 位单位宽度的 Unicode 转换格式。

none

UTF-7

Unicode

一种邮件安全的 Unicode 转换格式，规格是 » RFC2152。

none

(none)

Unicode

UTF-7 的一种变体，其规格在 » IMAP 协议中用到了。

none

US-ASCII (首选 MIME 名称) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII

ASCII / ISO 646

美国标准代码（American Standard Code）是一种常用的 7-bit 信息交换编码。同样，标准化为 ISO 646 国际标准。

(none)

EUC-JP (首选 MIME 名称) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese

US-ASCII / JIS X0201:1997 (半角假名部分) / JIS X0208:1990 / JIS X0212:1990 的复合

就像你所看到的，名字来源于扩展 Extended UNIX Code Packed Format for Japanese 的缩写，该编码常用于 UNIX 或类似平台。原始编码方案 Extended UNIX Code 基于 ISO 2022 而设计。

EUC-JP 涉及的字符集和 IBM932 / CP932 是不一样的，后者使用于 OS/2? 和 Microsoft? Windows?。这些平台上的信息交换，使用 EUCJP-WIN 来代替。

Shift_JIS (首选 MIME 名称) / MS_Kanji / csShift_JIS

JIS X0201:1997 / JIS X0208:1997 的复合

80 年代初，个人日文文字处理软件进入了市场之时，为了兼容传统编码方案 JIS X 0201:1976，开发了 Shift_JIS。根据 IANA 对 Shift_JIS 编码集的定义，和 IBM932 / CP932 稍有不同。但 "SJIS"、"Shift_JIS" 的名称常被错误得指向这些编码集。

要使用 CP932，使用 SJIS-WIN 作为替代。

(none)

JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的复合

虽然此 "encoding" 使用了 EUC-JP 同样的方案，一些字符集有所不同。也就是说，一些编码映射到了和 EUC-JP 不同的字符。

none

Windows-31J / csWindows31J

JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的符合

虽然此 "encoding" 使用了 Shift_JIS 同样的方案，一些字符集有所不同。也就是说，一些编码映射到了和 Shift_JIS 不同的字符。

(none)

ISO-2022-JP (首选 MIME 名称) / csISO2022JP

US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983

» RFC1468

(none)

JIS

ISO-8859-1

ISO-8859-2

ISO-8859-3

ISO-8859-4

ISO-8859-5

ISO-8859-6

ISO-8859-7

ISO-8859-8

ISO-8859-9

ISO-8859-10

ISO-8859-13

ISO-8859-14

ISO-8859-15

byte2be

byte2le

byte4be

byte4le

BASE64

HTML-ENTITIES

7bit

8bit

EUC-CN

CP936

HZ

EUC-TW

CP950

BIG-5

EUC-KR

UHC (CP949)

ISO-2022-KR

Windows-1251 (CP1251)

Windows-1252 (CP1252)

CP866 (IBM866)

KOI8-R