跳转到内容

ISO-IR-165

维基百科,自由的百科全书

ISO-IR-165通訊用中文多位元組字符集》(Codes of the Chinese graphic character set for communication)是中國大陸於1992年為国际电信联盟电信标准化部门(CCITT[1] 創製之中文多位元組通訊字符集。该编码在ISO 2022下注册的名称为 ISO-IR-165,可以使用 ISO-2022-CN-EXT 进行编码。

ISO-IR-165 整合 GB 2312(包括 GB/T 6345.1-86《信息交换用汉字 32x32 点阵字模集》新增之字符及調整[2])以及 GB/T 8565.2-88《信息处理文本通信用编码字符集 第二部分:图形字符集》。该标准合共 8446 個字符。

GB/T 6345.1的修订和补充

[编辑]

GB/T 6345.1-1986《信息交换用汉字 32x32 点阵字模集》(后续改成GB/T 6345.1-2010)包括了对 GB/T 2312 的修正和补充。[2]相关的修订最早是由GB 5007.1–85《信息交换用汉字 24x24 点阵字模集》所加入。

GB/T 6345.1 对现有 GB/T 2312 的修订[2]
区位码 EUC码 GB/T 2312(未修订) GB/T 6341.1 备注
03-71 0xA3E7 g ɡ [a]
79-81 0xEFF1 [b]
  1. ^ 对应 Unicode U+FF47 ;但是 GB/T 6341.1 的字形也可以对应至U+0261 ɡ
  2. ^ 原字对应繁体中文的U+937E ,修改后成为简体的U+953A 。《汉字简化方案》内原先将“鍾”合并进“钟”(“鐘”的简化字),后续1986年的《简化字总表》允许在人名中使用“锺”,而相似的标准(如 GB/T 5007.1–85)也将该字修改成使用简体“钅”旁的“锺”。

后续实践 GB/T 2312 的编码(如Windows 的代碼頁936)将 79-81 对应的汉字 Unicode 码从“鍾”改为“锺”。[3]

GB/T 6345.1-86 也在 GB/T 2312 的基础上在第 10 区补充了ISO 646-CN 的半宽字符(3 区的字符为全宽字符)和第 8 区补充了 6 个汉语拼音字符。[2]这些补充也在 GB/T 12345 内出现,而 GB/T 12345 也额外在第 6 区加上了 29 个竖排标点符号。[2][4]

2011年發佈的 GB/T 6345.1-2010 正式在第 11 区增加了對應 8 区 32 个汉语拼音字符(包括新补充的6个字符)的半宽版本。[5]這個補充并未在 GB 18030 内實行。[6]

Classic Mac OS 内的简体中文编码(基于EUC-CN修改)[7]GB 18030 包含了 GB/T 6345.1 补充的 6 个汉语拼音字符(但是不包括半宽版本)和 GB/T 12345 补充的竖排标点符号。[6] 新增的 6 个汉语拼音字符如下:[7]

GB/T 2312 第 8 区的扩充
区位码 EUC码 字符[7][6] 备注
08-27 0xA8BB U+0251 ɑ
08-28 0xA8BC U+1E3F ḿ [a]
08-29 0xA8BD U+0144 ń
08-30 0xA8BE U+0148 ň
08-31 0xA8BF U+01F9 ǹ [b]
08-32 0xA8C0 U+0261 [c]
  1. ^ Windows CP936[8] 和 GB 18030-2000 映射至私用区 U+E7C7,GB 18030-2005 修改成 U+1E3F[6]
  2. ^ 此字符是在 Unicode 3.0 新增的,在这之前该字符一般映射至 U+006E, U+0300[7] Windows CP936 映射至私用区 U+E7C8[8]
  3. ^ 与未修订 GB/T 2312 的 03-71 一样(见上表)。ISO-IR-165 的 Unicode 映射有差异。

GB/T 8565.2 的修订和补充

[编辑]

GB/T 8565.2-1988《信息处理文本通信用编码字符集第二部分:图形字符集》也定义了 GB/T 2312 的补充字符,在 13-15 区和 90-94 区之间新增了 705 个字符,其中 15 区新增的 69 个字符是非汉字。该修订包括了 GB/T 6345.1 的修订,但是没有包括补充字符。[2]

Unihan 资料库中引用中国大陆来源 GB/T 8565 的汉字使用 G8 来标示。[1]

CCITT 修订

[编辑]

ISO-IR-165 包括了 GB/T 6345.1 和 GB/T 8565.2 在 GB/T 2312 的新增补充字符。另外,ISO-IR-165 也新增了 161 个字符,其中 139 个汉字是“普通汉字和异体”。[2][9]有时这些 CCITT 的新增字会和 GB/T 8565.2 混淆,包括以前的 Unihan 资料库。[1]

CCITT 在第 6 区新增了对应第 3 区的像字符[9],这些字符和 Mac OS 简体中文[7] 和 GB 18030[6] 的新增字符相撞。

ISO-IR-165 包含了 GB/T 6345.1 的订正,但是其中有两个字符的 Unicode 映射与 GB/T 2312 和 GB/T 6345.1 扩展的映射不同。下表顯示各標準的映射和對應字形,也另附 GB 18030 的對應編碼:

区位码 EUC码 GB/T 2312(未修订) GB/T 6345.1[5] GB/T 6345.1 映射[7] ISO-IR-165[9] ISO-IR-165映射[10] GB 18030[6] GB 18030 映射[6]
03-71 0xA3E7 g ɡ U+FF47 ɡ U+0261 g U+FF47
08-32 0xA8C0 (无) g U+0261 g U+FF47 ɡ U+0261
79-81 0xEFF1 U+953A U+953A U+953A

来源

[编辑]
  1. ^ 1.0 1.1 1.2 Chung, Jaemin. Pseudo-G8 characters (PDF). 2018-01-24 [2022-05-05]. ISO/IEC JTC 1/SC 2/WG 2/IRG N2276. (原始内容 (PDF)存档于2022-03-19). 
  2. ^ 2.0 2.1 2.2 2.3 2.4 2.5 2.6 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年12月 [2022-05-06]. ISBN 978-0-596-51447-1. (原始内容存档于2011-08-29). 
  3. ^ Steele, Shawn. cp936 to Unicode table. Microsoft, Unicode Consortium. 2000 [2022-05-05]. (原始内容存档于2022-03-18). 
  4. ^ Lunde, Ken. Appendix F: GB/T 12345 (PDF). CJKV Information Processing (O'Reilly). 1998 [2022-05-05]. ISBN 9781565922242. (原始内容 (PDF)存档于2019-02-02). 
  5. ^ 5.0 5.1 中華人民共和國国家标准化管理委员会. GB/T 6345.1-2010 信息技术 汉字编码字符集(基本集) 32点阵字型 第1部分宋体. 中國. 2011-01-10 (中文(中国大陆)). 
  6. ^ 6.0 6.1 6.2 6.3 6.4 6.5 6.6 Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18. 
  7. ^ 7.0 7.1 7.2 7.3 7.4 7.5 Mac OS 简体中文版本对 Unicode 3.0 后的映射. Apple, Inc. [2022-05-05]. (原始内容存档于2021-02-05). 
  8. ^ 8.0 8.1 Microsoft. CODEPAGE 936: PRC GBK (XGB) - ANSI, OEM. Unicode Consortium. [2022-05-05]. (原始内容存档于2021-01-19). 
  9. ^ 9.0 9.1 9.2 CCITT. Codes of the Chinese graphic character set for communication (PDF). ITSCJ/IPSJ. 1992-07-13 [2022-05-06]. (原始内容 (PDF)存档于2022-03-10). 
  10. ^ Viswanadha, Raghuram. Unicode to ISO-IR-165 table. International Components for Unicod-e. IBM. 2000-08-30.  (备注:编号根据来源使用 7 位元或 ISO 2022:加上 0×80 生成EUC码,或减去 0×20 生成区位码

外部連結

[编辑]
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy