區位碼

科學知識 9547 339 2014-11-23

隨著計算機的發展與普及,由於各國的文字不一,尤其是亞洲文字,為了方便計算機進行文字信息處理,就需要一個統一的標準來處理這些文字,1980年,為了使每一個漢字有一個全國統一的代碼,我國頒布了第一個漢字編碼的國家標準:GB2312-80《信息交換用漢字編碼字符集》基本集,這個字符集是我國中文信息處理技術的發展基礎,也是目前國內所有漢字系統的統一標準。

《信息交換用漢字編碼字符集》可以理解成是一個表格,對所收漢字進行了「分區」處理,每區含有94個漢字/符號。

01-09區為特殊符號。

16-55區為一級漢字,按拼音排序。

56-87區為二級漢字,按部首/筆畫排序。

10-15區及88-94區則未有編碼。

區位碼簡單來說就是一個漢字或者符號對應一個字符表(信息交換用漢字編碼字符集,GB2312標準)中的位置。區位碼是一個四位的十進制數,每個區位碼都對應著一個唯一的漢字或符號,它的前兩位叫做區碼,後兩位叫做位碼。

如圖:這裡選取的是第16區

舉例來說,「啊」字是GB2312之中的第一個漢字,它的區位碼就是1601(16區第1個字符)。「阿」的區位碼是1602(16區第2字符),「埃」的區位碼是1603(16區第3個字符),以此類推!



,