發(fā)布時間:2024-04-17 文章來源:深度系統(tǒng)下載 瀏覽:
一、字符編碼 計算機(jī)處理能處理數(shù)字?jǐn)?shù)據(jù)外,還可以處理字符數(shù)據(jù)。字符數(shù)據(jù)包括字母、各種控制符號、圖形符號等,各種數(shù)據(jù)在計算機(jī)中都是以二進(jìn)制形式表示的,而這些數(shù)據(jù)在處理前必須經(jīng)過編碼才能輸入到計算機(jī)中。 二、asciii碼 Ascll碼是“美國標(biāo)準(zhǔn)信息交換碼”的簡稱,是計算機(jī)上使用最多、最普遍的字符編碼。Ascll碼常用于輸入/輸出設(shè)備,如鍵盤輸入及屏幕顯示、電傳打字機(jī)、打印機(jī)等。當(dāng)使用鍵盤輸入字符時,編碼電路將字符ascll碼輸入計算機(jī),計算機(jī)處理后輸出ascll碼,由設(shè)備轉(zhuǎn)換為字符后顯示或打印出來。 三、漢字編碼字符集 1.信息交換用漢字編碼字符集(gb2312-1980) 信息交換用漢字編碼字符集是中華人民共和國國家漢子信息交換用編碼,由國家標(biāo)準(zhǔn)總局于1981年發(fā)布實施。Gb2312給出一個二維代碼表,表中有94行、94列,共收集了簡化漢字即符號、字母、日文假名等共7 445個圖形字符,其中漢字占6 763個。這些漢字的代碼可以用代碼表上的字所處的行號和列好來表示,行號稱為區(qū)號、列號稱為位號。目前國家已有新標(biāo)準(zhǔn)gb18030-2000,該標(biāo)準(zhǔn)收錄了共27 484個漢字。 2.區(qū)位碼 區(qū)位碼是編碼的另一種表示形式,即用兩位十進(jìn)制數(shù)直接表示字符的區(qū)號和位號,區(qū)號和位號都是01~94. 3.國標(biāo)碼 國標(biāo)碼是“國家標(biāo)準(zhǔn)信息交換用漢字編碼的簡稱”,是機(jī)器內(nèi)部使用的漢字編碼。國標(biāo)碼的編碼方法較為簡單,共分為94個區(qū),每個區(qū)94位,共有8 836個編碼,1~15區(qū)為字母/數(shù)字、符號;16~49區(qū)為漢字。由于6 763個漢字加700多個符號用不完這些編碼,所以10~15區(qū)是空的,88區(qū)以后也是空的。漢字國標(biāo)碼要用兩個字節(jié)表示,區(qū)編號為第一字節(jié),位編號為第二字節(jié)。每個字節(jié)用兩個十六進(jìn)制數(shù)表示,而西文字母只需一個字節(jié)表示。為保護(hù)中、西兼容,國標(biāo)碼必須能區(qū)分西文和漢字,因此,國標(biāo)碼的區(qū)號和位號都是從a1~fe,而ascii編碼是從21~7e,21前面是ascii碼的控制符號。當(dāng)輸入字符時,計算機(jī)根據(jù)第一個字符就能判斷輸入的是國標(biāo)碼還是ascii碼。 四、漢字編碼 漢字是一種字符,但比英文字符復(fù)雜且量大。因此,在計算機(jī)上處理漢字要解決漢字輸入、輸出及計算機(jī)內(nèi)部的編碼問題。根據(jù)文字處理過程中不同的要求,有多種編碼,主要分為漢字交換碼、漢字輸入碼、漢字內(nèi)碼和漢字字形碼四類。 1.漢字交換碼 漢字交換碼是漢字系統(tǒng)或通訊系統(tǒng)間在交換信息時,對每一個漢字所規(guī)定的統(tǒng)一編碼。我國已制定了漢字交換碼的國家標(biāo)準(zhǔn)《信息交換用漢字編碼字符集》代號為gb 2312-80 又成為國際碼。國標(biāo)碼字符集共收入漢字和圖形符號好7 445個。 2.漢字輸入碼 指直接從鍵盤輸入的各種漢字輸入方法的編碼。漢字輸入編碼的研究和發(fā)展十分迅速,已有幾百種漢字輸入編碼方案,各種輸入編碼大致可以分為:數(shù)字編碼、字音編碼、自行編碼和音形編碼。 3.漢字內(nèi)碼 漢字內(nèi)碼在設(shè)備和漢字處理系統(tǒng)內(nèi)部存儲、處理、傳輸漢字使用的編碼 |
下一篇:啥是USB3.0接口