潘 影
(伊春市農(nóng)業(yè)技術(shù)研究推廣中心 黑龍江 伊春 153000)
電子計(jì)算機(jī)采集、處理信息的一般過(guò)程是:先對(duì)自然形態(tài)的信息模式進(jìn)行拾取,得到信息模擬物理量,如聲波轉(zhuǎn)換成電波;再對(duì)模擬物理量進(jìn)行轉(zhuǎn)換獲得信息的數(shù)字編碼;然后對(duì)信息的數(shù)字編碼進(jìn)行存儲(chǔ)、傳遞、編輯等加工處理。當(dāng)需要輸出信息給人們使用時(shí),則將上述過(guò)程逆行處理,即可恢復(fù)成原來(lái)的信息形態(tài)。不同信息形態(tài)的編碼方式和處理的方法會(huì)有所不同。
電子計(jì)算機(jī)錄入漢字的方法有4 種:即鍵盤(pán)錄入法、掃描錄入法、語(yǔ)音錄入法、手寫(xiě)錄入法。以鍵盤(pán)錄入漢字,制作文本式的電子檔案為例,電子計(jì)算機(jī)的數(shù)字編碼過(guò)程有以下—些處理步驟:首先是在輸入時(shí)對(duì)漢字進(jìn)行電子計(jì)算機(jī)的外碼轉(zhuǎn)換。如果使用普通電子計(jì)算機(jī)鍵盤(pán)作為錄入設(shè)備,就可以用漢語(yǔ)拼音、五筆字形等外碼錄入漢字。如果使用漢字大鍵盤(pán)作錄入設(shè)備、則漢字本身就是外碼,在鍵盤(pán)上直接點(diǎn)選就可錄入某個(gè)漢字。電子計(jì)算機(jī)接收了某個(gè)漢字外碼之后,接著就把外碼代表的漢字用電子計(jì)算機(jī)內(nèi)碼記錄下來(lái)。電子計(jì)算機(jī)的內(nèi)碼是以16 位二進(jìn)制的數(shù)字表示的。電子計(jì)算機(jī)外碼的編碼方案有數(shù)百種,尚未制定國(guó)家標(biāo)準(zhǔn)。而電子計(jì)算機(jī)內(nèi)碼的國(guó)家標(biāo)準(zhǔn)是GB/T 2312—80《信息交換用漢字編碼字符集》。這個(gè)標(biāo)準(zhǔn)中收入—級(jí)漢字3755 個(gè)、二級(jí)漢字3008 個(gè)、各類其他字符682 個(gè)。當(dāng)完成文本式電子檔案的錄入工作之后,在電子計(jì)算機(jī)內(nèi)進(jìn)行的文件信息的存儲(chǔ)、傳輸?shù)忍幚砭投际菍?duì)這些內(nèi)碼的處理。只有當(dāng)需要將文件輸出時(shí),才將其漢字內(nèi)碼所對(duì)應(yīng)的字形點(diǎn)陣,也就是字模,以及眾多字模按格式組成的文章在屏幕或打印機(jī)上輸出。
對(duì)于圖形信息的數(shù)字編碼處理方式和方法有多種類型,但基本過(guò)程類似,例如通過(guò)掃描儀將平面二維圖形轉(zhuǎn)換成一維形式,由二進(jìn)制數(shù)字編碼組成序列,并在轉(zhuǎn)換過(guò)程中加上附屬信息,如行碼、幀碼等。圖形中的白點(diǎn)或黑點(diǎn)分別用二進(jìn)制的“0”或“l(fā)”表示。為了節(jié)約存儲(chǔ)空間,還可以將二進(jìn)制數(shù)字原編碼序列進(jìn)行壓縮實(shí)現(xiàn)再次編碼。例如文字的行與行之間有空白,就可以將這些空白用簡(jiǎn)短的壓縮碼表示,而不必實(shí)際存儲(chǔ)很多的空白點(diǎn)編碼。信息壓縮方法有很多種,有的方法對(duì)信息的還原質(zhì)量沒(méi)有什么影響,如上面列舉的對(duì)連續(xù)空白的壓縮編碼,就是一種不丟失信息元素的方法;有些方法會(huì)降低信息元素的密度,或丟失部分信息。使用時(shí)需注意在基本滿足還原質(zhì)量要求的前提下,選擇不同的方法或壓縮倍率。文本形式的電子文件與圖形形式的電子文件有時(shí)相互交錯(cuò),如在文本文件中可能有插圖或直接用光筆在其上進(jìn)行修改或書(shū)寫(xiě)。此外,文本文件和圖形文件在一定條件下可以互相轉(zhuǎn)換,如用漢字模式識(shí)別技術(shù)可以把圖形文件中的漢字圖形經(jīng)識(shí)別后,轉(zhuǎn)換成漢字內(nèi)碼,變成文本文件。
在電子計(jì)算機(jī)多媒體技術(shù)的支持下,電子文件還可以包括聲音、影像等多種形式。不過(guò)這些信息形態(tài)對(duì)于電子計(jì)算機(jī)的內(nèi)部處理來(lái)說(shuō),也都不過(guò)是二進(jìn)制的數(shù)字編碼而已,只是在輸入和輸出時(shí),才有其各自的特殊形式。電子計(jì)算機(jī)對(duì)于影像信息的處理過(guò)程要相對(duì)復(fù)雜一些。影像信息是由每秒鐘25 或30 幀畫(huà)面組成的,一般還配有伴音。在處理時(shí),要分別拾取和加工,并保留其同步特征,即畫(huà)面與伴音的對(duì)應(yīng)關(guān)系。一幀影像信息按行、列被分成若干象素,如1024 行×860 列等。每個(gè)象素的信息屬性編碼可以有顏色、飽和度、亮度等。這種編碼的信息量是很大的,為了少占用存儲(chǔ)空間,也可采用壓縮編碼的方法處理。
電子文件從一個(gè)裁體復(fù)制到另一個(gè)載體,或者從一臺(tái)電子計(jì)算機(jī)傳遞到另一臺(tái)電子計(jì)算機(jī),實(shí)質(zhì)上是在電子計(jì)算機(jī)內(nèi)進(jìn)行數(shù)字信號(hào)的傳輸處理。這種處理與通常的紙質(zhì)文件復(fù)制或縮微品拷貝有很大區(qū)別。后者于模擬物理量的處理,不可避免地會(huì)出現(xiàn)清晰度下降、畸變、信息丟失等問(wèn)題。而電子文件復(fù)制,由于是數(shù)字化的信息處理,所以幾乎完全不存在上述問(wèn)題。原因是數(shù)字信息本身特性和各種技術(shù)措施決定的。例如在其傳遞過(guò)程中可以通過(guò)對(duì)傳輸碼校驗(yàn)來(lái)糾正誤碼。數(shù)字信息傳遞的波型是脈沖方波,對(duì)其進(jìn)行調(diào)制的基本領(lǐng)率來(lái)自于精確的脈沖信號(hào),如果傳遞過(guò)程中發(fā)生脈沖信號(hào)的丟失,則可在接收端按脈沖信號(hào)進(jìn)行增補(bǔ),被增補(bǔ)脈沖的特性可根據(jù)其前后兩個(gè)相鄰脈沖的特性確定,由于脈沖信號(hào)顛率很高,對(duì)被傳遞信息的取樣密度也就很高,相鄰脈沖差別極小,故增補(bǔ)脈沖與丟失脈沖的差別小到可以忽略不計(jì)。此外,如果在傳遞過(guò)程中混進(jìn)了干擾信號(hào),可以采用“脈沖間閑靜噪”、“脈沖限幅”等技術(shù)去掉干擾信號(hào)。脈沖信號(hào)在傳遞過(guò)程中其高領(lǐng)分量的衰減較之低頻更大一些,使得方波變成“山包”形,只要在增加強(qiáng)度的同時(shí)增補(bǔ)高額分量,就可以完全恢復(fù)到與原波形一樣。例如,在光盤(pán)被復(fù)制時(shí),如采取了較完善的技術(shù)措施,所出現(xiàn)的誤碼率能夠做到不超過(guò)十的負(fù)十四次方,也就是說(shuō)相當(dāng)于傳遞200000 份《人民日?qǐng)?bào)》的文字信息量,才可能有一個(gè)漢字出錯(cuò)。所以完全可以做到復(fù)制后得到的電子文件與原來(lái)的電子文件無(wú)任何區(qū)別。由此可見(jiàn),只要數(shù)字信息在傳遞過(guò)程中尚可識(shí)別,信息與干擾就可以幾乎被完全分離,從而獲得高質(zhì)量的電子文件信息。而模擬信息的傳遞則是另一種情況,例如,接收普通電視信號(hào)時(shí),隨著信號(hào)的減弱,背景噪音和畫(huà)面上的雪花狀干擾就會(huì)越來(lái)越明顯,直至信號(hào)被淹沒(méi)在雜波之中。而數(shù)字信息在接收時(shí).信號(hào)弱到一定程度會(huì)突然中斷,事先沒(méi)有明顯的征兆。從這個(gè)意義上講,在數(shù)字信息的處理過(guò)程中會(huì)產(chǎn)生一些猝不及防的問(wèn)題。此外,電子文件傳遞和復(fù)制的這種高保真性,通常是好事,但是對(duì)于想特意區(qū)分原件與復(fù)制件來(lái)說(shuō)又是很麻煩的事,這個(gè)問(wèn)題需要采取專門的技術(shù)措施方能解決。
[1]侯曉莉.水利施工企業(yè)電子檔案管理探討[J].甘肅水利水電技術(shù),2008(05).
[2]閻文華.電子檔案的保護(hù)[J].林業(yè)科技情報(bào),2005(04).