電 話:18937133779
網(wǎng) 址:http://www.tpiin.com
郵 箱:zboao@qq.com
傳統(tǒng)檔案管理升級為電子檔案管理的過程中,我們經(jīng)常要將檔案進行檔案數(shù)字化信息化。那么,什么是數(shù)字化?什么是信息化?數(shù)字化和信息化是一回事嗎?
01、什么是數(shù)字化?
檔案管理術(shù)語中的“數(shù)字化”
《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(DA/T 31—2017)中,數(shù)字化指的是利用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。
檔案管理工作中的“數(shù)字化”
檔案數(shù)字化就是把紙質(zhì)文化通過掃描、錄入等方式將信息存儲到計算機數(shù)據(jù)庫中,以實現(xiàn)檢索快捷方便、同步備份快速簡單、存儲空間小、維護方便、安全等功效。
02、什么是信息化?
檔案管理術(shù)語中的“信息化”
《企業(yè)檔案工作規(guī)范》(DA/T 42-2009)中,信息化是指運用信息技術(shù)對歸檔文化、數(shù)據(jù)信息資源及檔案進行采集、整合、維護、處置和提供利用服務的檔案管理提升過程和工作方式。
檔案管理工作中的“信息化”
檔案信息化是在檔案管理中全面應用現(xiàn)代信息技術(shù),對檔案信息資源進行數(shù)字化管理和提供利用。
檔案信息化建設(shè)需要結(jié)合現(xiàn)有的OA系統(tǒng)和業(yè)務系統(tǒng),搭建電子化、信息化、現(xiàn)代化的檔案管理系統(tǒng),實現(xiàn)檔案的收、管、存、用。
03、數(shù)字化≠信息化
從上述信息中,我們可以發(fā)現(xiàn),數(shù)字化并不等同于信息化,在檔案管理工作中,數(shù)字化建設(shè)也并不等同于信息化建設(shè)。
廣義上的“數(shù)字化、信息化”
信息化包含了數(shù)字化,數(shù)字化是信息化的一種表現(xiàn)形式。
檔案管理工作中的“數(shù)字化、信息化”
檔案數(shù)字化是傳統(tǒng)檔案管理模式向現(xiàn)代化電子檔案管理模式升級過程中,實現(xiàn)全面信息化建設(shè)的一個重要環(huán)節(jié)。
從智慧和信息的區(qū)別來看,信息基本相當于數(shù)據(jù)。數(shù)據(jù)的含義是進行各種統(tǒng)計、計算、科學研究和技術(shù)設(shè)計所依據(jù)的數(shù)值,是事實或觀察的結(jié)果,是用于表示客觀事物的未經(jīng)加工的原始素材,并被認為是信息的表現(xiàn)形式和載體。
所以,數(shù)據(jù)基本上跟信息是一樣的東西。隨著大數(shù)據(jù)技術(shù)的出現(xiàn),現(xiàn)在數(shù)據(jù)一詞很流行,幾乎和信息一詞在20世紀80年代的流行程度一樣。彼時是無事物無信息,現(xiàn)今則是無事物無數(shù)據(jù);彼時是信息一詞泛化,而現(xiàn)今又是數(shù)據(jù)一詞泛化。
智慧檔案館首先要把檔案數(shù)據(jù)化或信息化。檔案數(shù)據(jù)化是相對于之前的檔案數(shù)字化而言的,是我在2019年的一次講話中為了區(qū)別于此前人們常說的檔案數(shù)字化而提出來的。其實,它的意思就是把紙質(zhì)檔案或紙質(zhì)檔案數(shù)字化圖像中的每個字都轉(zhuǎn)換成電腦可以處理的數(shù)據(jù)或信息,并輸入電腦,進入數(shù)據(jù)庫,供人們通過大數(shù)據(jù)技術(shù)進行挖掘和處理。
數(shù)據(jù)是智慧檔案館的基礎(chǔ)。沒有數(shù)據(jù),特別是沒有檔案內(nèi)容的所有數(shù)據(jù),就不能把數(shù)據(jù)或信息變成智慧。也可以說,智慧檔案館是基于數(shù)據(jù)的,有了數(shù)據(jù)和各種數(shù)據(jù)處理技術(shù),才有智慧檔案館。所以,沒有數(shù)據(jù)就談不上建設(shè)智慧檔案館。
智慧檔案館的數(shù)據(jù)應包括電腦可檢索的檔案全文數(shù)據(jù),即:信息流數(shù)據(jù);檔案實體、檔案裝具、檔案設(shè)備等方面的數(shù)據(jù),即物流數(shù)據(jù);檔案工作者、檔案利用者、檔案參觀者等方面的數(shù)據(jù),即人流數(shù)據(jù);
檔案庫房溫度、濕度及各種有毒有害氣體濃度,水、火、菌、蟲、鼠等各種環(huán)境或條件的數(shù)據(jù),即環(huán)境數(shù)據(jù)。也就是說,“智慧檔案館的數(shù)據(jù)=檔案全文數(shù)據(jù)+物流數(shù)據(jù)+人流數(shù)據(jù)+環(huán)境數(shù)據(jù)”。在這些數(shù)據(jù)中,檔案全文數(shù)據(jù)是最關(guān)鍵、最重要、最根本、具有決定性的部分。
建設(shè)智慧檔案館,最重要的是運用各種手段盡快地把紙質(zhì)檔案和紙質(zhì)檔案數(shù)字化圖像及錄音錄像檔案等全部轉(zhuǎn)化為電腦可以檢索的電子文檔,把檔案里的前人智慧挖掘出來,轉(zhuǎn)化為今人的智慧,這就是檔案數(shù)據(jù)化,即檔案的數(shù)據(jù)轉(zhuǎn)化工作。檔案數(shù)據(jù)化是智慧檔案館建設(shè)的要義和核心。
目前,檔案數(shù)據(jù)化或是把檔案由文字、聲音轉(zhuǎn)化為數(shù)據(jù)的途徑至少有以下幾種:第一種,對原件上文字為鉛排、打印的紙質(zhì)檔案以及原件上文字雖然手寫但又十分工整的檔案,用OCR識別技術(shù)進行轉(zhuǎn)化,其準確率可在99%以上;
第二種,對原件上文字為手寫且OCR技術(shù)不易識別的檔案,用特殊的手寫字識別技術(shù)進行轉(zhuǎn)化,其準確率目前最高可達95%左右;
第三種,用人工錄入電腦的辦法轉(zhuǎn)化;
第四種,用人工朗讀文字并通過音頻技術(shù)把聲音轉(zhuǎn)換成文字,其準確率也可達95%左右。需要指出的是,目前這4種轉(zhuǎn)化方式都需要人工進行校核,都不能100%準確。在轉(zhuǎn)化過程中,文字能全部準確轉(zhuǎn)化出來最好,如不能也不要緊。
因為檔案中并不是每個字都具有數(shù)據(jù)意義或檢索價值的,有的虛詞、連接詞、形容詞、裝飾詞、重復強調(diào)語等,即使這些字轉(zhuǎn)化不出來或不準確,也并不會太大影響整份檔案的實際應用。對全文數(shù)據(jù)來說,當然是越多越好,但也不是每個字都不能少,或少一個字就不行。
舉一個例子:“張建國,他出生于一九四九年,也就是新中國成立的那一年?!边@句話共24個字,但真正具有實際檢索意義的,只有“張建國,一九四九年出生”這10個字。
只要把這10個關(guān)鍵的字轉(zhuǎn)化出來了,這句話的基本意思或基本要素、主要信息、核心要義就有了,其他14個字,也就是一半以上的部分,能轉(zhuǎn)化出來當然更好,即使不能轉(zhuǎn)化出來也不太影響全句主要意思和基本信息的表達。因此,現(xiàn)有的各種數(shù)據(jù)轉(zhuǎn)化技術(shù)都可以先進行應用,并在應用中不斷提高其轉(zhuǎn)化準確率,而不必等到某種技術(shù)完全成熟了再去用。
智慧檔案館,光有數(shù)據(jù)還不行,還必須有數(shù)據(jù)挖掘和主動推送技術(shù)。數(shù)據(jù)挖掘就是通過算法從數(shù)據(jù)庫的大量數(shù)據(jù)中展開搜索,找出隱含的、先前未知的、有潛在價值的信息。
由此看來,數(shù)據(jù)挖掘技術(shù)實際上就是對大數(shù)據(jù)進行智慧性處理的技術(shù),是把信息變成智慧的技術(shù),是讓蘊含在檔案里的智慧更加顯性、更加集中、更加智慧的技術(shù)。通過數(shù)據(jù)挖掘技術(shù),能夠挖掘出檔案的潛在價值和潛在用戶,挖掘出用戶的潛在需求,從而大大提高檔案的價值。
檔案數(shù)字化信息化管理
檔案數(shù)字化信息化管理是一項龐大的系統(tǒng)工程,數(shù)字化工作涉及需要數(shù)字化檔案、人員、數(shù)字化設(shè)備與技術(shù)等,最終的產(chǎn)品是高質(zhì)量的電子檔案數(shù)據(jù)。檔案數(shù)字化系統(tǒng)工程需要大量的人力、物力和財力的投入,同時需要對數(shù)字化的流程、質(zhì)量實施有效的組織、監(jiān)控和管理等工作。
1、明確檔案數(shù)字化信息化內(nèi)容及標準
確實數(shù)字化信息化處理的檔案范圍、數(shù)量和數(shù)字化工作任務的時間周期。根據(jù)檔案數(shù)字化相關(guān)規(guī)范要求及實際情況,制定出詳細可行的紙質(zhì)檔案整理分類、分級、編號、編頁、掃描與處理等工作規(guī)范。
2、確定數(shù)字化信息化實施技術(shù)途徑及質(zhì)量管控制標
紙質(zhì)檔案介質(zhì)多種多樣,有打印紙、硫酸紙、繪圖紙等,記錄方式有打印、書寫等。要有效完成檔案數(shù)字化工作,除了具備相關(guān)掃描設(shè)備的圖像處理軟件外,同時必須具體分析檔案特性。確定切實可行的實施技術(shù)途徑,根據(jù)工作標準和個流程,確定好數(shù)字化信息化過程中每個環(huán)節(jié)的質(zhì)量管控指標。
3、數(shù)字化加工環(huán)境搭建與工作計劃
數(shù)字化加工場所組建局域網(wǎng)便于集中作業(yè)、相互協(xié)調(diào)配合,高效管理掃描、圖像處理及文件收發(fā)等工作。進行數(shù)字化加工前需要制定一個合理的工作計劃,管理者利用該計劃結(jié)合項目管理類軟件動態(tài)地管理數(shù)字化工作進程,兵進行合理的調(diào)整,同時讓參與數(shù)字化工作的人員了解自己的工作量和整個數(shù)字化進度,確保數(shù)字化工作進展順利。
4、數(shù)字化加工環(huán)境搭建與工作計劃
檔案數(shù)字化加工工作人員必須通過嚴格的面試、考試合格后才能錄用,同時提供個人簡歷及相關(guān)證件,雙方簽訂保密協(xié)議。工作人員由檔案數(shù)字化加工公司經(jīng)驗豐富的項目經(jīng)理進行統(tǒng)一上崗培訓,具備檔案數(shù)字化加工的相關(guān)知識。檔案數(shù)字化工作涉及環(huán)節(jié)多、工作量大。往往需要大量工作人員來協(xié)同完成,這種情況下尤其需要明確工作內(nèi)容與職責,否則人多反而協(xié)調(diào)困難,差錯多。
5、現(xiàn)場設(shè)備管理
檔案數(shù)字化加工過程中現(xiàn)場所使用的掃描儀設(shè)備、服務器、存儲介質(zhì)等,應當嚴格按照涉密設(shè)備進行管理和使用,不使用無保密保障的設(shè)備。
6、實時監(jiān)控
按照信息安全管理體系ISO270001的要求,對加工現(xiàn)場實施24小時監(jiān)控,及時掌握現(xiàn)場加工狀態(tài),保證現(xiàn)場加工信息安全。