電 話:18937133779
網(wǎng) 址:http://www.tpiin.com
郵 箱:zboao@qq.com
為什么檔案工作者不數(shù)字化所有的文件記錄呢?作為檔案工作者,我們很樂于回答這些疑問。因?yàn)檫@類問題既向我們展現(xiàn)了人們對檔案記錄的渴求,同時(shí),也表明人們已經(jīng)意識(shí)到并不是所有的文件記錄都被數(shù)字化了。
實(shí)際上,檔案工作者和圖書館管理員是互聯(lián)網(wǎng)上已有的大量原始文獻(xiàn)的幕后加工者。從珍貴典籍到官方文件,從日記到音頻記錄,這些數(shù)字化后的原始文獻(xiàn)在向公眾訴說:過去將會(huì)告知我們現(xiàn)在和未來的故事。與此同時(shí),非營利性組織和商業(yè)性組織均將文件資料的數(shù)字化作為工作主要任務(wù),這種舉措提高了社會(huì)大眾獲取歷史文獻(xiàn)資源的期望值。
我們希望和公眾分享有關(guān)珍貴文獻(xiàn)資料數(shù)字化工作的幕后情況,提高社會(huì)公眾對檔案數(shù)字化共享的了解和認(rèn)識(shí)。首先,要了解檔案工作者為什么要開展文件數(shù)字化工作。
如果當(dāng)該份文件即將面臨無法使用的危險(xiǎn)時(shí),比如,一份紙質(zhì)地圖變成碎片,一份信件褪色到模糊不清,又或者一盤磁帶變脆或無法播放。在這種情況下,數(shù)字化工作將生成這些文件記錄的電子圖像,并保存從文件記錄中所收集到的信息。但這并不是說將克隆出原始文件,而是會(huì)產(chǎn)生一個(gè)數(shù)字化的原件代替品,僅從某個(gè)角度上說,可將其視為原始文件。
檔案工作者常說,大規(guī)模的數(shù)字化工作各種成本高昂。人們也會(huì)對此感到質(zhì)疑,畢竟,給你高中時(shí)期的年鑒拍張照片并分享到微博上,或者對一些舊的明信片進(jìn)行掃描并上傳至博客是很容易的。
在從事文件檔案數(shù)字化工作時(shí)我們主要關(guān)注兩類檔案文件記錄:紙質(zhì)文件和照片。面對的挑戰(zhàn)主要為:涉及材料本身的復(fù)雜性以及數(shù)字化過程本身。所有這些表明,機(jī)構(gòu)內(nèi)部大規(guī)模數(shù)字化工作不同于普通家庭的簡單掃描操作。另外,諸如老式音頻記錄、電影膠片等模擬媒體的數(shù)字化工作所面臨的挑戰(zhàn)更加緊迫(無法找到播放設(shè)備等原因)。
檔案館保存有大量檔案資源。即使是一個(gè)中等規(guī)模的檔案機(jī)構(gòu),在衡量其檔案庫存時(shí)也是以公里為單位。檔案架上的每個(gè)盒子可以容納700到1800張紙不等,甚至可容納更多照片、底片和幻燈片。即使是一個(gè)很小的檔案全宗的數(shù)字化工作也是一項(xiàng)不輕松的任務(wù)。
大部分檔案案卷并不易被快速的掃描。掃描一疊紙的最快方式是使用自動(dòng)進(jìn)紙器,但是自動(dòng)進(jìn)紙器只能處理大小尺寸一樣的紙張。這種快速處理方式可能有卡紙的風(fēng)險(xiǎn)。
對于獨(dú)一無二的檔案文件而言,手工掃描是最負(fù)責(zé)任的選擇。針對每一件要掃描的檔案,從去除訂書針到定位需數(shù)字化的內(nèi)容,再到圖像處理、錄入元數(shù)據(jù),有很多步驟。有時(shí)掃描每個(gè)檔案盒上的記錄可能都需要花上幾天時(shí)間。
這個(gè)存有相互關(guān)聯(lián)的政府文件記錄的獨(dú)立卷宗中包含了各種大小、形狀和格式的文件記錄。這種多樣性使文件的數(shù)字化變得更具挑戰(zhàn)性。
針對不同尺寸和規(guī)格的檔案案卷,不斷調(diào)整掃描參數(shù)會(huì)增加更多數(shù)字化工作的時(shí)間。如果需要數(shù)字化的檔案幅面十分大,可能還需要將單獨(dú)掃描的部分拼接在一起。
有時(shí),檔案館會(huì)選擇用拍攝照片代替掃描,這樣就需要一個(gè)專業(yè)的照相設(shè)備,包括外部閃光燈、不同鏡頭等。另外,那些已經(jīng)損壞、褶皺、粗糙或反光的檔案也需要熟練的處理。
掃描并不會(huì)生成一份檔案的精確副本,而只是復(fù)原該份檔案的某些內(nèi)容。數(shù)字化過程還會(huì)產(chǎn)生元數(shù)據(jù)。為使計(jì)算機(jī)系統(tǒng)能夠理解和檢索文件集,對其進(jìn)行描述性工作是必要的。沒有此項(xiàng)工作,數(shù)字化工作產(chǎn)生的文件不過是成千上萬份未分類的無用文件。
因?yàn)閿?shù)字化工作牽扯大量時(shí)間和資源的投入,我們必須確保所做的選擇是正確的,這也意味著我們要將數(shù)字化處理的過程納入質(zhì)量控制檢查之中。
數(shù)字化工作的成果受到掃描分辨率、攝影技巧、錄入準(zhǔn)確性等一系列因素影響。作為檔案工作者,我們有責(zé)任確保人們獲得可靠、真實(shí)的文件記錄。
人們誤以為,信息一旦以數(shù)字形式被捕獲,將會(huì)自動(dòng)地被長期保存下來。而事實(shí)上并非如此。因此,這意味著檔案工作者還要對數(shù)字化產(chǎn)生的文件進(jìn)行定期維護(hù)。
數(shù)字文件被認(rèn)為具有非實(shí)體性、不受腐蝕的特點(diǎn)。然而,數(shù)字文件也具有實(shí)體狀態(tài),同時(shí)與自身所模擬的對象一樣,將經(jīng)歷劣化和失真的過程。數(shù)字化數(shù)據(jù)的實(shí)質(zhì)是數(shù)以百萬計(jì)的磁荷或電荷。亞原子水平的微小偏移足以引發(fā)一連串的錯(cuò)誤。即使是不在驅(qū)動(dòng)器上使用的數(shù)據(jù)也會(huì)隨著時(shí)間的推移而隨機(jī)劣化。
除了數(shù)據(jù)劣化的問題,檔案工作者還必須思考當(dāng)前文件格式在未來的可讀取性問題。如果在軟硬件設(shè)施過時(shí)的情況下,沒人能順利打開文件,那么進(jìn)行大規(guī)模的數(shù)字化工作將變得沒有意義。
因此,檔案工作者站在數(shù)字持久性的前端。他們正在研制通用的文件格式標(biāo)準(zhǔn),并對數(shù)字化數(shù)據(jù)定期更新、遷移、備份。順便說一句,實(shí)際上硬盤或閃存驅(qū)動(dòng)器的平均使用壽命無法與存儲(chǔ)在最佳環(huán)境下的紙張壽命相提并論。
數(shù)字化工作的開展依賴于大量技術(shù)設(shè)備和人力的投入。一些大型檔案館保留了由專業(yè)人員組成的數(shù)字化團(tuán)隊(duì)。較小機(jī)構(gòu)的文件數(shù)字化工作往往是在合作伙伴的資助下分散進(jìn)行的。
檔案工作者在將一組檔案完成數(shù)字化后,如實(shí)現(xiàn)在互聯(lián)網(wǎng)上共享,需要參照一個(gè)規(guī)范的流程。
首先,檔案工作者必須確保擁有第一時(shí)間自由分享這些檔案文件的權(quán)限。如一些檔案文件的捐贈(zèng)者并不希望某些內(nèi)容在特定時(shí)間內(nèi)被公眾獲??;健在公民的敏感性信息可能會(huì)隱藏于個(gè)人檔案中;檔案文件中涉及一些知識(shí)產(chǎn)權(quán)也可能被禁止廣泛分享。
毫無疑問的是,在開展數(shù)字化工作之前,我們通常會(huì)對檔案案卷進(jìn)行評估,以確定其是否為合格的檔案數(shù)字化和共享的候選者。這個(gè)評估的過程本身也需要時(shí)間,這導(dǎo)致數(shù)字化工作在時(shí)間和資源上的投資變得更大了。
希望通過上述介紹,大家能了解到檔案工作者正有條不紊地開展數(shù)字化項(xiàng)目的實(shí)際情況,以及為什么我們永遠(yuǎn)不能將所有檔案文件都數(shù)字化。數(shù)字化工作本身就是一個(gè)不斷發(fā)展的過程,實(shí)現(xiàn)檔案的訪問與獲取,傳播檔案知識(shí)和信息才是數(shù)字化的最重要的目的。
(全國總部)河南省鄭州市金水區(qū)博雅廣場4號樓1104
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號:豫ICP備11015869號-8