電 話:18937133779
網 址:http://www.tpiin.com
郵 箱:zboao@qq.com
十堰檔案整理服務公司:隨著檔案信息化工作的不斷推進,越來越多的檔案館、檔案室都參與到紙質檔案數(shù)字化的工作中來。信息化的基礎是數(shù)字化,只有不斷提高館藏檔案的數(shù)字化率才能更好地發(fā)揮檔案價值,才能更好地保護檔案,才能更好地讓社會、群眾利用檔案資源。
《紙質檔案數(shù)字化規(guī)范》(DA/T31—2017)為紙質檔案數(shù)字化工作提出了規(guī)范性要求,本文結合標準里的數(shù)字化前處理工作,結合近年來的工作經驗談談如何做好這項工作。
1.確定掃描頁
《規(guī)范》要求:
原則上應將確定為數(shù)字化對象的紙質檔案全部掃描,不宜進行挑掃。如有不需要掃描的頁面應加以標注。
工作思考:
?。?)對待整理的檔案進行分析研究,有哪幾種門類的檔案,各種門類的檔案又有哪些類別;
?。?)制定針對本項目的檔案分類整理方案,主要包括如何分類,分類代碼的編制,檔號組成的規(guī)定,如何確定歸檔范圍,如何確定保管期限,制定完善的檔案分類整理方案報業(yè)主單位、檔案行政管理部門審批;
(3)審批通過后,按照制定的方案對檔案進行分類、剔除重復件、剔除不歸檔材料、區(qū)分歸檔年度、鑒定保管期限、排列文件材料的先后順序等;
?。?)一般將保管期限為“30年”及以上的,確定為數(shù)字化對象;
?。?)密級檔案的數(shù)字化需要在涉密網絡環(huán)境中進行,如達不到安全保密要求,則不能數(shù)字化掃描,對此部分檔案需要特殊標注。
?。?)數(shù)字化項目開展的前期需要進行科學謀劃,預算資金充沛,對確定為數(shù)字化的對象全部進行掃描。
2.編制頁號
《規(guī)范》要求:
2.1應對沒有頁號或頁號不正確的檔案重新編制頁號。
2.2重新編制頁號時,應在統(tǒng)一位置書寫頁號,且不壓蓋檔案內容。
2.3書寫頁號所使用的筆、墨等不應破壞檔案原件或對檔案長期保存造成影響。
2.4應將破損頁面、缺頁等特殊情況進行登記。
工作思考:
(1)編制頁號就是為了確定紙質檔案的頁數(shù),確保紙質檔案頁和掃描電子檔案頁一致;
?。?)編制頁號的過程如發(fā)現(xiàn)檔案頁有缺頁需要及時聯(lián)系移交單位查明原因,補差補缺;如發(fā)現(xiàn)有重頁需要剔除;如發(fā)現(xiàn)破損頁,需要進行技術處理,搶救保護。缺頁、重頁、破損頁,處理的過程中都需要進行登記。
?。?)為了保護檔案原件,書寫的筆一般采用鉛筆,可以使用材質較軟的2B鉛筆,不建議使用帶筆芯的HB自動鉛筆,更不能使用圓珠筆。
?。?)編制頁碼是前處理工作中“最困難”的工作,就是因為它的枯燥性,大量的、重復的、機械的勞動容易使人疲勞,容易出錯,一定要采取措施保證編制頁碼的準確性和規(guī)范性。
3.目錄數(shù)據準備
《規(guī)范》要求:
3.1按照目錄數(shù)據庫建立時制定的數(shù)據規(guī)則,對照檔案原件內容,規(guī)范檔案中的目錄內容。
3.2對需在目錄數(shù)據庫中進行標記的情況進行標記。
工作思考:
?。?)文書檔案按照《文書類電子文件元數(shù)據方案》(DA/T46-2009)建立目錄數(shù)據庫字段;照片類檔案按照《照片類電子檔案元數(shù)據方案》(DA/T54-2014)建立目錄數(shù)據庫字段;錄音錄像類檔案按照《錄音錄像類電子檔案元數(shù)據方案》(DA/T63-2017)建立目錄數(shù)據庫字段;
(2)其他門類檔案根據實際需要建立目錄數(shù)據庫字段;
(3)根據需要選擇合適的字段值類型,數(shù)值型、日期型、文本型等;選擇合適的字段值長度,如題名、人名、備注等項要能夠存儲足夠多的內容。
4.拆除裝訂
《規(guī)范》要求:
應以對紙質檔案的保護為原則確定是否拆除裝訂。如需拆除裝訂物,應注意保護檔案不受損害,并對排列順序不準確的檔案進行重排。特殊裝訂且拆除裝訂后需恢復的檔案,在拆除裝訂物時應采用拍照等方式記錄檔案原貌,以便于恢復。
工作思考:
?。?)拆除裝訂的原因有兩個,一是原裝訂材質銹腐需要更換,另一個是為了數(shù)字化掃描方便;無論哪種原因都需要以保護檔案為前提,在拆除裝訂的過程中檔案本身不能發(fā)生二次傷害;
?。?)注意拆除裝訂后檔案頁的擺放,切記不能堆放過高,一旦風吹、倒塌造成混亂很難進行清點;
?。?)數(shù)字化著錄和數(shù)字化掃描,一般不是同一個工作人員,著錄人員一般不看掃描件,掃描人員一般不看著錄數(shù)據,很多情況著錄和掃描能夠對應全憑運氣。特別是以卷為單位的檔案,不像以件為單位的檔案可以靠歸檔章來區(qū)分。這就需要拆除裝訂后需要做好標識,便于著錄和掃描工作的開展。
5.技術修復
《規(guī)范》要求:
5.1破損嚴重或其他無法直接進行掃描的紙質檔案,應先由專業(yè)技術人員進行技術修復。
5.2折皺不平影響掃描質量的紙質檔案應先進行壓平等相應技術處理。
工作思考:
?。?)對破損檔案進行修復,參照《紙質檔案搶救與修復規(guī)范》(DA/T64-2017);
?(2)有折痕、疊角等情況的檔案頁需要平整后才能掃描,可以采用重物壓的方法,熨斗等方法慎重考慮使用;
?。?)小于頁面1/2的檔案頁需要進行裱糊,裱糊盡量不使用漿糊;字跡清淡的檔案頁,可以加深墨跡的形式再保留一份復印件。
十堰檔案整理服務公司:紙質檔案數(shù)字化的基本環(huán)節(jié)主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數(shù)據掛接、數(shù)據驗收、數(shù)據備份等。
具體流程如下:
?。ㄒ唬n案整理
在掃描之前,根據檔案管理情況,按下述步驟對檔案進行適當整理,并視需要作出標識,確保檔案數(shù)字化質量。
1、目錄數(shù)據準備
按照《檔案著錄規(guī)則》(DA/T 18)等的要求,規(guī)范檔案中的目錄內容,包括確定檔案目錄的著錄項、字段長度和內容要求。如有錯誤或不規(guī)范的案卷題名、文件名、責任者、起止頁號和頁數(shù)等,應進行修改。
2、拆除裝訂
在不去除裝訂物情況下,影響掃描工作進行的檔案,應拆除裝訂物;將檔案原件的裝訂線拆除,排好順序,不得出現(xiàn)任何漏缺頁及順序差錯,更不能對檔案原件有任何損壞。
3、區(qū)分掃描件和非掃描件
按要求把同一案卷中的掃描件和非掃描件區(qū)分開。普發(fā)性文件區(qū)分的原則是:無關的重份的文件要剔除,有正式件的文件可以不掃描原稿。
4、頁面修整
對破損嚴重、無法直接進行掃描的檔案,應先進行技術修復、裱糊;
折皺不平影響掃描質量的原件應先進行相應處理(壓平或燙平等)后再進行掃描。
5、檔案整理登記
制作并填寫紙質檔案數(shù)字化加工過程登記表,詳細記錄檔案整理后每份文件的起始頁號和頁數(shù)。
(二)檔案掃描
1、掃描方式(掃描前必須準備一臺專業(yè)的平板掃描儀)
根據檔案幅面的大小(A4、A3、AO等)選擇相應規(guī)格的掃描儀或專業(yè)擔描儀,如
工程圖紙可采用0號圖紙掃描儀進行掃描。
普通A4紙質文件,采用高速掃描儀的自動進紙方式掃描;
紙質過薄、透明的(如信紙、便簽紙)采用高速掃描儀的平板掃描;
紙質過厚、照片等檔案采用高速掃描儀的平板掃描;
對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;2、掃描模式(紙質檔案掃描一般采用黑白、灰度和彩色三種模式)
頁面為黑白兩色,字跡清晰的、不帶圖片的檔案材料,采用黑白方式;
頁面為黑白兩色,清晰度較差或者帶有圖片的檔案材料,以及頁面多為彩色文字的檔案,采用彩色或灰度模式(因情況而定);
頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,采用彩色模式掃描。
3、分辨率選擇
采用黑白、256級灰度模式掃描的文件,其分辨率選擇為不小于300DPI;
采用24位為彩色模式掃描的文件,其分辨率選擇為不小于200DPI。(以上模式分辨率的設定以A4紙張為標準,其他規(guī)格紙張酌情處理)
掃描的線數(shù)、閥值、亮度、灰度、對比度等值可根據所掃描文件材料的清晰度進行適當?shù)恼{整;
需要時可根據原件的清晰度適當調整掃描分辨率。如原件質量較差且尺寸較小,可適當提高分辨率;反之也可相應減少分辨率,增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準;
粘貼折頁與表格,對于粘貼折頁,可用大幅面掃描儀掃描,或先部分掃描后拼接;對部分字體很小、字跡密集的情況,可適當提高掃描分辨率,選擇灰度掃描或彩色掃描,采用局部深化技術解決;對字跡與表格顏色深度不同的,采用局部淡化技術解決。
4、掃描登記
填寫交接登記表,登記掃描的頁數(shù)。核對每份文件的實際掃描頁數(shù)與檔案整理時填寫的文件頁數(shù)是否一致,不一致時應注明具體原因和處理方法。
?。ㄈ﹫D像處理
對圖像進行處理,以獲得最好的圖像質量,保證圖像完整、端正、無扭區(qū)、版面無暗影、無干擾信息,主要完成圖像處理包括:去黑邊、去污點、糾偏等,處理完的圖像保存格式為PDF。
糾偏:對掃描過程中出現(xiàn)的偏斜圖像進行整體糾正,包括自校和手校,保證數(shù)字圖像的偏斜角度小于1度(圖像偏斜不超過頁面內半個文字);
旋轉:按方字方向將圖片旋轉至正確方向,沒有文字的圖片,判斷其方向后進行左旋、右旋、翻轉、旋轉等工具;
去污:對圖像頁面中出現(xiàn)的影響圖像質量的雜質,去除數(shù)字圖像中影響可懂度的雜質,如去除黑邊、多余邊、污點;
裁邊:采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲空間。
刪除空白頁:將掃描后頁面之間的空白頁進行刪除;
斷字修補:對部分文字不清楚可進行修補;
反白字修正:將部分反白文字可進行描述;
分割:將A3幅面的文件分割為兩份A4幅面的文件;
拼接:對大幅面檔案進行分區(qū)掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數(shù)字化圖像的整體性。
?。ㄋ模﹫D像處理質檢
主要對完成圖像深處理的檢查,不合要求的返回上一環(huán)節(jié)重新處理,如以下問題:
由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描;
對圖像偏斜度、清晰度、失真度等進行檢查。發(fā)現(xiàn)不符合圖像質量要求時,應重新進行圖像的處理;
圖像處理的是否得當,嚴重的應重掃,處理不當?shù)膽匦绿幚恚?/p>
掃描圖像頁碼順序是否與原文件一致,有無漏掃、多掃(重復)、紙張倒置等情況;
順序:如果頁碼不連續(xù),與原文不一致,需對頁面進行排序;
漏掃:將漏掃的頁面重新掃描,并插入到正確的位置;
多掃:將多掃頁面刪除;
倒置:不符合要求的需進行調整,保持與原文一致。
(五)圖像存儲
紙質檔案目錄數(shù)據庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。多頁文件要合并為一個PDF,保存到指定的路徑,便于準確掛接入庫,與檔案管理軟件中的目錄建立一一對應的關系。再將所有文檔批量轉換為可以復制、檢索利用的雙層PDF格式,然后進行光盤刻錄,確??啼浐玫墓獗P能正確地讀出,并做好標識標簽。
注:禁止用Word文檔保存掃描圖像。
?。┠夸浗◣?/p>
按照《檔案著錄規(guī)則》(DA/T 18)的要求進行著錄,建立檔案目錄數(shù)據庫。目錄建庫應選擇通用的數(shù)據格式。所選定的數(shù)據格式應能直接或間接通過XML文檔進行數(shù)據交換。
注:采用人工校對或軟件自動校對的方式,對目錄數(shù)據庫的建庫質量進行檢查。核對著錄項目是否完整、著錄內容是否規(guī)范、準確,發(fā)現(xiàn)不合格的數(shù)據應要求進行修改或重錄。
?。ㄆ撸?shù)據掛接
1、掛接前的數(shù)據關聯(lián)檢查
以紙質檔案目錄數(shù)據庫為依據,將每一份紙質檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時,要認真核查每一份圖像文件的名稱與檔案目錄數(shù)據庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關聯(lián)關系,為實現(xiàn)檔案目錄數(shù)據庫與圖像文件的批量掛接提供條件。
2、匯總掛接
檔案數(shù)字化轉換過程中形成的目錄數(shù)據庫與圖像數(shù)據庫,通過質檢環(huán)節(jié)確認為"合格"后,通過網絡及時加載到數(shù)據服務器端匯總。通過編制程序或借助相應軟件,可實現(xiàn)目錄數(shù)據對相關聯(lián)的數(shù)字圖像的自動搜索、加入對應的電子地址信息等,實現(xiàn)批量、快速掛接。
?。ò耍?shù)據驗收
一個全宗的檔案,數(shù)字化轉換質量抽檢的合格率達到95%以上(含95%)時,給予以驗收“通過”。目錄數(shù)據庫與圖像文件掛接錯誤,或目錄數(shù)據庫、圖像文件之一出現(xiàn)不完整、不清晰、有錯誤等質量問題時,抽檢標記為"不合格"。
驗收"通過"的結論,必須經分管領導審核、簽字后方有效。
填寫紙質檔案數(shù)字化交接登記表。
?。ň牛?shù)據備份
經驗收合格的完整數(shù)據應及時進行備份。著錄條目和全文數(shù)據進行一式兩份DVD光盤刻錄。移交前檢測光盤讀取性能,抽查刻錄好的光盤影像質量,主要包括備份數(shù)據能否打開、數(shù)據信息是否完整、文件數(shù)量是否準確等。不合格的需重新刻錄。數(shù)據備份后應在備份介質上標注好盤內文件內容、類別、存入日期及光盤編號等,以便查找和管理。對保密的需標明密級。
?。ㄊ┭b訂
掃描工作完成后,拆除過裝訂物的檔案應按檔案保管的要求重新裝訂?;謴脱b訂時,應注意保持檔案的排列順序不變,做到安全、準確、無遺漏。
裝訂不能損害檔案原件。裝訂時應按原有順序裝訂,案卷不掉頁、左邊和底邊整齊,保持拆卷前的原貌,并認真做好檔案頁碼、頁數(shù)的檢查對較。
(十一)掃描注意事項
掃描前必需對文檔進行拆除裝訂物,并檢查文檔內是否藏有干擾物(如釘書釘、碎紙等),以免產生卡紙、損壞掃描儀,務必保持文檔干凈送入掃描儀中;
對破損嚴重、無法進行掃描的原件要先進行修復、裱糊;
褶皺不平影響掃描質量的原件應先壓平再進行掃描;
對紙質過薄、透明的(如信紙、便簽紙)、紙質過厚、照片等采用高速掃描儀的平板掃描;
對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;
掃描完每一份文件,要對照原文仔細檢查掃描是否清晰、完整;
按要求使用掃描儀、清洗,并對每次使用完掃描儀進行保潔,檢查是否關閉電源;
紙質檔案數(shù)字化成果提供網上檢索利用時,應有制作單位的電子標識,并根據具體情況分別采用可下載或不可下載的數(shù)據格式。