電 話:18937133779
網(wǎng) 址:http://www.tpiin.com
郵 箱:zboao@qq.com
所謂的檔案數(shù)字化,就是用現(xiàn)代的數(shù)字技術(shù)來管理各類檔案,流程是這樣的:檔案接收—檔案掃描—掃描圖片的處理—目錄和掃描好的電子圖片導(dǎo)入檔案管理軟件。黔東南檔案數(shù)字化公司就是通過一定的技術(shù)操作把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,網(wǎng)絡(luò)化的形式互相連接,利用計算機系統(tǒng)進(jìn)行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享。
檔案數(shù)字化|如何做好元數(shù)據(jù)掛接工
元數(shù)據(jù)著錄、數(shù)字化掃描工作結(jié)束之后,就需要進(jìn)行數(shù)據(jù)掛接,將目錄數(shù)據(jù)導(dǎo)入到檔案管理系統(tǒng)中,將數(shù)字化原文與目錄數(shù)據(jù)進(jìn)行關(guān)聯(lián),使之成為可以查詢檢索的數(shù)字化成果。本文主要談?wù)剶?shù)據(jù)掛接相關(guān)內(nèi)容。
《紙質(zhì)檔案數(shù)字化規(guī)范》對數(shù)據(jù)掛接的要求
1、應(yīng)借助相關(guān)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)與其對應(yīng)的紙質(zhì)檔案數(shù)字圖像進(jìn)行掛接,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)。
2、逐條對掛接結(jié)果進(jìn)行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對應(yīng)的準(zhǔn)確性、已掛接數(shù)字圖像與實際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯誤及時進(jìn)行糾正。
數(shù)據(jù)掛接的形式
1.手工上傳掛接
現(xiàn)在的檔案管理軟件一般都提供手工上傳原文進(jìn)行掛接的形式,元數(shù)據(jù)著錄完畢即形成一條目錄數(shù)據(jù),通過點擊“上傳”按鈕將數(shù)字化掃描原文與目錄數(shù)據(jù)進(jìn)行關(guān)聯(lián)對應(yīng),即為掛接。此種方式,數(shù)據(jù)關(guān)聯(lián)的準(zhǔn)確性高,對數(shù)字化掃描件的要求不高,數(shù)據(jù)存儲管理即使不是很科學(xué),也可以實現(xiàn)數(shù)據(jù)關(guān)聯(lián)。
手工掛接的缺點也很明顯,就是手工操作效率較為低下,單位時間內(nèi)完成工作量及其低下,一般很少工作量,或者需要修改更正的情況下可以使用手工掛接。
2.批量原文掛接
檔案管理軟件一般都有批量原文掛接的功能,批量掛接的前提是嚴(yán)格按照《紙質(zhì)檔案數(shù)字化規(guī)范》進(jìn)行原文存儲管理、圖像命名。既要符合國標(biāo)標(biāo)準(zhǔn),又需要檔案管理部門自身制定詳細(xì)的管理方案,具體的存儲路徑,如磁盤怎么區(qū)分、門類、全宗、年度、期限怎么在磁盤路徑中體現(xiàn);具體的圖像命名,單頁掃描件怎么命名,多頁掃描件怎么命名,是都保存,還是只保存一部分等等。
檔案管理軟件的批量原文掛接功能,一般是以檔號為基準(zhǔn)來實現(xiàn)目錄數(shù)據(jù)和原文數(shù)據(jù)的關(guān)聯(lián)。這就要求,首先要有準(zhǔn)確的“檔號”目錄數(shù)據(jù),按照檔案整理方案、檔案著錄規(guī)則,錄入元數(shù)據(jù)后,生成“檔號”;其次數(shù)字化掃描過程中,文件夾以檔號命名,數(shù)字圖像以檔號為基礎(chǔ)命名,只有這樣才能有實現(xiàn)批量原文掛接的可能。
批量原文掛接的實現(xiàn)途徑,主要是原文文件名或者原文文件夾名和目錄數(shù)據(jù)庫中的關(guān)鍵字段(一般為檔號),進(jìn)行匹配,匹配成功即傳輸原文到相應(yīng)磁盤位置,同時將磁盤路徑位置寫入對應(yīng)目錄數(shù)據(jù)庫中,完成原文掛接操作。批量掛接可以自動化實現(xiàn)成千上萬條數(shù)據(jù)的關(guān)聯(lián)工作,工作效率高,出錯概率底。目前,基本上采用這種形式進(jìn)行數(shù)據(jù)掛接。
元數(shù)據(jù)掛接的要求
1.元數(shù)據(jù)著錄的規(guī)范性
需要按照《檔案著錄規(guī)則》(DA/T18-1999)、《文書檔案文件級目錄數(shù)據(jù)庫結(jié)構(gòu)與著錄細(xì)則》(DB34/T450-2004)等標(biāo)準(zhǔn)規(guī)范,確定檔案數(shù)據(jù)庫的結(jié)構(gòu)標(biāo)準(zhǔn)、元數(shù)據(jù)字段、著錄的規(guī)則等。項目開展前進(jìn)行技能培訓(xùn),合格才能上崗,著錄過程中嚴(yán)格按照標(biāo)準(zhǔn)規(guī)范進(jìn)行,遇到特殊情況及時反饋,確保著錄的準(zhǔn)確性、規(guī)范性。
①檔號組成項需要著錄規(guī)范。
如全宗號、歸檔年度、保管期限、檔案門類代碼、實體分類號、項目號、卷/件號等。一般在檔案管理軟件中“全宗號、歸檔年度、保管期限、檔案門類代碼、實體分類號、項目號”可以設(shè)置為自動繼承,“卷/件號”要能夠自動加一。在具體的著錄過程中,“保管期限、歸檔年度”的更迭要注意“卷/件號”是否對應(yīng)調(diào)整。
?、凇绊摂?shù)、頁碼”需要填寫準(zhǔn)確。
優(yōu)秀的檔案管理軟件不僅僅要有批量掛接原文的能力,同時需要具有檢測原文的能力?,F(xiàn)在的檔案整理規(guī)范,無論是以件為單位的檔案,還是以卷為單位的檔案,都要求編寫頁碼,一方面便于查找利用,另一方面是對檔案規(guī)范管理的要求。元數(shù)據(jù)著錄的過程,需要將“頁數(shù)、頁碼”手工著錄進(jìn)入系統(tǒng)中,由于手工著錄,此兩碼常常會有錯誤,而且不容易發(fā)現(xiàn)錯誤,如何解決就是個難題。原文掛接的過程中,增加統(tǒng)計、匹配能,將原文的數(shù)量與著錄的數(shù)量進(jìn)行對比,很容易發(fā)現(xiàn)問題,進(jìn)而解決問題。
有的數(shù)字化加工企業(yè),還使用了先掃描,后統(tǒng)計頁數(shù),再將頁數(shù)反向?qū)肽夸浽獢?shù)據(jù)的“頁數(shù)”中。
2.數(shù)字化掃描的規(guī)范性
按照《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T31—2017)選擇合適的存儲格式,以檔號為基礎(chǔ)對數(shù)字圖像命名,科學(xué)建立紙質(zhì)檔案數(shù)字圖像的存儲路徑。
3.提高批量掛接的準(zhǔn)確性
我們常常會遇到原文和目錄不對應(yīng),所見非所得,都在抱怨是掛接的錯誤,手工掛接或許會有錯誤,自動化的批量掛接是不會有錯誤的,如果有錯誤要么是著錄元數(shù)據(jù)時出錯了,要么是數(shù)字化掃描的過程出錯了。需要規(guī)范著錄、掃描的全過程,做到有人做、有人查、有人管。
無論是軟件的開發(fā)方還是數(shù)字化的參與方,都應(yīng)該想方設(shè)法提高數(shù)據(jù)的準(zhǔn)確性。檔案數(shù)字化是個技術(shù)含量較低的行業(yè),但是處理的數(shù)據(jù)量較為龐大,而且大多是手工操作,錯誤率一致居高不下,如何解決這個問題,需要將管理與技術(shù)相結(jié)合,一方面嚴(yán)格按照操作流程進(jìn)行實施,另一方面將現(xiàn)代化的技術(shù)手段融入其中,用軟件來檢測成果,提高準(zhǔn)確性。
1、檔案整理標(biāo)準(zhǔn)
將分散的材料補充到文件中。對每一份材料嚴(yán)格把關(guān),按類編號,頁碼進(jìn)行編注,編碼不能出現(xiàn)重復(fù),次序混亂。
檔案材料整理完畢后,用鉛筆在每份材料的第一頁右上角編好版號和序號,并在右下角寫上頁碼;紙張要求A4或B5格式,其他格式的文件需要改為A4版本。
2、打印訂裝標(biāo)準(zhǔn)
打印文件目錄;為符合《檔案整理細(xì)則》的規(guī)定,裝訂時一定要做到底側(cè)整齊,左側(cè)整齊。
3、目錄錄入標(biāo)準(zhǔn)
文件目錄的錄入要嚴(yán)格準(zhǔn)確,具體要求如下:一是單記一條,不多記,少記;二是輸入的目錄內(nèi)容與檔案內(nèi)容完全一致,不得有差錯。
4、掃描圖像標(biāo)準(zhǔn)
檢查文件的掃描圖像,圖像的排列順序與紙質(zhì)文件的排序要求一致;圖像清晰無雜質(zhì),亮度不易太強,但適中。
分辨率為300DPI的圖像必須進(jìn)行校正和打孔,圖像在每條中心線的起點和終點的傾斜度不得超過1°。
5、圖像處理標(biāo)準(zhǔn)
基于原始圖像質(zhì)量:圖像排序要求與原始圖像排序要求一致的圖像去除污點、黑點、黑邊,肉眼可見清晰、平坦、清潔的布局采用自動中央操作的圖像不得與原始圖像過濃或過淡,字跡清晰。
6、存儲處理標(biāo)準(zhǔn)
存儲是對檔案信息的完整評估;檢查和校準(zhǔn)目錄、原始、高清白色圖像和高清黃色圖像,以滿足驗收標(biāo)準(zhǔn)。原則上,存儲需要單獨存儲在服務(wù)器上,如果條件不能滿足,也可以用單獨的計算機代替。
二、優(yōu)化建議
1、增強數(shù)字化加工人員的安全意識
可以在一定程度上減少信息泄露,應(yīng)運用風(fēng)險控制的思想定期進(jìn)行評估。
例如處理場地分散所帶來的文件實體風(fēng)險,及時制定可行的應(yīng)急策略,從而規(guī)范信息安全應(yīng)急響應(yīng),能夠有效預(yù)先預(yù)防.
及時控制和最大限度地消除各種突發(fā)事件的危害和影響,使安全危機在初期得以消除。
2、完善安全監(jiān)管體系
檔案數(shù)字化處理必須堅持法治,加強監(jiān)督和指導(dǎo),制定科學(xué)、合理、詳細(xì)的安全管理措施;
其次,進(jìn)一步完善管理機構(gòu),明確分工,責(zé)任到人,建立覆蓋檔案數(shù)字化全過程的領(lǐng)導(dǎo)責(zé)任制和崗位安全責(zé)任制;實行監(jiān)督機制。
由檔案管理機構(gòu)和保密監(jiān)督部門共同制定監(jiān)督考核制度,對數(shù)字化服務(wù)機構(gòu)的處理進(jìn)度和保密措施的落實情況進(jìn)行監(jiān)督檢查。