電 話:18937133779
網(wǎng) 址:http://www.tpiin.com
郵 箱:zboao@qq.com
原創(chuàng) 李寶玲 李珂 中國檔案雜志 1周前
河南省數(shù)字檔案館經(jīng)過需求調(diào)研、立項(xiàng)、設(shè)計(jì)、建設(shè)、應(yīng)用,完成了建設(shè)任務(wù),實(shí)現(xiàn)了數(shù)字檔案館的基本功能,滿足了電子政務(wù)背景下政府對信息系統(tǒng)及信息資源互聯(lián)互通、共建共享、安全高效的要求。
建設(shè)思路與任務(wù)
1.河南省數(shù)字檔案館建設(shè)的整體思路
河南省檔案館依據(jù)國家檔案局《數(shù)字檔案館建設(shè)指南》及《數(shù)字檔案館系統(tǒng)測試辦法》,充分借鑒先進(jìn)省市數(shù)字檔案館建設(shè)的經(jīng)驗(yàn),明確了河南省數(shù)字檔案館建設(shè)的思路。一是堅(jiān)持統(tǒng)一規(guī)劃、頂層設(shè)計(jì)。河南省數(shù)字檔案館立足于滿足省館本身的需要,又考慮到省直立檔單位數(shù)字檔案室建設(shè)和市、縣級數(shù)字檔案館建設(shè)的需要,特別是考慮到全省數(shù)字檔案資源的共建共享需要,從網(wǎng)絡(luò)、系統(tǒng)、規(guī)范、資源、培訓(xùn)等方面加強(qiáng)頂層規(guī)劃和設(shè)計(jì)。二是一體兩翼,整體推進(jìn)。以省數(shù)字檔案館建設(shè)為主體,以省直單位電子檔案管理應(yīng)用及市、縣級數(shù)字檔案館應(yīng)用為兩翼,統(tǒng)籌兼顧,整體推進(jìn),逐步實(shí)現(xiàn)數(shù)字檔案館、室建設(shè)一體化,省、市數(shù)字檔案館建設(shè)一體化。三是“借船出?!?,互聯(lián)互通。在電子政務(wù)背景下,業(yè)務(wù)系統(tǒng)和信息資源通過政府網(wǎng)絡(luò)實(shí)現(xiàn)了深度整合與共享,河南省電子政務(wù)網(wǎng)(包括省電子政務(wù)外網(wǎng)和省電子政務(wù)內(nèi)網(wǎng))成為各層級、各單位業(yè)務(wù)互聯(lián)互通、資源共享的主要通道。河南省數(shù)字檔案館依托省電子政務(wù)外網(wǎng)部署數(shù)字檔案室系統(tǒng)、電子檔案移交接收系統(tǒng)和資源共享系統(tǒng),實(shí)現(xiàn)省直單位電子檔案的在線移交接收,各級檔案館異地查閱、跨館出證和資源共享。四是夯實(shí)基礎(chǔ),循序漸進(jìn)。河南省立足于數(shù)字檔案館基本功能,融入智慧理念,在系統(tǒng)設(shè)計(jì)、平臺建設(shè)、技術(shù)應(yīng)用方面具有先進(jìn)性、兼容性和擴(kuò)展性;在資源建設(shè)上,按照“存量數(shù)字化、增量電子化”原則,在規(guī)范化、多元化、特色化上下功夫。
2.河南省數(shù)字檔案館建設(shè)的主要任務(wù)
河南省數(shù)字檔案館建設(shè)任務(wù)主要包括標(biāo)準(zhǔn)規(guī)范建設(shè)、檔案應(yīng)用平臺建設(shè)、基礎(chǔ)支撐體系建設(shè)、標(biāo)準(zhǔn)機(jī)房建設(shè)、信息安全保障體系建設(shè)、數(shù)字資源建設(shè)以及人員培訓(xùn)等,概括起來就是“一庫”“兩中心”“三個服務(wù)平臺”“四個保障體系”。
“一庫”指河南省數(shù)字檔案館資源總庫,通過硬件設(shè)施、軟件系統(tǒng)、數(shù)字資源建設(shè),把數(shù)字檔案館建成長期保存的數(shù)字檔案資源總庫。
“兩中心”指通過新館、老館兩個機(jī)房進(jìn)行同城備份,建成數(shù)字檔案備份中心和數(shù)字檔案查詢利用中心。
“三個服務(wù)平臺”指基于局域網(wǎng)的館藏?cái)?shù)字檔案資源服務(wù)平臺、基于省電子政務(wù)外網(wǎng)的全省數(shù)字檔案資源共享服務(wù)平臺、基于互聯(lián)網(wǎng)的公開檔案數(shù)字資源服務(wù)平臺。三個服務(wù)平臺能夠滿足檔案館、立檔單位、社會各類用戶對數(shù)字檔案資源的利用需求,實(shí)現(xiàn)全省各綜合檔案館開放數(shù)字檔案資源在互聯(lián)網(wǎng)上的共享利用、民生檔案在省電子政務(wù)外網(wǎng)上的跨館查閱以及各單位對本單位數(shù)字檔案資源在省電子政務(wù)外網(wǎng)上的自助利用服務(wù)。
“四個保障體系”指通過對基礎(chǔ)設(shè)施、標(biāo)準(zhǔn)規(guī)范、安全體系、人才隊(duì)伍建設(shè),為數(shù)字檔案館建設(shè)提供全面的保障。
建設(shè)成效
1.建立了一套適用的標(biāo)準(zhǔn)規(guī)范
依據(jù)國家檔案局關(guān)于數(shù)字檔案館及電子文件、電子檔案管理的標(biāo)準(zhǔn)規(guī)范,結(jié)合河南省數(shù)字檔案館建設(shè)的實(shí)際,河南省檔案館建立和完善了一套數(shù)字檔案館建設(shè)和應(yīng)用的標(biāo)準(zhǔn)規(guī)范體系。如:制定了河南省標(biāo)準(zhǔn)《政務(wù)服務(wù)網(wǎng)電子文件歸檔數(shù)據(jù)規(guī)范》(DB41/T 1700.5—2019);以省“兩辦”名義印發(fā)了《河南省電子文件歸檔與電子檔案管理暫行辦法》;制定了《河南省檔案館紙質(zhì)檔案數(shù)字化成果接收暫行辦法》《河南省檔案館數(shù)字檔案資源共享管理暫行辦法》《河南省數(shù)字檔案館應(yīng)急預(yù)案及災(zāi)難恢復(fù)方案》《河南省檔案館文書、照片、音視頻檔案目錄數(shù)據(jù)庫結(jié)構(gòu)規(guī)范》《河南省檔案館紙質(zhì)、照片、音視頻檔案數(shù)字化技術(shù)規(guī)范》《河南省數(shù)字檔案館數(shù)據(jù)交換接口技術(shù)規(guī)范》《河南省檔案館光盤、硬盤管理規(guī)范》等一套標(biāo)準(zhǔn)規(guī)范,使數(shù)字檔案館建設(shè)和應(yīng)用有規(guī)可依,有規(guī)能依。
2.實(shí)現(xiàn)了數(shù)字檔案館的基本功能
河南省數(shù)字檔案館邏輯架構(gòu)圖
河南省檔案館在對網(wǎng)絡(luò)、用戶、信息流、業(yè)務(wù)流充分調(diào)研的基礎(chǔ)上,明確了網(wǎng)絡(luò)應(yīng)用、業(yè)務(wù)流程、信息類型與數(shù)量、并發(fā)用戶與響應(yīng)速度、安全等級與策略等功能需求,確定了可行的技術(shù)路線和技術(shù)架構(gòu),做到需求明確、邏輯清晰、功能齊全、技術(shù)先進(jìn)、安全可靠,實(shí)現(xiàn)了對館藏檔案的數(shù)字化管理、電子檔案的在線接收和長期保存及區(qū)域數(shù)字檔案資源的共建共享。
(1)邏輯架構(gòu)
局域網(wǎng)的數(shù)據(jù)中心采用虛擬架構(gòu),由基礎(chǔ)設(shè)施層、數(shù)據(jù)資源層、支撐平臺層、應(yīng)用系統(tǒng)層、用戶接入層共五大層次,以及標(biāo)準(zhǔn)規(guī)范體系、實(shí)施保障體系、安全保障體系三大體系組成。河南省數(shù)字檔案館邏輯架構(gòu)如圖所示。
基礎(chǔ)設(shè)施層:①網(wǎng)絡(luò)服務(wù)層次:提供局域網(wǎng)、省電子政務(wù)外網(wǎng)和互聯(lián)網(wǎng)3種系統(tǒng)訪問途徑,其中,省電子政務(wù)外網(wǎng)與局域網(wǎng)物理隔離,互聯(lián)網(wǎng)與局域網(wǎng)物理隔離,省電子政務(wù)外網(wǎng)和互聯(lián)網(wǎng)邏輯隔離。②平臺基礎(chǔ)設(shè)備層次:包括虛擬化服務(wù)器、存儲、光纖交換機(jī)、防火墻、路由器。③虛擬化服務(wù)平臺:采用虛擬化軟件虛擬出各檔案應(yīng)用服務(wù)器、備份服務(wù)器、數(shù)據(jù)庫服務(wù)器、數(shù)據(jù)交換服務(wù)器,用于部署上層平臺系統(tǒng)。
數(shù)據(jù)資源層:數(shù)字資源是數(shù)字檔案館建設(shè)的重點(diǎn),根據(jù)檔案信息資源體系的規(guī)劃,建立目錄數(shù)據(jù)庫、電子檔案庫、數(shù)字化成果庫、多媒體數(shù)據(jù)庫、標(biāo)準(zhǔn)規(guī)范庫和系統(tǒng)維護(hù)庫6個資源庫。根據(jù)檔案“收、管、存、用”的業(yè)務(wù)要求,對接收庫、管理庫、保存庫和利用庫進(jìn)行邏輯劃分和數(shù)據(jù)同步。
支撐平臺層:按照SOA服務(wù)的理念,構(gòu)建應(yīng)用基礎(chǔ)平臺與工具軟件。支撐平臺包括:基礎(chǔ)組件平臺、系統(tǒng)管理平臺、系統(tǒng)配置平臺、工作流平臺、信息發(fā)布平臺、報(bào)表平臺。工具軟件包括:Web文檔控件、格式轉(zhuǎn)換工具、四性檢測工具、全文檢索工具、OCR識別工具、通用瀏覽工具、流媒體服務(wù)等,為應(yīng)用系統(tǒng)的建設(shè)提供支撐。
應(yīng)用系統(tǒng)層:根據(jù)檔案業(yè)務(wù)管理、資源管理、用戶管理的需求,開發(fā)部署館藏檔案綜合管理系統(tǒng)等15個業(yè)務(wù)系統(tǒng)。
用戶接入層:面向省、市、縣三級檔案館,省直立檔單位和社會公眾等系統(tǒng)終端用戶,提供服務(wù)。
(2)應(yīng)用系統(tǒng)功能及部署
應(yīng)用系統(tǒng)建設(shè)是數(shù)字檔案館功能實(shí)現(xiàn)的核心。河南省數(shù)字檔案館應(yīng)用系統(tǒng)建設(shè)在滿足數(shù)字檔案的“收、管、存、用”等基本功能的基礎(chǔ)上,充分體現(xiàn)了前端控制、全流程管理、面向服務(wù)、安全高效的理念,建成了基于局域網(wǎng)、省電子政務(wù)外網(wǎng)、互聯(lián)網(wǎng)3個網(wǎng)絡(luò)平臺的15套業(yè)務(wù)系統(tǒng),并按照業(yè)務(wù)、用戶、數(shù)據(jù)的特性,對各業(yè)務(wù)系統(tǒng)進(jìn)行歸類管理,提供3個入口地址,其中:局域網(wǎng)平臺以館藏檔案綜合管理系統(tǒng)為入口,省電子政務(wù)外網(wǎng)平臺以河南檔案業(yè)務(wù)網(wǎng)站為入口,互聯(lián)網(wǎng)平臺以共享系統(tǒng)前臺部分為入口。
基于3個網(wǎng)絡(luò)平臺的15套業(yè)務(wù)系統(tǒng)包括:
依托局域網(wǎng)的應(yīng)用系統(tǒng)共有7個:
①館藏檔案綜合管理系統(tǒng),面向檔案館內(nèi)部工作人員提供應(yīng)用,實(shí)現(xiàn)數(shù)字資源的采集、接收、整理、保管、鑒定、編研、統(tǒng)計(jì)等全過程規(guī)范化管理。
②多媒體檔案管理系統(tǒng),以多媒體檔案為管理對象,滿足照片、音頻、視頻等檔案的收集、管理、保存、利用。
③檔案數(shù)字化加工系統(tǒng),實(shí)現(xiàn)對紙質(zhì)檔案的前處理、著錄、掃描、掛接、質(zhì)檢、驗(yàn)收等全過程管理。
④智能庫房管理系統(tǒng),通過RFID技術(shù)的應(yīng)用,實(shí)現(xiàn)輔助人工對庫房和實(shí)體檔案的智能化管理。
⑤電子閱覽室系統(tǒng),面向來館用戶,實(shí)現(xiàn)自助查詢、接待服務(wù)、閱覽服務(wù)和調(diào)卷服務(wù)等功能。
⑥海量數(shù)字檔案安全保存系統(tǒng),通過四性檢測、元數(shù)據(jù)設(shè)計(jì)、數(shù)據(jù)封裝、電子文件長期保存、安全保護(hù)等多種功能,實(shí)現(xiàn)對數(shù)字化加工成果、電子檔案數(shù)據(jù)等的長期安全保存。
⑦智能檢索系統(tǒng),通過OCR、NLP數(shù)據(jù)管理技術(shù)的應(yīng)用,實(shí)現(xiàn)對數(shù)字資源的智能挖掘、智能歸類、智能檢索、智能學(xué)習(xí)。
依托省電子政務(wù)外網(wǎng)部署的應(yīng)用系統(tǒng)共有6個:
①數(shù)字檔案室系統(tǒng),通過“數(shù)據(jù)物理集中、權(quán)限邏輯分離”的方式,為各立檔單位提供對電子文件與數(shù)字化成果的“收、管、存、用”平臺。
②電子檔案移交接收系統(tǒng),為各立檔單位提供數(shù)據(jù)封裝、四性檢測、系統(tǒng)接口、數(shù)據(jù)格式轉(zhuǎn)換等工具,實(shí)現(xiàn)電子檔案的在線檢查、在線指導(dǎo)、在線移交接收。
③全省數(shù)字檔案信息資源共享系統(tǒng),以統(tǒng)一平臺、分級管理為原則,面向各立檔單位以及省、市、縣級檔案館,提供檔案數(shù)字資源的共建共享服務(wù)。
④辦公自動化系統(tǒng),作為檔案館協(xié)同辦公平臺,提供了公文流轉(zhuǎn)、人事管理、會議管理、日程安排等功能。
⑤家譜檔案管理系統(tǒng),以河南省各級檔案館中的家譜檔案為管理對象,通過家譜檔案元數(shù)據(jù)著錄、內(nèi)容管理、動態(tài)呈現(xiàn),搭建起全省的家譜檔案共建共享平臺。
⑥河南檔案業(yè)務(wù)網(wǎng)站作為河南省數(shù)字檔案館在省電子政務(wù)外網(wǎng)的業(yè)務(wù)門戶提供以上5個系統(tǒng)的訪問入口并集中展示相關(guān)內(nèi)容。
依托互聯(lián)網(wǎng)部署的應(yīng)用系統(tǒng)共有2個:
①公共查詢系統(tǒng),面向互聯(lián)網(wǎng)公眾用戶,提供館藏開放檔案的目錄檢索和全文檢索,以及編研成果展示、網(wǎng)上展廳等。
②移動檔案服務(wù)系統(tǒng),面向移動互聯(lián)網(wǎng)用戶,提供開放檔案的統(tǒng)一發(fā)布和查詢。
3.搭建基于省電子政務(wù)外網(wǎng)的資源共享系統(tǒng)
資源共建共享是數(shù)字檔案館建設(shè)的目標(biāo)導(dǎo)向。基于省電子政務(wù)外網(wǎng)建立的資源共享系統(tǒng),界面簡潔、功能清晰、資源豐富,用戶經(jīng)過身份認(rèn)證后登錄系統(tǒng),根據(jù)授權(quán)實(shí)現(xiàn)共建共享需求。一是通過數(shù)字檔案室及移交接收系統(tǒng)為各立檔單位提供了統(tǒng)一的數(shù)字檔案管理平臺,為各單位之間檔案資源共享創(chuàng)造了條件。二是通過全省檔案資源共享平臺共享政務(wù)公開信息、開放檔案、編研成果等。三是通過河南政務(wù)服務(wù)網(wǎng)站前端接收社會公眾的利用請求,在后臺處理完畢后將數(shù)據(jù)再推送給前端提出申請的用戶。四是利用全省檔案資源共享平臺實(shí)現(xiàn)省內(nèi)館際之間的異地查檔、跨館出證。
4.開發(fā)基于NLP技術(shù)的智能檢索系統(tǒng)
智能檢索系統(tǒng)選型HanLP技術(shù),通過拼音檢索、首字母檢索、同義詞檢索、模型檢索、人名庫提取、地名庫提取、熱詞排行、知識圖譜、統(tǒng)計(jì)分析等功能,對智能挖掘、智能歸類、智能檢索、智能學(xué)習(xí)的智慧利用模式進(jìn)行了初步探索。系統(tǒng)目前共收集目錄數(shù)據(jù)3242805條,全文數(shù)據(jù)1652107條,并全部完成了TXT抽取、中文分詞、關(guān)鍵詞提取、拼音標(biāo)注及縮寫,建立了包含4174045個詞組或短語的基礎(chǔ)詞庫,包含62003個詞語的同義詞庫,以及河南基礎(chǔ)地名庫、人名庫、關(guān)鍵詞庫等。同時,按照檔案分類法對館藏系統(tǒng)中所有檔案進(jìn)行分類標(biāo)記,共設(shè)置20個大類。通過以上手段,實(shí)現(xiàn)了對資源總庫中檔案數(shù)據(jù)的智能檢索和知識管理,取得了較好的利用體驗(yàn)和利用效果。
5.完善基于海量數(shù)字檔案安全保存策略
信息安全是數(shù)字檔案館建設(shè)的保障。在設(shè)計(jì)與建設(shè)中,確立了網(wǎng)絡(luò)、系統(tǒng)、資源、管理等安全策略。一是確定網(wǎng)絡(luò)、系統(tǒng)的安全等級保護(hù)級別。省電子政務(wù)外網(wǎng)、局域網(wǎng)及部署其上的應(yīng)用系統(tǒng)都按照等保三級要求規(guī)劃設(shè)計(jì)與建設(shè)。二是部署海量數(shù)字檔案長期保存系統(tǒng),保障數(shù)字檔案長久保存過程中的真實(shí)性、完整性、可用性和安全性。三是建立全方位的安全防護(hù)。根據(jù)局域網(wǎng)業(yè)務(wù)系統(tǒng)安全要求,在對檔案安全風(fēng)險分析的基礎(chǔ)上建立安全防護(hù)模型,從應(yīng)用層、系統(tǒng)層、網(wǎng)絡(luò)層、物理層和管理層5個層面對數(shù)字檔案館進(jìn)行分層防護(hù),從而全面保障數(shù)字檔案館的安全。其中:應(yīng)用層安全,通過采用身份認(rèn)證、權(quán)限控制、數(shù)字簽名、應(yīng)用審計(jì)及數(shù)據(jù)加等技術(shù)手段,重點(diǎn)保護(hù)各業(yè)務(wù)平臺賬號、鑰、操作等安全;系統(tǒng)層安全,通過進(jìn)行操作系統(tǒng)加固、漏洞掃描、防病毒查殺、備份恢復(fù)等,重點(diǎn)保護(hù)操作系統(tǒng)、數(shù)據(jù)庫的安全;網(wǎng)絡(luò)層安全,通過使用防火墻篩查、鏈路加、違規(guī)外聯(lián)監(jiān)控、VLAN劃分、安全隔離、入侵檢測、安全審計(jì)等手段,重點(diǎn)保護(hù)網(wǎng)絡(luò)安全;物理層安全,通過采取電力保障、設(shè)備安全、防電磁泄漏、防物理破壞、環(huán)境安全、介質(zhì)安全等有效方式,重點(diǎn)保護(hù)機(jī)房環(huán)境、核心設(shè)備、重要介質(zhì)等安全;管理層安全,通過成立管理機(jī)構(gòu),加強(qiáng)人員培訓(xùn),制定管理制度和應(yīng)急預(yù)案等,建立起安全機(jī)制,為信息系統(tǒng)和檔案數(shù)據(jù)的安全提供制度保障。
6.以共享為主要目標(biāo)的資源建設(shè)
根據(jù)不同網(wǎng)絡(luò)用戶,對資源進(jìn)行分類部署。局域網(wǎng)部署的是覆蓋全部館藏各門類檔案、圖書、資料的目錄數(shù)據(jù)、全文數(shù)據(jù)(檔案除外)及政務(wù)公開信息;省電子政務(wù)外網(wǎng)部署全省各級檔案館的開放檔案目錄、民生檔案目錄、特色檔案資源以及省直各立檔單位的已進(jìn)館檔案數(shù)據(jù);互聯(lián)網(wǎng)部署省館開放檔案目錄及開放檔案全文數(shù)據(jù)、政務(wù)公開信息及公開的檔案編研成果。依托資源共享系統(tǒng),制定資源共建計(jì)劃和資源共享辦法,指導(dǎo)市級檔案館上傳檔案館指南、專題介紹、開放檔案目錄數(shù)據(jù)、專題目錄數(shù)據(jù)、原文數(shù)據(jù),有計(jì)劃地組織具有河南特色的專題資源庫。家譜檔案資源庫架構(gòu)已經(jīng)搭建,依據(jù)家譜檔案元數(shù)據(jù)著錄規(guī)范,上傳家譜數(shù)據(jù),并對數(shù)據(jù)進(jìn)行解析加工,從家族譜影、家族名人、家風(fēng)家訓(xùn)、姓氏字輩、家譜遺跡等方面挖掘數(shù)據(jù),探索數(shù)字人文與資源管理的結(jié)合。
努力方向
面對加快檔案信息化戰(zhàn)略轉(zhuǎn)型的機(jī)遇和挑戰(zhàn),數(shù)字檔案館建設(shè)應(yīng)朝著以下幾個方向努力:一是要著力應(yīng)用,以用促建。要加快數(shù)字檔案館系統(tǒng)在省館內(nèi)部、省直單位和市、縣級檔案館的推廣應(yīng)用,培育電子文件單套歸檔的試點(diǎn),推進(jìn)原生電子檔案的接收,加大資源共享力度,使數(shù)字檔案館成為檔案管理、業(yè)務(wù)協(xié)同、對外服務(wù)、提升功能的有效平臺,同時通過應(yīng)用反饋,促進(jìn)數(shù)字檔案館建設(shè)不斷完善。二是要推進(jìn)融合,以融促用。隨著“放管服”改革的深化,截至2020年2月1日,河南省共發(fā)布省、市、縣三級政務(wù)服務(wù)網(wǎng)上辦理事項(xiàng)197417項(xiàng),這些事項(xiàng)的辦理將產(chǎn)生大量電子文件。檔案部門要進(jìn)一步加強(qiáng)與大數(shù)據(jù)管理部門的融合,做好政務(wù)服務(wù)網(wǎng)電子文件規(guī)范化管理、歸檔與共享。三是要深化研究,以研促轉(zhuǎn)。新的政策環(huán)境、技術(shù)背景、多元化需求導(dǎo)向下,數(shù)字檔案館建設(shè)正在向著業(yè)務(wù)協(xié)同、資源共享、安全可信、長期保存、智慧智能的方向發(fā)展,因此需要從物聯(lián)網(wǎng)、云計(jì)算、數(shù)據(jù)挖掘、移動互聯(lián)網(wǎng)應(yīng)用等方面繼續(xù)深化對數(shù)字檔案館的研究,推動數(shù)字檔案館的智慧轉(zhuǎn)型。
作者單位:河南省檔案館
文章來源:《中國檔案》2020年第8期
圖表來源:作者提供