中文字幕大香视频蕉免费_全国最大色精网站_亚洲熟妇真实自拍另类_无码人妻精品一區

歡迎來到中博奧技術(shù)有限公司官網(wǎng)

什么是“檔案數(shù)據(jù)”?檔案數(shù)據(jù)與傳統(tǒng)檔案有哪些不同?一文探析檔案數(shù)據(jù)內(nèi)涵與特征

時(shí)間:2022-04-02 作者: 來源:網(wǎng)絡(luò) 點(diǎn)擊量:

檔案數(shù)據(jù)

本文看點(diǎn)

1.檔案數(shù)據(jù)是在什么樣的時(shí)代背景下形成的?

2.檔案數(shù)據(jù)與傳統(tǒng)檔案有哪些不同?

3.檔案數(shù)據(jù)的含義是什么?檔案數(shù)據(jù)有哪些特征?

摘 要:檔案數(shù)據(jù)作為大數(shù)據(jù)時(shí)代檔案領(lǐng)域出現(xiàn)的新概念,雖被檔案界普遍使用,但其概念內(nèi)涵并不明朗。對檔案數(shù)據(jù)形成的時(shí)代背景進(jìn)行分析,從存在粒度、開發(fā)方式和價(jià)值特性三個(gè)方面探討檔案數(shù)據(jù)與傳統(tǒng)檔案的差異,提出檔案數(shù)據(jù)是數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄,具有廣源性、共生與互生性、累積性、擴(kuò)展性和易算性等新的特征形態(tài)。

關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)據(jù);檔案信息

基金項(xiàng)目:國家社科基金重點(diǎn)項(xiàng)目“大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究”(19ATQ007)。

1 檔案數(shù)據(jù)形成的時(shí)代背景

1.1 數(shù)據(jù)化浪潮:檔案形成生態(tài)環(huán)境的變化

社會數(shù)據(jù)化程度的加深。數(shù)據(jù)化“是人類在信息傳播、人際交往乃至日常生活的過程中,為了便于溝通、傳播與保存,將一切客觀存在均處理為數(shù)據(jù),進(jìn)而使得整個(gè)人類社會成為了一個(gè)龐大的數(shù)據(jù)庫?!?/p>

[3]數(shù)據(jù)化社會不僅帶來了空前的信息技術(shù)革新,更創(chuàng)造了全新的生產(chǎn)模式、工作業(yè)態(tài)和生活方式,在物理世界之上構(gòu)筑起數(shù)據(jù)世界,進(jìn)而深刻塑造著檔案工作的社會生態(tài)環(huán)境,推動著檔案工作與數(shù)據(jù)的關(guān)聯(lián)和融合。

檔案形成生態(tài)正在由“模擬態(tài)”“數(shù)字態(tài)”向“數(shù)據(jù)態(tài)”轉(zhuǎn)變。檔案是社會背景的真實(shí)反映和社會活動的真實(shí)記錄,數(shù)據(jù)化浪潮從源頭上改變了檔案信息的記錄、讀取、存儲和傳播方式,檔案數(shù)據(jù)大量產(chǎn)生,“原生環(huán)境數(shù)據(jù)化、形成方式數(shù)據(jù)化、來源形態(tài)數(shù)據(jù)化”的檔案形成生態(tài)逐漸形成,檔案資源形態(tài)從模擬態(tài)、數(shù)字態(tài)向數(shù)據(jù)態(tài)“質(zhì)變”,檔案數(shù)據(jù)將成為數(shù)據(jù)時(shí)代檔案信息資源的主體,檔案工作正在經(jīng)歷一個(gè)從管理檔案實(shí)體到管理檔案數(shù)據(jù)的應(yīng)變過程。

1.2 檔案事業(yè)的“數(shù)據(jù)革命”:檔案工作從“數(shù)字化”向“數(shù)據(jù)化”轉(zhuǎn)型

檔案政策話語的數(shù)據(jù)化理念。在全面促進(jìn)大數(shù)據(jù)的布局和發(fā)展中,檔案數(shù)據(jù)也成為檔案管理工作的重要內(nèi)容,“檔案數(shù)據(jù)”一詞在國家相關(guān)政策標(biāo)準(zhǔn)條文中頻繁呈現(xiàn)(見圖1)。由此可見,檔案數(shù)據(jù)管理已納入國家檔案事業(yè)發(fā)展頂層設(shè)計(jì)之中。

檔案數(shù)據(jù)

圖1 含“檔案數(shù)據(jù)”概念的相關(guān)政策標(biāo)準(zhǔn)條文

檔案管理部門的數(shù)據(jù)化實(shí)踐。檔案信息化工作開展以來,檔案部門進(jìn)行的以數(shù)字化掃描、數(shù)字檔案館(室)建設(shè)、數(shù)字化利用服務(wù)為主的檔案“數(shù)字化”管理實(shí)踐,雖然解決了傳統(tǒng)檔案信息的載體轉(zhuǎn)換、數(shù)字存儲和便于利用等問題,但只是改變了檔案的描述、呈現(xiàn)和利用方式,對檔案信息內(nèi)容控制的層級、深度、力度有限,難以挖掘和充分實(shí)現(xiàn)檔案的價(jià)值,迫切需要從“數(shù)字化”向“數(shù)據(jù)化”演進(jìn)。當(dāng)前,檔案部門正在積極探索和開展檔案“數(shù)據(jù)化”管理實(shí)踐,將管理對象和管理方式向數(shù)據(jù)和數(shù)據(jù)化延伸。

如上海自貿(mào)區(qū)在全國率先推行電子檔案“單套制”管理模式,將OA辦公流程與電子文件歸檔、電子檔案管理流程對接,通過電子文件歸檔與電子檔案管理原型系統(tǒng)實(shí)現(xiàn)對電子檔案內(nèi)容數(shù)據(jù)、目錄數(shù)據(jù)、元數(shù)據(jù)和管理利用數(shù)據(jù)的有效管理。

[9]浙江省通過構(gòu)建自動化的電子文件管理體系,制定大數(shù)據(jù)歸檔范圍與標(biāo)準(zhǔn)、公共數(shù)據(jù)管理辦法、電子文件歸檔數(shù)據(jù)規(guī)范以及智能化的檔案信息服務(wù)網(wǎng)等開展智慧檔案和檔案管理智慧化建設(shè),建立檔案數(shù)據(jù)共享、傳輸和交換機(jī)制,推動檔案數(shù)據(jù)向各部門和社會共享利用,實(shí)現(xiàn)“讓群眾少跑腿,讓數(shù)據(jù)多跑路”的檔案服務(wù)。

[10]智慧檔案館建設(shè)的數(shù)據(jù)化基因。智慧檔案館是數(shù)字檔案館的高級形態(tài),必須基于檔案數(shù)據(jù)資源、依靠檔案數(shù)據(jù)管理、輔以智能數(shù)據(jù)技術(shù)才能充分挖掘檔案數(shù)據(jù)資源價(jià)值,實(shí)現(xiàn)智能化管理、知識化服務(wù)、精細(xì)化服務(wù)、個(gè)性化服務(wù),將檔案“資源庫”變成“知識庫”“思想庫”“智庫”。從技術(shù)層面看,大數(shù)據(jù)、人工智能等數(shù)據(jù)技術(shù)的應(yīng)用是智慧檔案館的技術(shù)表征;從管理對象看,數(shù)據(jù)化的檔案信息資源是智慧檔案館的根基命脈;從管理方式看,細(xì)顆粒度的檔案數(shù)據(jù)管理是智慧檔案館的支撐手段;從服務(wù)理念上看,智慧化的知識服務(wù)是智慧檔案館的價(jià)值目標(biāo)。由此可見,數(shù)據(jù)化是智慧檔案館發(fā)育成長的基因,齊全完整、質(zhì)量上乘的檔案數(shù)據(jù)是智慧檔案館的核心生態(tài)因子,是智慧檔案館生存和發(fā)展的基石?!安渴鸷腿嫱七M(jìn)檔案數(shù)據(jù)化工作,正是數(shù)字檔案館建設(shè)向智慧檔案館建設(shè)的基調(diào)和縮影?!?/p>

[11]數(shù)據(jù)科學(xué)的興起:檔案管理與數(shù)據(jù)管理的融合

從數(shù)據(jù)出發(fā),讓數(shù)據(jù)說話,用數(shù)據(jù)導(dǎo)控。數(shù)據(jù)科學(xué)的概念于1974年由圖靈獎獲得者彼得·諾爾(Peter Naur)首次明確提出,經(jīng)歷了一段“沉默期”以后,隨著大數(shù)據(jù)的發(fā)展成為新興的研究領(lǐng)域,它將“數(shù)據(jù)現(xiàn)象”和“數(shù)據(jù)問題”從信息科學(xué)中獨(dú)立和凸顯出來,“使信息科學(xué)不再直接受限于信息論、控制論和系統(tǒng)論等底層基礎(chǔ)理論,而更加依賴于數(shù)據(jù)科學(xué)層次的理論創(chuàng)新。”

[12]檔案學(xué)屬于信息科學(xué)研究范疇,數(shù)據(jù)科學(xué)的興起促使對檔案管理對象的認(rèn)知進(jìn)一步向檔案數(shù)據(jù)延伸,有利于揭示檔案數(shù)據(jù)的本質(zhì)特征和運(yùn)行規(guī)律,并在此基礎(chǔ)上探索數(shù)據(jù)科學(xué)中數(shù)據(jù)加工、數(shù)據(jù)計(jì)算、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)產(chǎn)品開發(fā)的理論、技術(shù)、方法在檔案管理領(lǐng)域中的應(yīng)用,建立檔案數(shù)據(jù)科學(xué)管理體系,促進(jìn)檔案學(xué)與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)科學(xué)等的交叉融合。

數(shù)據(jù)管理激活檔案數(shù)據(jù)?!皵?shù)據(jù)管理是指將數(shù)據(jù)視為重要的信息資源,運(yùn)用云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)、智慧工程等現(xiàn)代技術(shù)對數(shù)據(jù)資源進(jìn)行有效的收集、處理、存儲、挖掘和利用,保障數(shù)據(jù)長期可用,實(shí)現(xiàn)數(shù)據(jù)價(jià)值,提高組織運(yùn)行效率和核心競爭力。”

[15]檔案數(shù)據(jù)作為國家和社會重要的信息資源,恰恰是數(shù)據(jù)管理的對象和特定場域,數(shù)據(jù)管理必將對檔案管理理論、管理方法、管理模式產(chǎn)生變革性的影響。數(shù)據(jù)管理能夠有效激活檔案數(shù)據(jù),從中提取價(jià)值、探求知識、啟迪智慧,“構(gòu)建人的關(guān)聯(lián)、物的關(guān)聯(lián)、人與人的關(guān)聯(lián)、人與物的關(guān)聯(lián)、時(shí)空的關(guān)聯(lián),形成彼此連接、相互交錯,網(wǎng)絡(luò)狀數(shù)據(jù)連接格局”

[16],使檔案數(shù)據(jù)在管理中發(fā)揮更大的能量和價(jià)值,讓“啤酒和尿布”的故事繼續(xù)演繹。

1.4 “大檔案觀”:檔案數(shù)據(jù)是檔案學(xué)研究的熱點(diǎn)

“大檔案觀”促進(jìn)檔案數(shù)據(jù)“應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管”?!按髾n案”觀不僅潛含著從社會發(fā)展的角度思考檔案工作范圍、拓展檔案事業(yè)社會空間的工作思維,同時(shí)也潛含著對檔案構(gòu)成的重新理解和認(rèn)識,要求跳出傳統(tǒng)官方‘小檔案’的認(rèn)識思維,擴(kuò)大檔案的構(gòu)成和成分,強(qiáng)化對社會各類檔案資源的認(rèn)知和管理。”

[17]在當(dāng)前的大數(shù)據(jù)環(huán)境下,“數(shù)據(jù)、信息、文件、檔案等概念之間沒有共識的邊界”[18],檔案的邊界逐漸擴(kuò)展,信息存儲能力極大增強(qiáng),擴(kuò)大了檔案的保存范圍,盡可能收集多元數(shù)據(jù)、全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù),關(guān)注底層化、碎片化、復(fù)雜化的數(shù)據(jù)信息,能夠?qū)崿F(xiàn)檔案數(shù)據(jù)“應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管”,全面完整地保存社會記憶,從而構(gòu)建一幅大數(shù)據(jù)時(shí)代反映國家和社會變遷的實(shí)時(shí)全景圖,真正建立覆蓋人民群眾的、滿足社會發(fā)展長遠(yuǎn)需要的檔案資源體系。

2 檔案數(shù)據(jù)內(nèi)涵解讀

2.1 檔案數(shù)據(jù)與傳統(tǒng)檔案信息的差異

檔案數(shù)據(jù)既反映了檔案形態(tài)的客觀變化和拓展,也推動著檔案管理范式由信息管理向數(shù)據(jù)管理轉(zhuǎn)型,表征了檔案工作的發(fā)展變革。相對于傳統(tǒng)檔案信息,檔案數(shù)據(jù)的不同之處突出表現(xiàn)在以下三個(gè)方面。

第一,存在粒度。傳統(tǒng)檔案信息一次信息居多,依附于傳統(tǒng)介質(zhì),信息索引方式單一,粗粒度明顯;即便是經(jīng)數(shù)字化后的檔案信息,也只是中粒度水平,內(nèi)容檢索困難。檔案數(shù)據(jù)形成于數(shù)據(jù)化的技術(shù)環(huán)境,相對于“文件”形式的粗顆粒度的傳統(tǒng)檔案信息,檔案數(shù)據(jù)組織粒度細(xì)化,是一個(gè)個(gè)可以獨(dú)立存在的數(shù)據(jù)單元,具有基于文本的數(shù)據(jù)拆分、組合、關(guān)聯(lián)、交互等細(xì)顆粒特性,能夠通過計(jì)算機(jī)進(jìn)行內(nèi)容檢索和提取,運(yùn)用大數(shù)據(jù)處理技術(shù)對檔案數(shù)據(jù)進(jìn)行分析、集成和可視化,挖掘檔案數(shù)據(jù)中的隱性知識、“弱”信息、“暗”數(shù)據(jù),形成檔案知識元,并對其進(jìn)行連接、組合,充分挖掘檔案數(shù)據(jù)價(jià)值。

第二,開發(fā)方式。數(shù)字時(shí)代傳統(tǒng)檔案信息的“數(shù)字化”一直是檔案信息資源建設(shè)的重要內(nèi)容,將依附在傳統(tǒng)載體上的檔案信息變?yōu)榭蓹C(jī)讀和在線傳輸?shù)摹皵?shù)字態(tài)”,改變記錄和存儲方式,便于檔案信息的流動與傳播,屬于“形式控制”。而檔案數(shù)據(jù)則是通過“數(shù)據(jù)化”,將檔案信息變?yōu)榭删珳?zhǔn)定位和識別的“數(shù)據(jù)態(tài)”,方便利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)單元的讀取、關(guān)聯(lián)、重組和提煉,有利于檔案資源的整合集成、挖掘分析、知識組織,滿足社會精準(zhǔn)化、個(gè)性化、知識化的利用需求,屬于“內(nèi)容控制”。

第三,價(jià)值特性。首先,在價(jià)值形態(tài)上,檔案數(shù)據(jù)除了兼有傳統(tǒng)檔案最基本的憑證和參考價(jià)值以外,還突出表現(xiàn)在數(shù)據(jù)價(jià)值上,即通過數(shù)據(jù)技術(shù)處理、挖掘和應(yīng)用獲得衍生的價(jià)值,如決策價(jià)值、預(yù)測價(jià)值、資產(chǎn)價(jià)值、情報(bào)價(jià)值等,是檔案在數(shù)據(jù)時(shí)代的價(jià)值新發(fā)現(xiàn)。其次,在價(jià)值活性上,不同于傳統(tǒng)檔案信息難以被計(jì)算機(jī)直接進(jìn)行內(nèi)容識別和處理,檔案數(shù)據(jù)作為一種數(shù)據(jù)資源,便于計(jì)算、分析、顯現(xiàn)和關(guān)聯(lián),價(jià)值活性較強(qiáng)。最后,在價(jià)值實(shí)現(xiàn)上,傳統(tǒng)檔案信息側(cè)重于通過信息查考和信息整合實(shí)現(xiàn)其信息價(jià)值,滿足檔案用戶的信息需求,如檔案查閱、證明、咨詢、展覽等方式比較機(jī)械化和表層化;檔案數(shù)據(jù)由于其數(shù)據(jù)特性,可以通過數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)挖掘,建立檔案知識庫,構(gòu)建知識地圖,使檔案信息資源管理和利用的場景從簡單的“檢索與查閱”轉(zhuǎn)向深層的“洞見與增值”,滿足多樣化、差異化、精細(xì)化、深層化的檔案信息需求,提供知識輸出和智慧服務(wù)。

2.2 檔案數(shù)據(jù)的含義

目前,對檔案數(shù)據(jù)的定義也較少。如馬海群將檔案數(shù)據(jù)理解為“檔案機(jī)構(gòu)收集保存的所有原始數(shù)據(jù)。”[19]于英香認(rèn)為“從內(nèi)涵看,檔案數(shù)據(jù)是一種具備檔案屬性的數(shù)據(jù);從外延看,檔案數(shù)據(jù)包括電子文檔、數(shù)字資源等?!盵20]劉慶悅等將檔案數(shù)據(jù)界定為“承載檔案信息的數(shù)據(jù)以及在檔案信息管理利用活動中產(chǎn)生的數(shù)據(jù)?!本C上,大多學(xué)者只是對檔案數(shù)據(jù)進(jìn)行了描述,沒有一個(gè)明確的概念內(nèi)涵。通過檔案數(shù)據(jù)與傳統(tǒng)檔案信息的比較,將檔案數(shù)據(jù)定義為:“數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄?!睓n案數(shù)據(jù)應(yīng)滿足以下基本要求:

第一,從內(nèi)涵上看,檔案數(shù)據(jù)首先屬于檔案信息,具備檔案性質(zhì),滿足檔案的所有基本要求?!皺n案數(shù)據(jù)”是一個(gè)偏正短語,“檔案”為“本”,“數(shù)據(jù)”為“形”,對于檔案數(shù)據(jù)的定義應(yīng)該以檔案作為邏輯起點(diǎn),切合檔案管理范圍,故而,“檔案數(shù)據(jù)”一要具備檔案的基本屬性,包括原始記錄性、歷史性、社會性;二要具備檔案的基本價(jià)值,包括憑證價(jià)值、參考價(jià)值,具有保存意義。

第二,從外延上看,“檔案數(shù)據(jù)”是一個(gè)廣義的數(shù)據(jù)集合。由于檔案數(shù)據(jù)來源構(gòu)成的廣泛、表現(xiàn)形式的多元,檔案數(shù)據(jù)的外延比較廣泛,不僅包括檔案部門已經(jīng)掌握和積累的各類數(shù)字化檔案資源、電子檔案等,還包括具有長久保存價(jià)值但還沒有納入檔案部門保管范圍的數(shù)據(jù);不僅包括內(nèi)容、結(jié)構(gòu)、背景等檔案元數(shù)據(jù),還包括檔案部門在檔案管理業(yè)務(wù)過程中產(chǎn)生的檔案管理數(shù)據(jù)、檔案利用數(shù)據(jù)、檔案用戶數(shù)據(jù)等累積性數(shù)據(jù)。

第三,從形式上看,“檔案數(shù)據(jù)”在滿足檔案性質(zhì)的同時(shí)也滿足數(shù)據(jù)的一般屬性。“檔案數(shù)據(jù)”是數(shù)據(jù)化的檔案信息資源,以數(shù)據(jù)形式記錄和保存,能夠?yàn)閿?shù)據(jù)設(shè)備、數(shù)據(jù)技術(shù)識別和處理,這是檔案數(shù)據(jù)區(qū)別于傳統(tǒng)檔案信息的關(guān)鍵所在。

當(dāng)然,定義一個(gè)新興術(shù)語總是一件容易引起學(xué)術(shù)爭論的事情,隨著數(shù)據(jù)社會的深入推進(jìn),以及檔案學(xué)與數(shù)據(jù)科學(xué)、檔案工作與大數(shù)據(jù)的融合發(fā)展,檔案數(shù)據(jù)的內(nèi)涵可能還會出現(xiàn)新的闡釋。

3 檔案數(shù)據(jù)的特征形態(tài)及其影響

理清檔案數(shù)據(jù)的基本特征,無論從理論上還是實(shí)踐上都意義重大,不僅能夠加深對于大數(shù)據(jù)時(shí)代檔案資源的認(rèn)知,也是探索檔案數(shù)據(jù)管理和治理的基礎(chǔ)。檔案數(shù)據(jù)除了具有檔案的原始記錄性、歷史性、社會性等固有特性以外,還具有廣源性、共生與互生性、累積性、擴(kuò)展性與易算性等新特征。

3.1 廣源性


信息時(shí)代,對于檔案存在范圍和存在形態(tài)的認(rèn)知不斷刷新,檔案數(shù)據(jù)符合多元開放的時(shí)代特征,其來源具有廣泛性,即廣源性。

第一,產(chǎn)生環(huán)境的廣泛性。過去,檔案主要產(chǎn)生于現(xiàn)實(shí)的物理業(yè)務(wù)環(huán)境,檔案文件生成方式單一,數(shù)量有限;現(xiàn)在,檔案數(shù)據(jù)廣泛地產(chǎn)生于網(wǎng)絡(luò)環(huán)境下的電子辦公、電子業(yè)務(wù)、信息系統(tǒng)、網(wǎng)站網(wǎng)頁、新媒體及傳感設(shè)備等新環(huán)境中,更傾向于網(wǎng)絡(luò)化、虛擬化和數(shù)據(jù)化,檔案文件生成方式多樣,生成內(nèi)容多維,生成形態(tài)多種,生成速度迅捷,數(shù)量巨大。

第二,覆蓋范圍的廣泛性。傳統(tǒng)檔案資源的收集管理由于受到管理體制、檔案館舍、技術(shù)條件、人員配備等限制,主要收集立檔單位的檔案,檔案資源的行政色彩濃厚、覆蓋范圍有限、結(jié)構(gòu)不合理,社會檔案資源、民生檔案資源、特色檔案資源稀缺。如今,伴隨著辦公業(yè)務(wù)環(huán)境的電子化網(wǎng)絡(luò)化、在線歸檔方式和技術(shù)的不斷發(fā)展,以及檔案工作正朝著建立實(shí)現(xiàn)覆蓋人民群眾和社會生活的檔案資源體系的目標(biāo)不斷推進(jìn),檔案數(shù)據(jù)愈加關(guān)注社會發(fā)展中的全景數(shù)據(jù),無論檔案工作體制內(nèi)體制外、無論宏觀微觀、無論官方民間、無論正式組織非正式組織形成的檔案信息資源,都在檔案數(shù)據(jù)范疇。而且,現(xiàn)代信息存儲技術(shù)的發(fā)展使檔案數(shù)據(jù)存儲能力極大提升,未來檔案數(shù)據(jù)無論在存量增量,還是在反映社會面貌的完整程度上都會達(dá)到新的歷史水平。

3.2 共生與互生性

檔案數(shù)據(jù)就其來源而言雖然泛在而離散,但相關(guān)的檔案數(shù)據(jù)本身卻構(gòu)成了一個(gè)共生共在的檔案數(shù)據(jù)生態(tài)群落和生態(tài)圈。

一方面,正如“傳統(tǒng)數(shù)據(jù)源通常在最開始就被嚴(yán)格地定義。數(shù)據(jù)的每一個(gè)比特都有重要的價(jià)值,否則就不會包含這個(gè)數(shù)據(jù)比特”[25],檔案數(shù)據(jù)百分之百是具有保存價(jià)值的數(shù)據(jù)信息記錄,但是單條檔案數(shù)據(jù)的價(jià)值度往往較小,不足以反映問題全貌,發(fā)揮整體價(jià)值。“在大數(shù)據(jù)時(shí)代,無論是大數(shù)據(jù)還是所謂的小數(shù)據(jù),以及各種各樣不同來源的數(shù)據(jù),彼此之間往往會存在互相依存和彼此驗(yàn)證的關(guān)系,彼此通過互相印證而實(shí)現(xiàn)各自的數(shù)據(jù)價(jià)值”[26]。所以,檔案數(shù)據(jù)應(yīng)當(dāng)關(guān)注以數(shù)據(jù)集為單位的價(jià)值度較高的多元累積數(shù)據(jù),特別在數(shù)據(jù)顆粒度較細(xì)、離散性較大的大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)的這種共生性特點(diǎn)將體現(xiàn)得更為明顯。

另一方面,在共生之上,每一條檔案數(shù)據(jù)其價(jià)值都與其他檔案數(shù)據(jù)的價(jià)值以及其所在檔案數(shù)據(jù)群落的整體價(jià)值相關(guān)聯(lián),每一個(gè)基于同一歷史活動形成的檔案數(shù)據(jù)在檔案數(shù)據(jù)群落里進(jìn)行著價(jià)值共享和互補(bǔ),所有的檔案數(shù)據(jù)群落又共同構(gòu)成了檔案數(shù)據(jù)生態(tài)圈,每一個(gè)獨(dú)立分散的檔案數(shù)據(jù)和分割的檔案數(shù)據(jù)群落在檔案數(shù)據(jù)生態(tài)圈中都發(fā)揮著獨(dú)特的作用,相互關(guān)聯(lián)、相互依存。

3.3 累積性

所謂累積性,即在累積達(dá)到一定程度后而產(chǎn)生狀態(tài)改變、規(guī)模遞增、程度加深及價(jià)值回饋等現(xiàn)象的演變過程。

第一,從數(shù)據(jù)資源形態(tài)上看,在數(shù)據(jù)化時(shí)代社會活動當(dāng)中形成的檔案數(shù)據(jù)碎片化和細(xì)顆?;黠@,每一條檔案數(shù)據(jù)都是反映數(shù)據(jù)時(shí)代真實(shí)活動面貌的組成部分,在同一活動當(dāng)中形成的具有有機(jī)聯(lián)系的數(shù)據(jù)經(jīng)過不斷累積從而形成數(shù)據(jù)群組,構(gòu)成檔案數(shù)據(jù)庫。

第二,從數(shù)據(jù)資源規(guī)模上看,由“數(shù)據(jù)”到“小數(shù)據(jù)”再到“大數(shù)據(jù)”的躍升,取決于數(shù)據(jù)累積,海量檔案數(shù)據(jù)資源也正是通過對存量檔案信息的數(shù)據(jù)化,以及有保存價(jià)值增量數(shù)據(jù)的不斷采集、積累和沉淀而形成的,檔案數(shù)據(jù)長期連續(xù)累積才能達(dá)到檔案大數(shù)據(jù)的效果。

第三,從數(shù)據(jù)資源價(jià)值上看,由檔案數(shù)據(jù)全集中挖掘出的檔案數(shù)據(jù)價(jià)值遠(yuǎn)大于單個(gè)檔案數(shù)據(jù)價(jià)值之和,檔案數(shù)據(jù)的累積性也就成為檔案數(shù)據(jù)價(jià)值得以展現(xiàn)和提升的重要特性。此外,檔案數(shù)據(jù)的累積性還從某個(gè)側(cè)面暗示了檔案數(shù)據(jù)的即時(shí)性和易逝性。“大數(shù)據(jù)時(shí)代的數(shù)據(jù)具有‘實(shí)時(shí)性’,世界被實(shí)時(shí)記錄的特征使得檔案界不得不重視這些稍瞬即逝的具有社會價(jià)值的數(shù)據(jù)的長久保存?!盵28]由于數(shù)據(jù)記錄的實(shí)時(shí)變化、社會活動的不斷拓展、技術(shù)環(huán)境的更新?lián)Q代及業(yè)務(wù)職能的更替轉(zhuǎn)型等,檔案數(shù)據(jù)生成變化加劇,如果不及時(shí)累積保存,便會造成檔案數(shù)據(jù)流失和消逝,影響檔案數(shù)據(jù)的完整性。

3.4 擴(kuò)展性


傳統(tǒng)檔案信息由于受技術(shù)條件、存儲空間和管理方式等因素的制約,可擴(kuò)展性有限,檔案信息價(jià)值難以充分發(fā)揮。而作為新的檔案資源形態(tài)的檔案數(shù)據(jù),擴(kuò)展性已成為其重要特質(zhì)。

第一,檔案數(shù)據(jù)體量的擴(kuò)展性。存量檔案數(shù)字化的不斷推進(jìn)、電子文件的大量生成,以及網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)檔案資源的爆發(fā)增長,使得檔案數(shù)據(jù)無論從數(shù)量還是增速上都呈現(xiàn)出極強(qiáng)的擴(kuò)展性。

第二,檔案數(shù)據(jù)結(jié)構(gòu)的擴(kuò)展性。檔案數(shù)據(jù)的產(chǎn)生環(huán)境更趨網(wǎng)絡(luò)化、數(shù)據(jù)化、立體化,半結(jié)構(gòu)化、非結(jié)構(gòu)化的檔案數(shù)據(jù)越來越多,如各種格式的文檔、圖片、網(wǎng)頁、社交媒體文件、圖像和聊天記錄及音視頻等,“超文本性”愈發(fā)顯著。

第三,檔案數(shù)據(jù)價(jià)值的擴(kuò)展性。數(shù)據(jù)管理的發(fā)展和數(shù)據(jù)技術(shù)的應(yīng)用推動產(chǎn)生了新一代的信息增值方式,一方面?zhèn)鹘y(tǒng)檔案信息經(jīng)數(shù)據(jù)化處理和加工后,其價(jià)值能夠得到新的發(fā)現(xiàn)、挖掘和展示;另一方面檔案數(shù)據(jù)資源也能得到進(jìn)一步的組織、賦能和激活,使檔案的知識屬性和特征在數(shù)據(jù)管理實(shí)踐中得到切實(shí)的揭示和彰顯。

檔案數(shù)據(jù)的擴(kuò)展性映射出檔案新的生成、存儲和處理生態(tài),需要檔案工作向更高層次擴(kuò)展。

一是檔案管理思維方式的擴(kuò)展。檔案數(shù)據(jù)的擴(kuò)展性要求檔案工作樹立數(shù)據(jù)化思維、信息化思維、技術(shù)性思維、共享性思維,以大數(shù)據(jù)思維而非館藏檔案的小數(shù)據(jù)思維去思考檔案管理工作的發(fā)展,營造數(shù)據(jù)文化環(huán)境和組織秩序。

二是檔案數(shù)據(jù)管理技術(shù)的擴(kuò)展?!坝捎诩夹g(shù)環(huán)境變遷,導(dǎo)致文檔管理工作從模擬態(tài)的相對單純的載體管理,轉(zhuǎn)換到數(shù)字態(tài)對文件尺度信息的整體管理,再過渡到數(shù)據(jù)態(tài)對數(shù)據(jù)尺度信息的關(guān)聯(lián)管理”[29],所以技術(shù)發(fā)展既是檔案數(shù)據(jù)管理的動因,也是手段。檔案部門要加強(qiáng)檔案數(shù)據(jù)管理技術(shù),包括數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)安全技術(shù)、數(shù)據(jù)關(guān)聯(lián)技術(shù)等的引進(jìn)與應(yīng)用,提升技術(shù)管理能級,適應(yīng)現(xiàn)代信息技術(shù)的發(fā)展。

三是檔案人員素質(zhì)能力和檔案管理隊(duì)伍的擴(kuò)展。一方面,檔案數(shù)據(jù)的擴(kuò)展性要求檔案人員從“信息工作者”向“數(shù)據(jù)工作者”轉(zhuǎn)變,培養(yǎng)兼有數(shù)據(jù)技術(shù)素養(yǎng)和檔案管理能力的技術(shù)型、復(fù)合型人才。另一方面,改變檔案管理隊(duì)伍結(jié)構(gòu),吸納數(shù)據(jù)管理專家、信息技術(shù)專家,強(qiáng)化檔案數(shù)據(jù)管理能力。

3.5 易算性


檔案數(shù)據(jù)因其具有數(shù)據(jù)態(tài)的技術(shù)屬性,使得“信息的處理由相對冗余和龐雜的文件尺度開始降維到更容易解析和處理的數(shù)據(jù)尺度”[30],相對于傳統(tǒng)檔案信息具有易算性。根據(jù)傳統(tǒng)的DIKW層級模型

[31],作為基礎(chǔ)層的數(shù)據(jù),其意義和價(jià)值是比較小的。大數(shù)據(jù)時(shí)代,“數(shù)據(jù)-信息-知識-智慧”的線性價(jià)值鏈遞進(jìn)關(guān)系遭受質(zhì)疑,數(shù)據(jù)的價(jià)值被重新發(fā)現(xiàn),“數(shù)據(jù)已成為我們這個(gè)時(shí)代承載人類藝術(shù)創(chuàng)意、信息、知識、經(jīng)驗(yàn)和智慧的基本符號集,是疆域正在急劇擴(kuò)展的虛擬世界的首選建筑材料。”

[32]而這種變化的根源之一,就在于數(shù)據(jù)具有較強(qiáng)的可編程計(jì)算性,在數(shù)據(jù)技術(shù)的支撐下可使其直接跨越信息和知識走向智慧,擁有較強(qiáng)的價(jià)值活性,如圖2所示。檔案數(shù)據(jù)也具備一般數(shù)據(jù)所具有的易算性,集中表現(xiàn)在易于被現(xiàn)代算法技術(shù)所加工處理,進(jìn)行信息分析、價(jià)值挖掘、知識發(fā)現(xiàn),捕捉潛在、精細(xì)、微妙、未知的關(guān)系和知識,激活檔案數(shù)據(jù)的一切可能價(jià)值。

檔案數(shù)據(jù)

圖2 DIKW層級模型

檔案數(shù)據(jù)的易算性是提升檔案資源價(jià)值、促進(jìn)檔案利用和檔案信息消費(fèi)的重要保障。檔案數(shù)據(jù)易算性優(yōu)勢的發(fā)揮,一方面需要開展檔案數(shù)據(jù)的結(jié)構(gòu)化處理,將檔案文件信息轉(zhuǎn)換成獨(dú)立于系統(tǒng)與軟件、開源兼容、不帶格式的純凈檔案數(shù)據(jù),方便“計(jì)算”時(shí)數(shù)據(jù)項(xiàng)的讀取、遷移和關(guān)聯(lián);另一方面需要提高“計(jì)算力”,引入本體、模型、規(guī)則、算法等數(shù)據(jù)處理領(lǐng)域的理論方法,充分借助數(shù)據(jù)技術(shù)開展靈活多樣的數(shù)據(jù)組織和數(shù)據(jù)分析,加強(qiáng)內(nèi)容管理,通過對復(fù)雜、多元、分散的檔案數(shù)據(jù)進(jìn)行關(guān)聯(lián)、聚類和展示,總結(jié)規(guī)律、發(fā)現(xiàn)知識、洞悉需求、預(yù)測趨勢,使檔案管理走向集成化、科學(xué)化與智能化,改變傳統(tǒng)檔案館“資源豐富、利用有限、知識貧乏”的格局,為決策者謀劃“滿意解”“最優(yōu)解”,為組織機(jī)構(gòu)輸出知識產(chǎn)品,為社會公眾提供增值服務(wù),全面提升檔案服務(wù)品質(zhì)。

檔案數(shù)據(jù)

注:本文全文詳見《檔案學(xué)通訊》2020年第三期

撰文:金 波  添志鵬 / 圖片:檔案學(xué)通訊 / 編輯:安新宇

轉(zhuǎn)自:檔案那些事兒

標(biāo)簽

|
我是中博奧客服:小奧
中博奧技術(shù)有限公司& 版權(quán)所有工信部備案號:豫ICP備11015869號-8 Copyright ? 2023-2024

檔案整理檔案數(shù)字化

檔案掃描檔案管理軟件系統(tǒng)

TEL:18937133779

To Top