電 話(huà):18937133779
網(wǎng) 址:http://www.tpiin.com
郵 箱:zboao@qq.com
掃描方式要根據(jù)檔案幅面的大小(A4、A3、A0)選擇相應(yīng)規(guī)格的掃描儀和專(zhuān)業(yè)掃描儀(如工程掃描可采用0號(hào)圖紙掃描儀)進(jìn)行掃描。
大幅面檔案可以采用大幅面數(shù)碼平臺(tái),或者用縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設(shè)備進(jìn)行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。如果紙張較長(zhǎng)但幅面不超過(guò)A3,可采用掃描儀長(zhǎng)紙掃描功能,根據(jù)紙張狀況設(shè)定合適的掃描幅長(zhǎng)即可。
紙張較差的情況,或者過(guò)于薄、過(guò)軟、超厚的檔案,可采用平板掃描方式。紙張狀況較好的檔案可采用高速掃描的方式進(jìn)行掃描,以提高工作效率。
紙張比較薄的檔案(如信紙、便箋紙)容易破損且透光,應(yīng)采用中、低檔進(jìn)行掃描。
紙張如有破損,可將破損紙張夾人透明塑料薄膜內(nèi),調(diào)整掃描儀進(jìn)紙為厚紙模式并采用中、低檔進(jìn)行掃描,如破損嚴(yán)重且不平整,采用平板掃描儀來(lái)完成。下面以圖檔易掃通掃描軟件為例,作以詳細(xì)介紹。見(jiàn)圖1掃描作業(yè)平臺(tái)。
(1)掃描色彩模式
掃描色彩模式一般分為黑白二值、灰度、彩色等,通常采用黑白二值。頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進(jìn)行掃描。
頁(yè)面為黑白兩色,但字跡清晰度差或者帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可采用灰度模式掃描。
頁(yè)面中帶有紅頭、印章或者插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進(jìn)行掃描。
底灰較深的紙張(如草漿紙、油印紙),如采用黑白二值應(yīng)將掃描對(duì)比度及亮度適當(dāng)調(diào)低,調(diào)節(jié)效果不理想則采用灰度掃描。
字跡較淺(如鉛筆字)的紙張:如采用黑白二值掃描應(yīng)調(diào)節(jié)臨界值,拉大字跡與原稿的反差,效果不理想則采用灰度掃描。見(jiàn)圖2掃描色彩模式。
(2)掃描分辨率
掃描分辨率參數(shù)大小的選擇,原則上是以?huà)呙韬蟮膱D像清晰、完整、不影響圖像的利用效果為準(zhǔn)。為了方便以后OCR識(shí)別,掃描分辨率建議選擇大于等于300dpi。一般情況下,分辨率越高識(shí)別率也就會(huì)越高。但這也不是絕對(duì)的,對(duì)于一些過(guò)大過(guò)粗的字體,設(shè)置過(guò)高的分辨率,識(shí)別率可能會(huì)降低,而且設(shè)置高分辨率后,掃描速度會(huì)大大降低。見(jiàn)圖3掃描分辨率選擇。
(3)亮度和對(duì)比度
在掃描過(guò)程中,適當(dāng)?shù)卣{(diào)整好掃描儀的亮度和對(duì)比度值,對(duì)識(shí)別率的高低影響比較大,在進(jìn)行掃描亮度和對(duì)比度的設(shè)定時(shí),以?huà)呙韬蟮膱D像中文字的筆畫(huà)較細(xì)、均勻,且沒(méi)有明顯斷點(diǎn)為準(zhǔn)。如果掃描后的文字圖像存在有黑點(diǎn)、黑斑或者文字線(xiàn)條很粗很黑,分不清楚筆畫(huà)的情況下,說(shuō)明亮度值太小,應(yīng)該增加亮度值再重新掃描。如果文字線(xiàn)條凹凸不平,有斷線(xiàn)甚至圖像中漢字輪廓?dú)埲睍r(shí),說(shuō)明亮度太大,應(yīng)減小亮度后再重新掃描。
(4)掃描登記
認(rèn)真填寫(xiě)紙質(zhì)檔案數(shù)字化掃描過(guò)程中交接登記表單,登記掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)和檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。
數(shù)字檔案的整理和掃描
(一)檔案整理
在掃描之前,根據(jù)檔案管理情況,按下述步驟對(duì)檔案進(jìn)行適當(dāng)整理,并視需要作出標(biāo)識(shí),確保檔案數(shù)字化質(zhì)量。
1、目錄數(shù)據(jù)準(zhǔn)備
按照《檔案著錄規(guī)則》(DA/T 18)等的要求,規(guī)范檔案中的目錄內(nèi)容,包括確定檔案目錄的著錄項(xiàng)、字段長(zhǎng)度和內(nèi)容要求。如有錯(cuò)誤或不規(guī)范的案卷題名、文件名、責(zé)任者、起止頁(yè)號(hào)和頁(yè)數(shù)等,應(yīng)進(jìn)行修改。
2、拆除裝訂
在不去除裝訂物情況下,影響掃描工作進(jìn)行的檔案,應(yīng)拆除裝訂物;將檔案原件的裝訂線(xiàn)拆除,排好順序,不得出現(xiàn)任何漏缺頁(yè)及順序差錯(cuò),更不能對(duì)檔案原件有任何損壞。
3、區(qū)分掃描件和非掃描件
按要求把同一案卷中的掃描件和非掃描件區(qū)分開(kāi)。普發(fā)性文件區(qū)分的原則是:無(wú)關(guān)的重份的文件要剔除,有正式件的文件可以不掃描原稿。
4、頁(yè)面修整
對(duì)破損嚴(yán)重、無(wú)法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、裱糊;
折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理(壓平或燙平等)后再進(jìn)行掃描。
5、檔案整理登記
制作并填寫(xiě)紙質(zhì)檔案數(shù)字化加工過(guò)程登記表,詳細(xì)記錄檔案整理后每份文件的起始頁(yè)號(hào)和頁(yè)數(shù)。
(二)檔案掃描
1、掃描方式(掃描前必須準(zhǔn)備一臺(tái)專(zhuān)業(yè)的平板掃描儀)
根據(jù)檔案幅面的大小(A4、A3、AO等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)擔(dān)描儀,如
工程圖紙可采用0號(hào)圖紙掃描儀進(jìn)行掃描。
普通A4紙質(zhì)文件,采用高速掃描儀的自動(dòng)進(jìn)紙方式掃描;
紙質(zhì)過(guò)薄、透明的(如信紙、便簽紙)采用高速掃描儀的平板掃描;
紙質(zhì)過(guò)厚、照片等檔案采用高速掃描儀的平板掃描;
對(duì)文件頁(yè)面貼有附屬小頁(yè)面、紙張時(shí),將大小頁(yè)面單獨(dú)在平板中掃描;2、掃描模式(紙質(zhì)檔案掃描一般采用黑白、灰度和彩色三種模式)
頁(yè)面為黑白兩色,字跡清晰的、不帶圖片的檔案材料,采用黑白方式;
頁(yè)面為黑白兩色,清晰度較差或者帶有圖片的檔案材料,以及頁(yè)面多為彩色文字的檔案,采用彩色或灰度模式(因情況而定);
頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,采用彩色模式掃描。
3、分辨率選擇
采用黑白、256級(jí)灰度模式掃描的文件,其分辨率選擇為不小于300DPI;
采用24位為彩色模式掃描的文件,其分辨率選擇為不小于200DPI。(以上模式分辨率的設(shè)定以A4紙張為標(biāo)準(zhǔn),其他規(guī)格紙張酌情處理)
掃描的線(xiàn)數(shù)、閥值、亮度、灰度、對(duì)比度等值可根據(jù)所掃描文件材料的清晰度進(jìn)行適當(dāng)?shù)恼{(diào)整;
需要時(shí)可根據(jù)原件的清晰度適當(dāng)調(diào)整掃描分辨率。如原件質(zhì)量較差且尺寸較小,可適當(dāng)提高分辨率;反之也可相應(yīng)減少分辨率,增減的多少以?huà)呙韬髨D像按原尺寸顯示后是否清晰為準(zhǔn);
粘貼折頁(yè)與表格,對(duì)于粘貼折頁(yè),可用大幅面掃描儀掃描,或先部分掃描后拼接;對(duì)部分字體很小、字跡密集的情況,可適當(dāng)提高掃描分辨率,選擇灰度掃描或彩色掃描,采用局部深化技術(shù)解決;對(duì)字跡與表格顏色深度不同的,采用局部淡化技術(shù)解決。
4、掃描登記
填寫(xiě)交接登記表,登記掃描的頁(yè)數(shù)。核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。
檔案數(shù)字化掃描方式
掃描的方式根據(jù)檔案紙張的大小和狀態(tài)進(jìn)行選擇,小幅面的可以選擇相應(yīng)規(guī)格的掃描儀,大幅面的則選擇大幅面數(shù)碼平臺(tái),或者掃描微縮處理后的膠片,或者進(jìn)行圖像拼接。紙張狀態(tài)較好時(shí),可以選擇高速掃描的方式;如有紙張破損或非常規(guī)薄、軟、厚的情況,則需采用平板掃描儀。
1掃描色彩模式
掃描色彩模式一般有二值、灰度以及彩色,第一種方式選擇得比較多。一般情況下黑白兩色、字跡清晰的純文本檔案可以采用黑白二值模式掃描,若字跡不清或帶有插圖則可以選擇灰度模式。帶有紅頭、印章或者其他顏色以及插圖的檔案,可以用彩色模式掃描。紙張底色較深的檔案,在使用二值模式時(shí),可以把對(duì)比度和亮度調(diào)低,成品不清晰時(shí)可以改用灰度掃描。
2掃描分辨率
以?huà)呙璩晒逦旰们也挥绊懞罄m(xù)電子檔案的利用為前提,來(lái)確定掃描分辨率。通常,分辨率與成果識(shí)別率呈正相關(guān)。但如果檔案文字過(guò)大或過(guò)粗,高掃描分辨率可能會(huì)造成識(shí)別率和掃描速度雙雙降低,對(duì)檔案數(shù)字化工作進(jìn)度造成影響。
3掃描亮度及對(duì)比度
作業(yè)過(guò)程中,需要適當(dāng)調(diào)節(jié)掃描儀的亮度以及對(duì)比值。具體以?huà)呙枇炼群蛯?duì)比度不影響掃描后文字及圖像筆畫(huà)清晰、粗細(xì)均勻,沒(méi)有過(guò)大斷點(diǎn)為準(zhǔn)。如果掃描后的電子檔案存在噪點(diǎn)、黑斑或者文字線(xiàn)條過(guò)粗導(dǎo)致筆畫(huà)無(wú)法辨認(rèn)的情況,這代表檔案掃描時(shí)選擇的亮度值過(guò)小,應(yīng)該進(jìn)行適當(dāng)提高后重新進(jìn)行掃描。如果文字線(xiàn)條出現(xiàn)較多斷點(diǎn)甚至文字殘缺,說(shuō)明亮度過(guò)高,應(yīng)調(diào)低后重掃。
4掃描過(guò)程登記
掃描過(guò)程中需要仔細(xì)填寫(xiě)紙質(zhì)檔案數(shù)字化登記交接單,對(duì)于掃描文件頁(yè)數(shù)進(jìn)行登記,核實(shí)每份掃描文件的實(shí)際頁(yè)數(shù)和掃描后電子文件的頁(yè)數(shù)一致。如出現(xiàn)二者不一致的情況,應(yīng)在登記表內(nèi)寫(xiě)明原因和相應(yīng)的舉措。
檔案數(shù)字化與掃描技術(shù)
檔案數(shù)字化實(shí)現(xiàn)文本的輸入,主要是采用掃描方式將紙質(zhì)的文件與檔案轉(zhuǎn)換為數(shù)字化的形式。掃描加工是通過(guò)中高速掃描儀和專(zhuān)用掃描軟件將整理和分檢好的檔案資料批量轉(zhuǎn)化成圖像文件,并自動(dòng)實(shí)現(xiàn)圖像壓縮存儲(chǔ)的過(guò)程。
(一)國(guó)家規(guī)范中的有關(guān)標(biāo)準(zhǔn)
檔案數(shù)字化直接標(biāo)準(zhǔn)除《電子文件歸檔與管理規(guī)范》外,就是《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》。這一技術(shù)規(guī)范指出,“掃描應(yīng)該根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描。大幅面檔案可采用大幅面數(shù)碼平臺(tái),或者縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設(shè)備等進(jìn)行掃描,也可以采用小幅面掃描后的圖像拼接方式處理?!绷硗猓凹垙垹顩r較差,以及過(guò)薄、過(guò)軟或超厚的檔案,應(yīng)采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率?!?/p>
掃描色彩模式一般有黑白二值、灰度、彩色等,通常采用的是黑白二值。具體又細(xì)分為三種:“頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進(jìn)行掃描。頁(yè)面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可采用灰度模式掃描。頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進(jìn)行掃描?!?/p>
掃描分辨率參數(shù)大小的選擇,原則上以?huà)呙韬蟮膱D像清晰、完整、不影響圖像的利用效果為準(zhǔn)。因?yàn)楦叻直媛嗜菀资刮募獾綇?fù)制,基于此,國(guó)家規(guī)范中規(guī)定采用黑白二值、灰度、彩色幾種模式對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般均選擇≥100dpi。如遇到文字偏小、密集、清晰度較差等特殊狀況,則可以適當(dāng)提高分辨率。而需要進(jìn)行OCR漢字識(shí)別的檔案,掃描分辨率一般建議選擇≥200dpi。
(二)實(shí)際操作中的做法
實(shí)際工作中,檔案部門(mén)根據(jù)檔案本身不同情況,一般都采用各類(lèi)掃描儀進(jìn)行掃描,數(shù)碼相機(jī)則較少使用。另外,實(shí)際掃描中受檔案狀況或掃描設(shè)備所限,也存有一些暫時(shí)無(wú)法進(jìn)行數(shù)字化轉(zhuǎn)換的檔案,如紙張過(guò)于破損、發(fā)脆,或者某些尺寸過(guò)大的圖紙等。而這些只能等待設(shè)備或者技術(shù)的更進(jìn)后才可以解決。
色彩模式的選擇是依據(jù)現(xiàn)有的設(shè)備以及檔案本身狀況而定的,可以遵守循序漸進(jìn)的原則。比如杭州市檔案館在進(jìn)行紙質(zhì)檔案數(shù)字化時(shí),一期以黑白掃描為主,二期對(duì)紅頭文件及其他帶有紅章的文件進(jìn)行彩色掃描,三期則全部進(jìn)行彩色掃描。無(wú)疑,彩色掃描的層次更加豐富,清晰度更高,可以更真實(shí)地顯示檔案原貌。
分辨率的選擇與設(shè)備關(guān)系很大,在不同地區(qū)、不同部門(mén)也有所差別。如杭州市檔案館在紙質(zhì)檔案數(shù)字化的一期工程中,就將掃描分辨率定為300dpi,浙江省檔案館的數(shù)字化掃描分辨率一般在200~300dpi左右,有的高達(dá)600dpi;而在一些設(shè)備相對(duì)比較落后的部門(mén)與地區(qū),其掃描分辨率大都是按照國(guó)家規(guī)范來(lái)設(shè)定的,甚至于很多部門(mén)還達(dá)不到200dpi。分辨率越高,掃描后的圖像就越清晰,但同時(shí)必須考慮到圖像文件的大小。
(三)掃描技術(shù)發(fā)展趨勢(shì)
掃描技術(shù)中最主要的是色彩模式選擇和分辨率選擇。
色彩模式無(wú)疑會(huì)朝著彩色掃描發(fā)展,而分辨率的選擇需要根據(jù)實(shí)際業(yè)務(wù)進(jìn)行靈活設(shè)置。一般情況下,為了滿(mǎn)足網(wǎng)絡(luò)化查詢(xún)利用,黑白圖像采用200dpi就可以滿(mǎn)足要求,彩色圖像的掃描分辨率還可以低一些,具體參數(shù)可以根據(jù)掃描清晰度和質(zhì)量因素進(jìn)行綜合選擇。對(duì)于一些特殊的利用如承辦展覽等可以采用較高的掃描分辨率來(lái)進(jìn)行。值得注意的是,分辨率的選擇既不可過(guò)低,也不可過(guò)高。如福建曾采用了50dpi的掃描分辨率,雖然容量小、費(fèi)用低,但是根本無(wú)法實(shí)現(xiàn)上網(wǎng)查詢(xún)利用,等于做了無(wú)用功;另一方面,如果一味追求過(guò)高的分辨率,則會(huì)導(dǎo)致容量過(guò)大,對(duì)于網(wǎng)上資源的傳播也是一種負(fù)擔(dān)。
檔案數(shù)字化后還要考慮文字識(shí)別(OCR)的運(yùn)用,一般來(lái)說(shuō),文字識(shí)別主要用于全文檢索之用,而非真正將掃描后的圖像文件還原為文檔,因而,就這一點(diǎn)看,不要以O(shè)CR的識(shí)別率來(lái)設(shè)置掃描分辨率,《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》建議需要OCR識(shí)別的圖像文件,分辨率≥200dpi,這是一個(gè)比較中性的標(biāo)準(zhǔn)。
(全國(guó)總部)河南省鄭州市金水區(qū)博雅廣場(chǎng)4號(hào)樓1104
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8