98国产精品综合一区二区三区,日本精品电影一区二区三区,亚洲精品中文字幕星奈爱,久久久精品一区AAA片

沒有全文數(shù)字庫還是不是好的數(shù)字檔案館?

2021/3/1 16:58:16       來源:        作者:小博       瀏覽量:  432

數(shù)字檔案館指檔案收集、處理、存儲、查詢等檔案管理活動的數(shù)字化、電子化、網(wǎng)絡化,即虛擬檔案。它是基于計算機網(wǎng)絡技術、數(shù)據(jù)庫技術以及多媒體技術的發(fā)展而產(chǎn)生的新型檔案館。數(shù)字檔案館是一個數(shù)字化的信息系統(tǒng),它把分散于不同載體不同地理位置的信息資源以數(shù)字化的形式存貯,以網(wǎng)絡方式互相聯(lián)結,從而提供及時利用,實現(xiàn)資源共享。



全文數(shù)據(jù)庫建設的問題


在實際中有一種讓人說不清的現(xiàn)象,就是建設數(shù)字檔案館中,并不十分關注檔案全文數(shù)據(jù)庫建設的問題,其表現(xiàn):

 

1.忽略檔案全文數(shù)據(jù)庫建設

一是忽略檔案全文數(shù)據(jù)庫建設。如國家檔案局的《數(shù)字檔案館建設指南》雖然指出:“數(shù)字檔案資源建設是數(shù)字檔案館建設的核心內容”,但是,在整部《數(shù)字檔案館建設指南》中沒有提及檔案全文數(shù)據(jù)庫建設的問題,根本沒有對檔案全文數(shù)據(jù)庫建設的要求。在國家檔案局《數(shù)字檔案館系統(tǒng)測試辦法》中也同樣沒有提及檔案全文數(shù)據(jù)庫的問題,也沒有對檔案全文數(shù)據(jù)庫建設的要求,而僅僅有對檔案目錄數(shù)據(jù)庫的要求。

 

2.忽略檔案全文數(shù)據(jù)庫建設

 

二是誤讀檔案全文數(shù)據(jù)庫。在許多數(shù)字檔案館建設的地方,大都稱已建立了檔案全文數(shù)據(jù)庫,但是,也不知是不理解什么是檔案全文數(shù)據(jù)庫,還是誤解檔案全文數(shù)據(jù)庫,實際并沒有建立檔案全文數(shù)據(jù)庫,而是將檔案全文掃描圖像誤認為是檔案全文數(shù)據(jù)庫。實際只是對檔案原文進行圖像數(shù)字化掃描,生成的只是一幅幅圖像,并不能對其內容進行直接檢索,而是通過掛接到檔案目錄數(shù)據(jù)庫,靠檢索檔案目錄來指引查閱檔案原文。這種現(xiàn)象從一些地方數(shù)字檔案館的建設費用上就可以看出來。例如,一個通過國家示范數(shù)字檔案館測試的檔案館,共投資560萬元,包括機房、軟硬件平臺、數(shù)字檔案館管理軟件、“加工檔案96779卷,建成了159萬條目錄數(shù)據(jù)庫、1085萬頁全文數(shù)據(jù)庫、36027張照片數(shù)據(jù)庫、11160分鐘的多媒體數(shù)據(jù)庫,12809條圖書資料目錄數(shù)據(jù)庫”等。一般加工一頁全文檔案(掃描、文字識別、校對)至少1元,而且年代越遠的檔案其加工成本會更高。那么,僅1085萬頁全文就需要資金1085萬,僅此一項幾乎是總投資2倍。所以,可以肯定其不是全文數(shù)據(jù)庫,而只是全文圖像數(shù)據(jù)庫,也就是無法進行檔案全文檢索的檔案信息。

 

3.對檔案全文數(shù)據(jù)庫文字識別的標準問題

 

三是對檔案全文數(shù)據(jù)庫文字識別的標準問題。對于檔案全文數(shù)據(jù)庫最基礎的紙質檔案資源的數(shù)字化加工,檔案行業(yè)標準《紙質檔案數(shù)字化技術規(guī)范》(DA/T31—2017)根本沒有有關檔案全文文字識別的問題,該規(guī)范只對紙質檔案數(shù)字化掃描圖像的分辨率做了規(guī)定。也就是對于檔案全文的數(shù)字化文字識別的問題根本沒有標準。對于文字識別率的問題,有專家認為:“識別率一般達到90%以上,已經(jīng)基本滿足檔案全文檢索的需要了。有的人片面追求識別率,一定要求識別率達到98%-99%的,反復校對,實際上是浪費人力物力?!睂嶋H90%的識別率對檔案全文檢索還是有相當影響的,達到98%-99%可能有些要求高,至少應該在95-98%以內。但是,OCR只能對現(xiàn)代正規(guī)的打印體識別率較高,對于手寫體、鋼板刻字以及打字機打字蠟紙油印的字體的識別率并不高,特別是前兩者。至于豎版的檔案就更別說了。而在市縣級檔案館保存的檔案中,現(xiàn)代正規(guī)的打印體的并不多,大部分都是后者。就像計算機的普及一樣,先省后市,然后才是縣鄉(xiāng),先經(jīng)濟發(fā)達地方,后經(jīng)濟落后地方,從手寫到鋼板刻字再到打字機打字,也是如此。

 

近日,知識管理專家會博通“知識檢索功能”及“百度OCR”功能上線,將以更前沿的技術手段,更便捷的檔案數(shù)字化管理方式,提升對全文數(shù)字庫的管理,從而提升數(shù)字檔案館的管理效益。

免責聲明:部分文章信息來源于網(wǎng)絡以及網(wǎng)友投稿,本網(wǎng)站只負責對文章進行整理、排版、編輯,是出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯(lián)系本站,我們會盡快處理。
更多資訊
肥婆老熟妇精品视频在线| 69国产超级乱婬Aⅴ片| 又黄又湿又爽的视频网站| 日本大鸡巴操逼| 香蕉女久久久久久久久久| 欧美超清bbc4k视频| 美女美腿丝袜露逼毛黄片| 久久www影院人成免费| 最近中文字幕mv免费看| facestting视频| 亚洲AV无码一区二三区| 十八岁以后免费观看的黄| 免费性爱插插插| 国产拗精品一区二区三区| 日日骚网址最新日骚网址| caoprom超碰91| 色黄片免费观看| 日本一区二区三区无人区| 操逼射逼里视频| 无码久久综合久中文字幕| 精品国产自在久国产应用| 天天操夜夜操三级片视频| 欧美高潮喷水| 国产精品一区二区三区p| 日韩色精品无码免费视频| 18禁精品一区二区三区| 美女扣逼抖黄网| 精品久久久久久中文无码| 尤物屌屌屌逼逼| 美女操逼逼水润大摸网站| 中文字幕av片| 美女被鸡巴插逼aaaa| 美女高潮抽搐潮白浆网站| 中文字幕亚洲欧美国产一区| 欧美乱人伦一区二区三区| 插鸡鸡网址在线观看视屏| 久久久精品视频免费观看| 男人插女人一区二区三区 | 风韵丰满熟妇啪啪区熟女| 久久人人澡人人爽人人爱| 一个人在线免费观看欧美|