隨著新媒體的發(fā)展,報(bào)紙行業(yè)受到了多方面沖擊,甚至導(dǎo)致諸如《法蘭克福論壇報(bào)》和《紐倫堡晚報(bào)》這樣具有影響力的報(bào)社相繼倒閉。但今天的新聞就是明天的歷史,報(bào)紙檔案反映了社會(huì)方方面面的真實(shí)情況,它具有社會(huì)性、歷史性、確定性和原始記錄性等特性,能夠彌補(bǔ)檔案史料缺乏完整時(shí)間線索的不足,豐富史料內(nèi)容,因此絕不能將其束之高閣,湮沒(méi)于塵埃之中,將報(bào)紙進(jìn)行數(shù)字化迫在眉睫。讓我們首先來(lái)了解下大英圖書館是怎么樣保存和利用報(bào)紙檔案的吧!
大英圖書館收藏包括什么?
從十九世紀(jì)初開(kāi)始,英國(guó)報(bào)紙出版業(yè)的規(guī)模巨大,許多城市和城鎮(zhèn)分別針對(duì)不同社會(huì)地位、地理位置和政治關(guān)系的受眾,同時(shí)出版了數(shù)家報(bào)紙。大英圖書館收錄了1800年以來(lái)英國(guó)發(fā)行的大部分報(bào)紙,這些收藏品的品質(zhì)在世界上首屈一指。
那么大英圖書館是如何對(duì)原始報(bào)紙展開(kāi)數(shù)字化并提供在線獲取的呢?
在過(guò)去的幾年里,他們團(tuán)隊(duì)每天掃描原始裝訂的報(bào)紙頁(yè)面以及縮微膠片,制成數(shù)以千計(jì)的數(shù)字圖像。為了形成可供利用的數(shù)字檔案,掃描的頁(yè)面圖片會(huì)轉(zhuǎn)化JPEG2000格式,這些圖片文件也會(huì)通過(guò)光符識(shí)別(OCR)形成電子文本。這個(gè)過(guò)程包括將每張圖片分解成不同分區(qū)以幫助檢索,最后,在一個(gè)很大的數(shù)據(jù)庫(kù)中,會(huì)以輸出的光符識(shí)別(OCR)文本為基礎(chǔ)編制索引。
由于獲取了這些原始且已裝訂成冊(cè),珍貴又脆弱的報(bào)紙,大英圖書館數(shù)字化掃描并提供在線檢索和利用成為可能。
將有價(jià)值的文獻(xiàn)資料數(shù)字化,使其不再受版權(quán)保護(hù),是實(shí)現(xiàn)這些目標(biāo)的關(guān)鍵措施。目前大英圖書館正在采用賽數(shù)掃描技術(shù)將其有價(jià)值的書籍、手稿和報(bào)刊進(jìn)行數(shù)字化。在圖書館的數(shù)字化中心,22臺(tái)賽數(shù)掃描儀被用于謹(jǐn)慎且高效地對(duì)館藏文獻(xiàn)進(jìn)行數(shù)字化掃描。該中心有22臺(tái)賽數(shù)非接觸式掃描儀,它們“支持最大600dpi光學(xué)分辨率的圖像質(zhì)量和最大A0的幅面”,大英圖書館負(fù)責(zé)人如此說(shuō)。