• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 數(shù)字化助古籍走出“深閨高閣” 環(huán)球觀焦點(diǎn)
    2023-01-30 11:33:28 來(lái)源:人民日?qǐng)?bào)海外版 編輯:

    為查閱古籍文獻(xiàn),要出差到各地,探訪各家圖書館——這是許多古籍研究者的共同記憶。在數(shù)字時(shí)代,這種情況正發(fā)生改變。國(guó)家圖書館(國(guó)家古籍保護(hù)中心)等6家單位近日在線新增發(fā)布古籍?dāng)?shù)字資源6786部(件)。至此,全國(guó)已累計(jì)在線發(fā)布古籍?dāng)?shù)字資源13萬(wàn)部(件)。依托數(shù)字化手段,卷帙浩繁的古籍走出“深閨高閣”,讓文明觸手可及。


    (相關(guān)資料圖)

    兼顧“藏”與“用”

    古籍,作為文物必須保護(hù),作為文獻(xiàn)必須為讀者所用。兼顧“藏”與“用”,一直是古籍保護(hù)工作的重點(diǎn),而數(shù)字化是最好的方法。中國(guó)古籍?dāng)?shù)字化起步于20世紀(jì)90年代。隨著數(shù)字技術(shù)不斷成熟,科技賦能古籍工作取得可喜進(jìn)展。

    “2016年國(guó)家圖書館搭建起‘中華古籍資源庫(kù)’平臺(tái),發(fā)布了普通古籍、甲骨、敦煌文獻(xiàn)等數(shù)字資源,并全部實(shí)現(xiàn)免登錄在線閱覽?!眹?guó)家圖書館副研究員南江濤介紹,國(guó)家圖書館還聯(lián)合海內(nèi)外收藏機(jī)構(gòu)發(fā)布“法藏敦煌遺書”“天津圖書館古籍”“云南省圖書館古籍”等,基本搭建“國(guó)家古籍?dāng)?shù)字平臺(tái)”架構(gòu)。

    隨著“中華古籍保護(hù)計(jì)劃”深入開(kāi)展,各地圖書館陸續(xù)投入人力物力,大力推進(jìn)古籍?dāng)?shù)字化。國(guó)家圖書館先后聯(lián)合39家單位發(fā)布數(shù)字古籍,1月4日是第7次聯(lián)合發(fā)布,其中不僅包含明清版刻,還有碑帖拓本等特色資源。相關(guān)數(shù)據(jù)顯示,在現(xiàn)有的13萬(wàn)部(件)數(shù)字古籍中,超過(guò)10.2萬(wàn)部(件)歸屬于“中華古籍資源庫(kù)”。

    “這13萬(wàn)部(件)古籍?dāng)?shù)字資源,對(duì)于我們研究者來(lái)說(shuō)格外珍貴。”北京大學(xué)中文系教授楊海崢感嘆,在線查閱免去了往返奔波圖書館的時(shí)間,平衡了古籍的文物性與文獻(xiàn)性。

    AI助力古籍整理

    把紙質(zhì)古籍轉(zhuǎn)化成數(shù)字文本,只是古籍保護(hù)的第一步?!艾F(xiàn)有的數(shù)字古籍大多由縮微膠片轉(zhuǎn)換而成,分辨率低,使用也不方便?!睏詈樑e例解釋,這類古籍通常不具備檢索功能,想查閱某個(gè)內(nèi)容,需逐篇逐頁(yè)閱讀原文,很難快速找到想要的知識(shí)。

    人工智能的快速發(fā)展,為數(shù)字古籍的整理分類帶來(lái)革命性變化。2022年10月,由字節(jié)跳動(dòng)與北京大學(xué)數(shù)字人文研究中心合作研發(fā)的數(shù)字古籍平臺(tái)“識(shí)典古籍”便是一個(gè)生動(dòng)案例。

    進(jìn)入“識(shí)典古籍”的網(wǎng)站,記者看到《周易》《左傳》《禮記》等陳列于首頁(yè)上。隨機(jī)點(diǎn)開(kāi)一本,左側(cè)為章節(jié)目錄,右側(cè)為正文,排版形式既順應(yīng)現(xiàn)代人的閱讀習(xí)慣,又還原了古籍紙張的閱讀美感。

    “與一些數(shù)字化平臺(tái)不同,‘識(shí)典古籍’是完全免費(fèi)的,而且增加了簡(jiǎn)繁體轉(zhuǎn)換、底本影像對(duì)照、全文檢索等一系列便捷功能。”抖音集團(tuán)企業(yè)社會(huì)責(zé)任部產(chǎn)品總經(jīng)理唐塏鑫介紹,該平臺(tái)主要應(yīng)用了文字識(shí)別、自動(dòng)標(biāo)點(diǎn)和命名實(shí)體識(shí)別這3種技術(shù),不僅能將影印本上的文字提取整理,還能通過(guò)序列標(biāo)注識(shí)別文本中的人名、地名等信息,準(zhǔn)確率達(dá)到96%至97%。

    “平臺(tái)已整理上線了685部經(jīng)典古籍,共計(jì)7900多萬(wàn)字,主要來(lái)自《四部叢刊》?!碧茐N鑫說(shuō),“識(shí)典古籍”已上線手機(jī)移動(dòng)版,未來(lái)平臺(tái)中的書目將持續(xù)更新。

    業(yè)內(nèi)人士預(yù)測(cè),隨著AI技術(shù)的運(yùn)用,古籍文獻(xiàn)中所蘊(yùn)藏的古代歷史文化知識(shí)將不斷被抽取,構(gòu)造成各種各樣的知識(shí)庫(kù),并將以知識(shí)圖譜的形式支持互聯(lián)網(wǎng)前端應(yīng)用。

    跨界合作成趨勢(shì)

    事實(shí)上,在“識(shí)典古籍”上線之前,文保機(jī)構(gòu)、科研院校與互聯(lián)網(wǎng)公司的跨界合作已越來(lái)越普遍。比如,騰訊聯(lián)合敦煌研究院開(kāi)發(fā)了AI病害識(shí)別技術(shù),幫助“問(wèn)診”敦煌千年壁畫。

    由于在產(chǎn)品研發(fā)、設(shè)計(jì)方面存在優(yōu)勢(shì),互聯(lián)網(wǎng)公司等社會(huì)力量的加入會(huì)進(jìn)一步保障古籍?dāng)?shù)字化平臺(tái)的服務(wù)質(zhì)量?!拔覀冇袃?yōu)秀的產(chǎn)品經(jīng)理、設(shè)計(jì)師、軟件工程師,能夠不斷優(yōu)化數(shù)字古籍平臺(tái)的產(chǎn)品功能?!碧茐N鑫說(shuō)。

    “識(shí)典古籍”的誕生離不開(kāi)專家學(xué)者支持。北京大學(xué)數(shù)字人文研究中心主任王軍表示,北大在這次合作中負(fù)責(zé)人工審核與校對(duì),彌補(bǔ)人工智能有識(shí)別錯(cuò)誤率的短板,并利用自有學(xué)術(shù)平臺(tái),連接更多專業(yè)研究者和學(xué)生群體。

    專家認(rèn)為,在古籍整理中,人文社科學(xué)者要積極介入,并加強(qiáng)與技術(shù)人員的合作,那樣才能更好地利用機(jī)器而不是被機(jī)器牽著鼻子走,從而保證結(jié)果的準(zhǔn)確性。

    “高校古典文獻(xiàn)學(xué)等相關(guān)專業(yè)如何培養(yǎng)兼具技術(shù)與學(xué)術(shù)能力的復(fù)合型人才、如何形成多學(xué)科交叉的課程體系等,都是需要綜合考慮的問(wèn)題?!蓖踯娬f(shuō)。

    關(guān)鍵詞: 識(shí)典古籍 古籍?dāng)?shù)字資源 中華古籍

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>