• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 【新時代新征程新偉業(yè)】智能技術(shù)推動古籍整理進(jìn)入“快車道”|世界新動態(tài)
    2022-12-18 05:50:09 來源:光明網(wǎng)-《光明日報》 編輯:

    【新時代新征程新偉業(yè)】


    【資料圖】

    光明日報記者 陳雪

    無論是石刻拓片、民國期刊,還是版刻古籍,只需要5分鐘就可以對數(shù)百頁的文獻(xiàn)圖像進(jìn)行批量的OCR(文字識別),并可以在線開啟校對工作。11月初,中華書局古聯(lián)公司發(fā)布了“古聯(lián)OCR系統(tǒng)”,這是智能技術(shù)運(yùn)用在古籍整理方面的一項重要成果。

    “識別率很高,基本沒有錯誤?!監(jiān)CR系統(tǒng)剛一發(fā)布,就有用戶進(jìn)行了試用體驗(yàn)。事實(shí)上,從紙面文字到數(shù)字化數(shù)據(jù),看似簡單的一步,卻是古籍整理研究的重要環(huán)節(jié),需要運(yùn)用多項智能技術(shù)。

    “智能技術(shù)進(jìn)入古籍整理領(lǐng)域,是古籍整理長久以來工作方法的顯著創(chuàng)新。古籍原典從紙本到數(shù)據(jù)的關(guān)鍵一環(huán),即為文本的獲取,而文本獲取的正確率如何、操作的簡易性如何,對后續(xù)工作展開有很大影響?!敝腥A書局古聯(lián)公司總經(jīng)理洪濤介紹,若識別效果太差,會給后續(xù)的校對和整理工作增加不少工作量。古聯(lián)智能OCR系統(tǒng)基于機(jī)器學(xué)習(xí)技術(shù)和豐富的字庫支持,輔以便捷的在線校對和編輯環(huán)境,可以大幅減輕人工校對工作量,協(xié)助編輯和作者更高效、更便捷地處理文本。

    黨的二十大報告提出,推進(jìn)教育數(shù)字化,建設(shè)全民終身學(xué)習(xí)的學(xué)習(xí)型社會、學(xué)習(xí)型大國。據(jù)了解,OCR系統(tǒng)與古聯(lián)公司推出的古籍自動標(biāo)點(diǎn)、繁簡轉(zhuǎn)換工具相結(jié)合,將古籍整理研究界使用的技術(shù)工具擴(kuò)大為普通用戶觸手可及的智能產(chǎn)品,為廣大普通讀者服務(wù)。除此之外,該系統(tǒng)也可配合高等學(xué)校的古典文獻(xiàn)等傳統(tǒng)學(xué)科轉(zhuǎn)向新文科建設(shè),讓學(xué)生在學(xué)習(xí)階段就能了解到業(yè)內(nèi)前端的新興技術(shù)和發(fā)展方向。

    “戈厲機(jī)”是高爾基;“師梨”是雪萊;戛劍生、公汗、隋洛文,都是魯迅的筆名……在閱讀漢譯文學(xué)早期文獻(xiàn)時,人們常常會有“猜人名”的困惑。這是因?yàn)樵缙谕鈬骷壹捌渥髌返臐h譯名稱極不統(tǒng)一,而譯介者又多使用筆名且變化無常,長期以來,此領(lǐng)域一直缺乏相關(guān)的基礎(chǔ)性、系統(tǒng)性的整理工作。11月12日,《現(xiàn)代漢譯文學(xué)編年考錄數(shù)據(jù)庫》應(yīng)運(yùn)而生。這是黨的二十大以來,古聯(lián)公司推出的又一重要數(shù)據(jù)庫產(chǎn)品。據(jù)了解,該數(shù)據(jù)庫由中國人民大學(xué)李今教授主持,北京大學(xué)夏曉虹教授、方錫德教授,中國人民大學(xué)孫郁教授,清華大學(xué)解志熙教授等審定,多位青年學(xué)者著錄,中華書局古聯(lián)公司開發(fā)建設(shè),致力于為學(xué)界提供現(xiàn)代漢譯文學(xué)研究的便利工具,建立起該專題的史料庫、知識庫及目錄索引庫。

    洪濤介紹,數(shù)據(jù)庫集納了226種近現(xiàn)代期刊,其漢譯的外國文學(xué)涉及51個國家、1580位外國作家和2130位譯介者,總條目數(shù)近9000個,而且,還有大量重要期刊的內(nèi)容尚在考錄中,不久將增補(bǔ)上線。項目組以前所未有的規(guī)模為1896-1949年間期刊上的漢譯文學(xué)及其相關(guān)現(xiàn)象做了編目、整理和考釋,并為譯介者做了生平簡介及其筆名錄。數(shù)據(jù)庫集專題文獻(xiàn)數(shù)據(jù)庫、知識庫、目錄索引庫為一體,是綜合性的新型研究工具,適用于中國近現(xiàn)代文學(xué)、比較文學(xué)與世界文學(xué)、外國語言文學(xué)等學(xué)科,以及相關(guān)歷史與文化等人文領(lǐng)域的教學(xué)與研究。

    辨章學(xué)術(shù)、考鏡源流。記者看到,數(shù)據(jù)庫中對相關(guān)條目信息進(jìn)行了詳細(xì)考錄。如1903年《浙江潮》上發(fā)表的小說《哀塵》,是法國“囂俄著,庚辰譯”,頁面中用數(shù)百字進(jìn)行了考錄:囂俄,今譯雨果,譯者庚辰是魯迅的筆名。據(jù)了解,數(shù)據(jù)庫成功實(shí)現(xiàn)了外國作家之不同漢譯名與今譯名、譯介者之署名與常用名之間的“同實(shí)異稱”關(guān)聯(lián)。如檢索“魯迅”,凡魯迅曾使用過的索子、風(fēng)聲、張祿如等其他筆名的相關(guān)文獻(xiàn)均可同時呈現(xiàn),解決了過往檢索中“同實(shí)異稱”無法檢索的問題,從而盤活了期刊漢譯文學(xué)史料。

    黨的二十大提出要“實(shí)施國家文化數(shù)字化戰(zhàn)略”,洪濤說,這為古聯(lián)公司的發(fā)展提供了動力也指明了方向。古聯(lián)公司作為中華書局的數(shù)字化企業(yè),要用好技術(shù)手段,從文獻(xiàn)中提取中華優(yōu)秀傳統(tǒng)文化的要素,做好轉(zhuǎn)化與傳播,增強(qiáng)文化自信,讓文化產(chǎn)品更具有時代性與生命力。

    《光明日報》( 2022年12月18日?02版)

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>