婷婷免费高清视频在线观看,亚洲午夜在线一区,免费高清日本中文,精品一区久久,久久不射影院,玖玖国产精品,性感大胸美女比基尼

利用智能技術加速中華古籍資源數字化建設

  • 中國文化報
  • 2022-03-25 15:47:06

古籍蘊含著中華民族的燦爛文明和優(yōu)秀的傳統文化,保護好古籍對傳承和弘揚中華優(yōu)秀傳統文化、增強文化自信有著重要意義。今年的政府工作報告中,明確提出要“加強文物古籍保護利用和非物質文化遺產保護傳承”,體現了對提升古籍保護水平,拓展社會參與的廣度和深度的重視。

然而從古籍保護現狀來看,我國目前還面臨數字化程度低、以文本形式進行數字化的古籍數量少、難以檢索等問題。數據顯示,我國現存古籍有20萬種。據不完全統計,其中有數字化掃描影像的有8萬種,而實現文本數字化的僅有3萬至4萬種。

為推動改變這一局面,3月17日,字節(jié)跳動向北大教育基金會提供捐贈,支持“北京大學-字節(jié)跳動數字人文開放實驗室”,研發(fā)古籍數字化平臺,利用智能技術加速中華古籍資源的數字化建設,向全社會提供公益化服務。該實驗室將調動相關資源,力爭在3年內完成1萬種精選古籍的智能化整理工作。提供開放、體驗良好的閱讀服務和基本文本庫,并借助知識圖譜等技術幫助學者高效檢索和利用古籍中的信息。同時,項目也將推出結合OCR文字識別、句讀、實體識別和知識圖譜等技術構建的一站式自動古籍智能化整理平臺,并對社會大眾免費開放,便于收藏機構、研究者、相關專業(yè)的師生和廣大古籍愛好者自行完成古籍數字化工作,加快整個行業(yè)數字化古籍資料的效率。

中國社會科學院教授鄭永曉多年來一直從事數字人文方面的實踐和理論探索,參加了古典文獻數字化早期的實踐工作。他談到,近20年來,我國在古籍文獻數字化和古籍數據庫建設方面的成就是巨大的。但目前古籍數據庫的建設也面臨發(fā)展的瓶頸。“雖然像《中華經典古籍庫》《四部叢刊》等掛接聯機字典、年代轉換、批注等各種工具,很有實用價值,但從根本上說,這些數據庫的主體內容屬于非結構化數據,除全文檢索外,并不能協助學者完成其他工作。因此,對古籍文獻數據庫進行升級換代勢在必行。”

在鄭永曉看來,未來的古籍文獻數據庫應結合數據挖掘技術、自然語言處理技術以及相關學者的深度參與,在古籍詞頻分析、版本分析比較、計算機輔助句讀等方面有切實的進展。他說:“要利用人工智能、大數據等最新技術,力求完成人力所難以完成的宏觀分析和微觀比較等工作,協助學者進行多維度的統計、比較、分析,產生新的知識和思想。”

“我們希望與北大的跨學科團隊在OCR文字識別、自然語言處理、知識圖譜等技術領域展開全面合作,充分利用人工智能技術加快古籍數字化整理、研究與利用,讓更多的研究者、愛好者以更高效、便利的方式獲取古籍里蘊藏的豐富知識。”字節(jié)跳動有關負責人表示。(于 帆)

關鍵詞: 中華古籍資源 數字化建設 優(yōu)秀傳統文化 非物質文化遺產保護傳承

分享到:
?
  • 至少輸入5個字符
  • 表情

熱門資訊

 

聯系郵箱:85 572 98@qq.com 法律支持:廣東海新律師事務所 劉海濤 律師

粵ICP備18023326號-36未經授權不得鏡像、轉載、摘抄本站內容,違者必究!Copyright 2016 IGDZC. All Rights Reserved

廣東之窗 版權所有