99久久精品国产片久人,久久九九免费视频,影音先锋午夜资源网站,国产精品极品美女自在线

      合合信息及2所高校發(fā)布業(yè)內首個(gè)古彝文編碼數據庫

      發(fā)布時(shí)間:2023-09-26 來(lái)源:中國網(wǎng)商務(wù) 作者:周健 責任編輯:沈曄

      近期,合合信息聯(lián)合上海大學(xué)、華南理工大學(xué),發(fā)布業(yè)內首個(gè)古彝文基礎編碼數據庫,以智能圖像處理、智能文字識別等AI技術(shù),開(kāi)展統一編碼,古彝文在數字社會(huì )中有了“身份證號碼”。

      以往,古文字主要通過(guò)人工識別、校正和進(jìn)行文獻編撰,工作量繁多且效率低下。近年來(lái),人工智能,特別是深度學(xué)習技術(shù)的發(fā)展,為古文字識別提供了高效的工具。據悉,古彝文數字化方面的成果相對較少,一方面,古彝文字符集龐大,且缺乏成熟的手寫(xiě)樣本庫。另一方面,在彝文的發(fā)展過(guò)程中,由于種種因素,導致異體字、變體字豐富,字符和釋義“一對多、多對一”是常態(tài)。

      基于上述情況,合合信息與華南理工大學(xué)共同成立的文檔圖像分析識別與理解聯(lián)合實(shí)驗室,聯(lián)合上海大學(xué)社會(huì )學(xué)院組建研究團隊,共同解決數據庫建設中的學(xué)術(shù)性、技術(shù)性難點(diǎn)。

      在對7萬(wàn)6千字符的樣本進(jìn)行訓練后,團隊成功建立了包含上千個(gè)古彝文基礎編碼的數據庫。通過(guò)API數據接口等形式,該數據庫有望幫助高校研究人員、文化工作者、興趣愛(ài)好者等人群,快速找到古彝文在字典中的讀音、漢語(yǔ)釋義、用法,如同“大字典”一般,幫助人們降低古彝文書(shū)籍、文獻閱讀的門(mén)檻。

      合合信息在智能文字識別領(lǐng)域已有17年深耕經(jīng)驗。此前,在A(yíng)I識別甲骨文、西周鐘鼎文(金文)領(lǐng)域,公司已進(jìn)行了領(lǐng)先的探索和研究,為古彝文識別積累了經(jīng)驗,奠定了良好的技術(shù)基礎。

      相關(guān)資訊

      中文 English Fran?ais Deutsch 日本語(yǔ)
      Русский язык Espa?ol ???? ???

      中國網(wǎng)客戶(hù)端

      國家重點(diǎn)新聞網(wǎng)站,9語(yǔ)種權威發(fā)布

      立即下載