99精品视频,久久无码人妻99,性欧美丰满熟妇XXXX性久久久,亚洲国产精品不卡av在线,人妻系列中文字幕在线网

<font id="xcbfz"></font>

<video id="xcbfz"><meter id="xcbfz"></meter></video>

<code id="xcbfz"><noscript id="xcbfz"><del id="xcbfz"></del></noscript></code>

<s id="xcbfz"><meter id="xcbfz"></meter></s>

<video id="xcbfz"><meter id="xcbfz"></meter></video>

<font id="xcbfz"></font>

<video id="xcbfz"><meter id="xcbfz"></meter></video>

<code id="xcbfz"><noscript id="xcbfz"><del id="xcbfz"></del></noscript></code>

<s id="xcbfz"><meter id="xcbfz"></meter></s>

<video id="xcbfz"><meter id="xcbfz"></meter></video>

駐馬店融媒宣傳下載

您當(dāng)前所在位置：駐馬店廣視網(wǎng)>文旅> 正文

分享至手機(jī)

科技守護(hù)文明：中國古籍“回家”之路

時間：2021-05-21 09:16:34|來源：新華網(wǎng)|點(diǎn)擊量：23142

新華社成都5月20日電　題：科技守護(hù)文明：中國古籍“回家”之路

新華社記者童芳

中國是世界四大文明古國之一，中國浩如煙海的文獻(xiàn)典籍記錄了歷史。然而遺憾的是，近代以來超過400萬冊中國古籍由于種種原因流散海外。

阿里巴巴達(dá)摩院、四川大學(xué)、美國加州大學(xué)伯克利分校近日公布，他們花費(fèi)兩年多的時間，教會了AI識別中國古籍，將它們以數(shù)字化的形式接回故土，置于網(wǎng)絡(luò)公益平臺，向所有人開放。

這個項目的名字叫“漢典重光”，意為讓失落的珍貴古籍重放光芒。“漢典重光”以97.5%的準(zhǔn)確率，識別了20萬頁古籍，覆蓋3萬多字的古籍字典。

現(xiàn)代科技照亮中國古籍“回家”之路

中國古籍擁有非常龐大且復(fù)雜的知識體系，包括甲骨簡牘、敦煌遺書、宋元善本、明清精槧、拓本輿圖、少數(shù)民族文獻(xiàn)等等。所涉及的范圍也是極其廣泛，有應(yīng)對自然災(zāi)害、流行疫病、經(jīng)濟(jì)波動、政治斗爭、外交危機(jī)、氣候變遷等的經(jīng)驗，有戰(zhàn)爭、瘟疫、地震、洪澇災(zāi)害、病蟲害等方面的經(jīng)驗總結(jié)，還有醫(yī)療、中藥、養(yǎng)生、家具、服飾、飲食文化等生活經(jīng)驗。

加州大學(xué)伯克利分校的東亞圖書館是全美三大東亞圖書館之一，90萬冊藏書里四成都是中文書，還有不少甲骨文和拓片。第一次到這兒的中國學(xué)者總感覺在穿越歷史的“蟲洞”，這些古籍不能運(yùn)回中國，那就用數(shù)字化手段讓古籍的內(nèi)容“回家”。

2019年，阿里巴巴和四川大學(xué)提出“數(shù)字化回歸”設(shè)想，四川大學(xué)歷史文化學(xué)院副院長王果與中央文史研究館館員陳力牽線搭橋，溝通北美、歐洲、日韓等地藏書機(jī)構(gòu)，最后獲得加州大學(xué)伯克利分校支持，達(dá)成共識，將伯克利東亞圖書館的中文古籍善本逐步數(shù)字化。

前所未有的挑戰(zhàn)

據(jù)王果介紹，“漢典重光”的分工非常明確——采集側(cè)把紙質(zhì)書變?yōu)橛坝“?，?shù)字化生產(chǎn)側(cè)把影印版變?yōu)槲淖职?，?yīng)用側(cè)為文字版增加檢索、字典和知識圖譜等研學(xué)系統(tǒng)。東亞圖書館完成第一個環(huán)節(jié)后，四川大學(xué)將和達(dá)摩院共同完成另外兩個步驟。其中，四川大學(xué)將提供一切非計算層面的專業(yè)支持，并與達(dá)摩院的機(jī)器視覺實驗室合作，共同開發(fā)古籍AI技術(shù)。

首批數(shù)字化的古籍共20萬頁，包含40余種珍貴宋元善本。剛開始大家對這個項目很有信心，但實際一上手才知道難度有多大。

首先是中國古籍的載體很多，紙、布、竹子、木頭、甲骨、石碑……幾乎所有能用的載體都被古人留了字，不同載體上面的字識別起來差別非常大。年代久遠(yuǎn)的紙張大多殘缺不全，上面還布滿斑點(diǎn)，而且排列非常復(fù)雜。古人喜歡從上到下，從右到左，還非常喜歡在上面做批注。

字跡的精美也成了負(fù)擔(dān)。隸書、楷書、草書、行書都漂亮，但也真難認(rèn)。大部分字還是手寫的，不但兩個人寫的同一個字不一樣，同一個人寫的同一個字也差別很大，很多字還有不同寫法。

團(tuán)隊原有的OCR（圖像文字識別）的識別準(zhǔn)確率只有40%，這顯然是不夠的，較早涉足古籍識別的Google Books（谷歌圖書）針對的都是英文古籍，對中文也不適用。

大量創(chuàng)造性和創(chuàng)新性的辛勤勞動

沒有前車可鑒，只能自己來了。“這就像教小朋友識字，確實難，但也有簡單的部分，我們就由易到難慢慢做。”王果說。

前所未有的開拓性成果，包含著中國學(xué)者大量創(chuàng)造性和創(chuàng)新性的辛勤勞動。

達(dá)摩院的古籍識別算法，用AI替代人工，大幅壓縮了專家標(biāo)注工作量。在機(jī)器為主進(jìn)行識別的97.5%的內(nèi)容中，約有1%（1萬字左右）需要專家錄入；機(jī)器不能識別的余下2.5%（2.5萬字）的文字，全部交給專家做后期標(biāo)注。相比人工專家錄入，百萬字書籍的數(shù)字化工作量從1000天降低到了35天，效率比人工專家錄入方案提升近30倍。這種古籍識別算法，為中華古籍的回歸提供了另一種可行可期的思路。

非計算機(jī)層面的工作也非常重要，四川大學(xué)專門組織了30多個歷史系學(xué)生來做標(biāo)注，這很耗神，眼力、腦力缺一不可，但這個過程沒法省略，就像學(xué)生要學(xué)習(xí)，算法也要迭代，“只有數(shù)據(jù)夠多夠好，機(jī)器才能搞定”。

這是一件非常難但非常有意義的事情。古籍識別的挑戰(zhàn)巨大，但大家還是想通過技術(shù)讓古籍活起來，用科技守護(hù)文明。

據(jù)了解，達(dá)摩院、四川大學(xué)、美國加州大學(xué)伯克利分校、中國國家圖書館、浙江圖書館將繼續(xù)投入人力、物力，擴(kuò)大古籍?dāng)?shù)字化回歸的數(shù)量，讓所有蒙塵的古籍重?zé)ㄐ律?/p>

達(dá)摩院院長張建鋒表示，阿里計劃將這套技術(shù)工具連同古籍?dāng)?shù)字化平臺一并捐贈，交由權(quán)威公共機(jī)構(gòu)長期運(yùn)營，最終將成為一個開放的網(wǎng)絡(luò)平臺，供大眾檢索學(xué)習(xí)。

免責(zé)聲明：凡本網(wǎng)注明“來源：XXX（非駐馬店廣視網(wǎng)、駐馬店融媒、駐馬店網(wǎng)絡(luò)問政、掌上駐馬店、駐馬店頭條、駐馬店廣播電視臺）”的作品，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實性負(fù)責(zé)，作品版權(quán)歸原作者所有，如有侵犯您的原創(chuàng)版權(quán)請告知，我們將盡快刪除相關(guān)內(nèi)容。凡是本網(wǎng)原創(chuàng)的作品，拒絕任何不保留版權(quán)的轉(zhuǎn)載，如需轉(zhuǎn)載請標(biāo)注來源并添加本文鏈接：http://torirandolph.com/showinfo-33-262936-0.html，否則承擔(dān)相應(yīng)法律后果。

責(zé)任編輯 / 詹云清

審核 / 李俊杰劉曉明

終審 / 平筠

上一篇：文旅部：第一季度全國旅行社國內(nèi)旅游組織1187.27萬人次

下一篇：接受高等教育人口達(dá)2.4億我國建成世界最大規(guī)模高等教育體系

駐馬店廣視網(wǎng)

駐馬店廣視網(wǎng)

駐馬店融媒

駐馬店融媒

駐馬店網(wǎng)絡(luò)問政

駐馬店網(wǎng)絡(luò)問政

掌上駐馬店

掌上駐馬店

相關(guān)閱讀

縣區(qū)新聞

視頻新聞

驛城區(qū)板橋：紅楓美景迎客來秋日滿滿氛圍感

驛城區(qū)板橋：紅楓美景迎客來秋日滿滿氛圍感

驛城區(qū)對學(xué)校周邊玩具和小食品市場開展安全檢查

驛城區(qū)對學(xué)校周邊玩具和小食品市場開展安全檢查

驛城區(qū)舉行黨的創(chuàng)新理論萬場宣講進(jìn)基層暨“百姓宣講直通車”宣講巡演

驛城區(qū)舉行黨的創(chuàng)新理論萬場宣講進(jìn)基層暨“百姓宣講直

驛城區(qū)“將尚名酒杯”第八屆廣場舞大賽在公牛體育場舉行

驛城區(qū)“將尚名酒杯”第八屆廣場舞大賽在公牛體育場舉

驛城區(qū)鞏固拓展脫貧攻堅成果重點(diǎn)工作調(diào)度會召開

驛城區(qū)鞏固拓展脫貧攻堅成果重點(diǎn)工作調(diào)度會召開

驛城區(qū)：辦民生實事為幸?！凹哟a”

驛城區(qū)：辦民生實事為幸?！凹哟a”

網(wǎng)絡(luò)電視臺

2024年10月23日《驛城新聞》

2024年10月23日《驛城新聞》

駐馬店新聞聯(lián)播《2024-10-23》

駐馬店新聞聯(lián)播《2024-10-23》

2024.10.23——《法政在線》642期

2024.10.23——《法政在線》642期

晚間播報《2024年10月22日》

晚間播報《2024年10月22日》

駐馬店新聞聯(lián)播《2024-10-22》

駐馬店新聞聯(lián)播《2024-10-22》

開發(fā)區(qū)新聞《2024年10月22日》

開發(fā)區(qū)新聞《2024年10月22日》

駐馬店廣視網(wǎng)簡介 | 聯(lián)系方式 | 免責(zé)聲明 | 廣告服務(wù) | 法律顧問 | 融媒體矩陣

中共駐馬店市委宣傳部主管駐馬店廣播電視臺主辦駐馬店市重點(diǎn)新聞網(wǎng)站駐馬店廣播電視臺官方網(wǎng)站

新聞投稿：qmtbjzx@163.com 新聞熱線：0396-2620023 通訊地址：河南省駐馬店市驛城區(qū)通達(dá)路17號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號：41120181703

廣播機(jī)構(gòu)播出許可證第2316018號

互聯(lián)網(wǎng)視聽節(jié)目服務(wù)（AVSP）豫備 2016001號

豫ICP備 11014119號-1 豫公網(wǎng)安備 41170202000092號

駐馬店廣視網(wǎng)版權(quán)所有未經(jīng)書面授權(quán)不得復(fù)制或建立鏡像

中國互聯(lián)網(wǎng)
舉報中心

河南互聯(lián)網(wǎng)
舉報中心

網(wǎng)絡(luò)110
報警服務(wù)

12321網(wǎng)絡(luò)
舉報中心

掃黃打非
網(wǎng)上舉報

政務(wù)和公益機(jī)構(gòu)域名注冊管理中心