對著智能鼠標(biāo)用藏語提問,大模型識別語音,并以藏語思考作答。第二十八屆中國北京國際科技產(chǎn)業(yè)博覽會(簡稱北京科博會)8日至10日舉行,這是記者在現(xiàn)場看到的一幕。
“通用大模型大多基于漢語、英語等語言訓(xùn)練,在藏語理解、生成等方面使用體驗(yàn)不夠好,”從事藏語大模型研發(fā)的西藏大學(xué)博士研究生才讓東知說,“通用大模型給出的回答經(jīng)常缺乏藏語的自然語感與原生韻味,有明顯的人工轉(zhuǎn)碼痕跡?!?/p>
藏語大模型使用藏語語音語料訓(xùn)練、以藏語思維思考,能彌補(bǔ)這一缺憾。在北京科博會現(xiàn)場展示的藏語大模型已經(jīng)可以完成很多日常任務(wù):“幫我寫一份買賣牦牛的合同”“寫一首贊美父母的詩歌”“長期吃素的人應(yīng)該吃什么補(bǔ)充營養(yǎng)”……
藏語大模型“DeepZang”的產(chǎn)品部負(fù)責(zé)人多吉美久介紹,“DeepZang”收集藏漢平行精準(zhǔn)語料近7000萬條、采集超過30500小時藏語語音語料,涵蓋衛(wèi)藏、康巴、安多三大藏語方言區(qū)。
多吉美久說,不同藏語方言地區(qū)之間文字相通,但口語差異較大。用各大藏語方言區(qū)語音語料訓(xùn)練AI,AI就能實(shí)現(xiàn)藏語的跨方言交流。在國家知識產(chǎn)權(quán)局網(wǎng)站上,“DeepZang”開發(fā)方——西藏覺羅數(shù)字產(chǎn)業(yè)管理有限公司申請的一項(xiàng)專利顯示,該公司的一項(xiàng)技術(shù)通過將聲紋識別與方言分類相結(jié)合,能有效解決方言差異導(dǎo)致的溝通困難問題。

5月8日,一名外國觀眾在北京科博會上用智能鼠標(biāo)體驗(yàn)藏語大模型。新華社發(fā)
在洛桑頓玉看來,良好的跨方言語音識別能力,能有效降低藏語大模型的使用門檻,“不需要有很高的藏語文字水平,通過說話就可以使用AI,這能幫助到更多人”。洛桑頓玉在西藏自治區(qū)山南市從事藏漢翻譯工作,他跟同事已經(jīng)習(xí)慣在工作中使用藏語大模型,“以前需要兩三個人分工合作,花40分鐘翻譯完的稿子,現(xiàn)在有了AI輔助,一個人20多分鐘就可以完成”。
覺羅數(shù)字提供的信息顯示,“DeepZang”目前擁有用戶30多萬人。其中,18至40歲青年用戶占比超過70%。“我們的用戶主要分布在西藏、青海、四川和甘肅等地,不少用戶生活在比較偏遠(yuǎn)的地方?!倍嗉谰谜f。
西藏已經(jīng)實(shí)現(xiàn)主電網(wǎng)覆蓋所有縣(區(qū)、市),所有鄉(xiāng)鎮(zhèn)、70%行政村通達(dá)5G網(wǎng)絡(luò)。有了電力和網(wǎng)絡(luò)的支撐,藏語AI能為更多藏語使用者提供幫助。
“從可用到好用,還有很長的路要走?!倍嗉谰谜f。一些用戶反饋,用“DeepZang”進(jìn)行幾輪問答后,軟件便提示“token余額不足”。這也是他們參展科博會的原因之一——尋求合作,以解決目前面臨的算力成本高、資金壓力大、商業(yè)閉環(huán)尚未形成等問題。
這是覺羅數(shù)字第一次參加科博會。在公司董事長旦增羅布看來,參加科博會能夠幫助公司更好地融入全國科技創(chuàng)新生態(tài)。
藏語大模型對藏語使用者和不懂藏語的人分別意味著什么?藏語AI對此作答:為藏語使用者提供新時代的新工具,搭建藏語與其他語言之間的橋梁。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。