當前位置: CNMO > 新聞 > 新聞 > 正文

隱私與體驗雙優(yōu) 榮耀端側(cè)AI語音技術(shù)憑創(chuàng)新成果入選INTERSPEECH

CNMO 【廠商稿】 作者:榮耀 2025-08-22 15:29
評論(0
分享

  8月17-21日,國際音頻領(lǐng)域頂級會議INTERSPEECH在荷蘭鹿特丹舉辦。榮耀聯(lián)合上海交通大學完成的兩篇聚焦端側(cè)多語種任務(wù)的研究成果成功入選INTERSPEECH2025錄用論文,并受邀在會議上作技術(shù)發(fā)表。作為全球語音科學與技術(shù)領(lǐng)域最具權(quán)威性的學術(shù)會議之一,INTERSPEECH的認可體現(xiàn)了榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的持續(xù)努力與技術(shù)積累,這表明榮耀在全球化的AI技術(shù)交流中,取得了一定進展。在阿爾法戰(zhàn)略的指引下,榮耀于AI領(lǐng)域持續(xù)深耕,此次取得的成果,是榮耀技術(shù)探索道路上的一個重要里程碑,標志著榮耀在AI領(lǐng)域的實踐與理解邁上了一個新臺階。

隱私與體驗雙優(yōu) 榮耀端側(cè)AI語音技術(shù)憑創(chuàng)新成果入選INTERSPEECH

雙論文入選國際頂會,端側(cè)AI語音技術(shù)獲權(quán)威學術(shù)認可

  INTERSPEECH作為國際音頻領(lǐng)域頂級會議,其收錄論文代表著全球語音技術(shù)研究的最前沿方向。榮耀的兩篇論文成功入選,聚焦的正是當前端側(cè)AI語音技術(shù)的核心難題——如何在移動設(shè)備有限的算力與存儲資源下,實現(xiàn)媲美云端的多語種實時語音識別與通話翻譯體驗。

隱私與體驗雙優(yōu) 榮耀端側(cè)AI語音技術(shù)憑創(chuàng)新成果入選INTERSPEECH

 

(圖:榮耀兩位AI專家在荷蘭鹿特丹INTERSPEECH學術(shù)交流現(xiàn)場作技術(shù)發(fā)表)
(圖:榮耀兩位AI專家在荷蘭鹿特丹INTERSPEECH學術(shù)交流現(xiàn)場作技術(shù)發(fā)表)

  據(jù)了解,榮耀研發(fā)團隊與上海交通大學的聯(lián)合攻關(guān),針對“端側(cè)實現(xiàn)高準確率、高響應(yīng)速度翻譯體驗”的技術(shù)痛點提出獨創(chuàng)性解決方案,相關(guān)技術(shù)已成功轉(zhuǎn)化為可落地的端側(cè)多語種通話翻譯功能,實現(xiàn)了從學術(shù)研究到產(chǎn)業(yè)應(yīng)用的無縫銜接。

  榮耀MagicOS副總裁孫建發(fā)表示:“榮耀始終堅信,AI 技術(shù)的終極價值在于更好地服務(wù)用戶,而端側(cè)AI 是實現(xiàn)隱私安全與極致體驗平衡的最優(yōu)路徑。此次研究成果入選 INTERSPEECH,是對榮耀技術(shù)創(chuàng)新的鼓勵,同樣印證了‘從用戶需求出發(fā)’的研發(fā)理念,讓每位用戶在無網(wǎng)絡(luò)環(huán)境下也能享受精準、實時的多語種翻譯,這才是端側(cè) AI 真正的普惠價值?!?/p>

突破行業(yè)兩難瓶頸,構(gòu)建全球首個端側(cè)語音大模型

  在移動互聯(lián)網(wǎng)時代,語音已成為人機交互的核心入口,而端側(cè)語音技術(shù)的突破直接關(guān)系到用戶體驗。長期以來,行業(yè)面臨著兩難困境:依賴云端處理的語音翻譯方案存在隱私泄露風險,而傳統(tǒng)端側(cè)方案又受限于設(shè)備算力,難以實現(xiàn)實時性與準確性的兼顧。

  榮耀的研究項目啟動之初就確立了“純端側(cè)實現(xiàn)媲美云端的通話翻譯體驗”的目標,這意味著研發(fā)團隊必須在算力、存儲、功耗多重約束下,解決兩大核心挑戰(zhàn):一是如何讓AI在極短時間內(nèi)精準識詞,實現(xiàn)低延遲與高準確率的平衡;二是如何在有限資源下保證翻譯響應(yīng)的流暢性與實時性。

  經(jīng)過多次技術(shù)迭代,榮耀團隊創(chuàng)造性地提出兩大技術(shù)方案:其一,通過創(chuàng)新的注意力機制與決策策略結(jié)合,讓端側(cè)AI實現(xiàn)流式語音識別能力,無需等待用戶說完整句話即可啟動識別與翻譯,徹底打破傳統(tǒng)方案的延遲瓶頸,真正做到“邊說邊識別”;其二,提出全新的投機采樣推理模塊,通過直接與主模型的“大腦”協(xié)同工作,即時讀取并利用主模型已經(jīng)形成的“記憶”和“思路”來高效預(yù)測接下來可能出現(xiàn)的詞,在不降低準確性的前提下實現(xiàn)推理速度的顯著提升。

  這兩項技術(shù)方案不僅通過了權(quán)威學術(shù)評審,同時在實測中展現(xiàn)出強大性能:將傳統(tǒng)方案3-4GB的內(nèi)存占用壓縮至800MB,節(jié)省75%存儲空間;翻譯準確率提升16%,推理速度提升38%,真正實現(xiàn)了“小而美”的突破。

  依托這些技術(shù)創(chuàng)新,榮耀成功構(gòu)建起全球首個端側(cè)語音大模型,將中、英、德、法、西、意等6個語種包嵌入僅0.8B參數(shù)量的模型中,用戶無需額外下載語音包即可實現(xiàn)多語種互譯,且支持離線使用——這意味著即便在無網(wǎng)絡(luò)環(huán)境下,語音數(shù)據(jù)也能在本地完成處理,從源頭保障隱私安全。

阿爾法戰(zhàn)略持續(xù)落地,榮耀AI技術(shù)矩陣構(gòu)建全生態(tài)體系

  榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的突破,并非偶然,而是品牌長期深耕AI戰(zhàn)略的必然結(jié)果。自阿爾法戰(zhàn)略公布以來,榮耀在AI技術(shù)領(lǐng)域的投入始終保持“持續(xù)性”與“前瞻性”,從AI體驗落地到技術(shù)開源,再到端側(cè)語音大模型突破,形成了清晰的戰(zhàn)略演進路徑。

  此前,在世界人工智能大會(WAIC)期間,榮耀正式發(fā)布自研多模態(tài)感知大模型——MagicGUI大模型。作為榮耀推出的首個GUI開源大模型,MagicGUI以7B(70億)參數(shù)規(guī)模,支撐底層AI智能體的多模態(tài)感知與自動執(zhí)行規(guī)劃能力,比肩SOTA模型達到行業(yè)領(lǐng)先水平。

  榮耀開源的MagicGUI大模型意圖識別技術(shù),已在人機交互領(lǐng)域樹立新標桿,通過精準理解用戶指令背后的真實需求,讓智能設(shè)備從“被動響應(yīng)”轉(zhuǎn)向“主動服務(wù)”。而此次端側(cè)語音大模型的落地,則進一步完善了榮耀AI技術(shù)矩陣,構(gòu)建全面的AI生態(tài)體系,為榮耀MagicOS用戶帶來更優(yōu)質(zhì)的AI體驗。

技術(shù)落地賦能產(chǎn)品與行業(yè),榮耀AI 領(lǐng)導(dǎo)力走向全球

  隨著兩篇論文在INTERSPEECH會議上正式發(fā)表,榮耀端側(cè)AI語音技術(shù)迎來廣泛的行業(yè)關(guān)注。據(jù)透露,相關(guān)技術(shù)已率先應(yīng)用于榮耀最新旗艦產(chǎn)品,未來還將擴展至更多語種與場景,進一步提升全球化服務(wù)能力。

  從更深層次來看,此次技術(shù)突破不僅是榮耀的個體成就,也代表著中國科技企業(yè)在全球AI競爭中的崛起。在語音識別等領(lǐng)域,榮耀通過獨創(chuàng)技術(shù)創(chuàng)新,彰顯了AI科技的硬實力。INTERSPEECH的認可,無疑將為榮耀打開更廣闊的國際合作空間,推動榮耀AI技術(shù)標準與方案走向世界。

  對于消費者而言,榮耀在AI領(lǐng)域的持續(xù)突破意味著更優(yōu)質(zhì)、更安全、更智能的產(chǎn)品體驗。從MagicGUI大模型的意圖識別與自動化執(zhí)行,到端側(cè)語音大模型的離線、實時翻譯,榮耀正用技術(shù)創(chuàng)新重新定義智能終端的核心價值——不再是硬件參數(shù)的堆砌,而是以AI為核心的“感知能力”“理解能力”與“服務(wù)能力”的綜合提升。

  從阿爾法戰(zhàn)略的藍圖繪就,到MagicGUI大模型的開源共享,再到端側(cè)語音大模型的全球首發(fā),榮耀用持續(xù)不斷的技術(shù)突破證明:真正的AI領(lǐng)導(dǎo)力,源于對用戶需求的深刻洞察,源于對技術(shù)創(chuàng)新的執(zhí)著追求,更源于構(gòu)建開放生態(tài)、推動行業(yè)進步的責任擔當。未來,隨著更多AI技術(shù)的落地,榮耀將為消費者帶來更智能的生活體驗,為中國科技在全球舞臺上贏得更多掌聲。

分享

加入收藏

網(wǎng)友評論 0條評論
用其他賬號登錄:
請稍后,數(shù)據(jù)加載中...
查看全部0條評論 >
潮機范兒

Copyright © 2007 - 北京沃德斯瑪特網(wǎng)絡(luò)科技有限責任公司.All rights reserved 發(fā)郵件給我們
京ICP證-070681號 京ICP備09081256號 京公網(wǎng)安備 11010502036320號