訊飛星火深度推理模型 X1 發(fā)布,中文數(shù)學(xué)能力國內(nèi)第一
【ZiDongHua之“推好新品榜”收錄關(guān)鍵詞:訊飛星火 科大訊飛 智能翻譯】
國產(chǎn)算力下的AI“學(xué)霸”!訊飛星火深度推理模型X1發(fā)布,中文數(shù)學(xué)能力國內(nèi)第一
整理|鄭麗媛
出品|CSDN(ID:CSDNnews)
如果科技界也有春晚,那科大訊飛今天的發(fā)布會無疑是其精心準備的第一個“王炸”節(jié)目——在短短不到40分鐘的時間里,科大訊飛一連放出三大重磅消息:
●發(fā)布了當前全國產(chǎn)算力平臺上唯一的深度推理大模型「訊飛星火X1」;
●宣布訊飛星火4.0 Turbo的底座能力再次升級,首發(fā)混域知識搜索技術(shù);
●推出了業(yè)界首個具備端到端語音到語音同傳能力的大模型「星火語音同傳大模型」。
那么接下來,就讓我們一起來看看:這場發(fā)布會,又將哪些原本遙不可及的AI設(shè)想變成了現(xiàn)實?
訊飛星火X1,AI界的“學(xué)霸擔當”
首先登場的訊飛星火X1,如開頭所說,它是當前全國產(chǎn)算力平臺上唯一的深度推理大模型。

事實上,國產(chǎn)算力目前在單卡、集群生態(tài)上和國際領(lǐng)先水平還有一定距離。在這種情況下,想要訓(xùn)練出和像OpenAI這種國際領(lǐng)先的模型來“扳手腕”的深度推理模型,需解決不少訓(xùn)練難點:
?。?)訓(xùn)練推理涉及多個模型且需要強交互;
(2)跨任務(wù)傳輸數(shù)據(jù)及模型權(quán)重;
(3)訓(xùn)推任務(wù)類型由在線實時響應(yīng)變?yōu)殡x線高吞吐。
為此,科大訊飛聯(lián)手華為,共同攻克了全國產(chǎn)算力下推理模型訓(xùn)練的重重難關(guān),成功推出了「訊飛星火X1」——這款具有里程碑意義的大模型。
不同于其他快速給出答案的通用模型,訊飛星火X1具備三個典型特點:化繁為簡,將復(fù)雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否的優(yōu)質(zhì)反饋信息進行強化訓(xùn)練?;谝陨咸攸c,訊飛星火X1可以模擬人類的“慢思考”,通過分步拆解復(fù)雜問題、自我探索驗證以及反饋強化訓(xùn)練,為用戶提供更加貼近人類思維的解題思路。
在發(fā)布會的演示中,無論是高考難題還是奧數(shù)競賽,訊飛星火X1都能一一破解,不僅答案精準,解題思路和步驟更是條理清晰,幾乎把人類的“慢思考”模式完美復(fù)刻。據(jù)悉,訊飛星火X1在近期參加的小初高(含競賽)、大學(xué)(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,多項指標都拿到了國內(nèi)第一。

當然,訊飛星火X1也不只是活躍于各項大模型競賽中,它目前已經(jīng)在教育、醫(yī)療等真實場景中實現(xiàn)了應(yīng)用落地。
●在教育領(lǐng)域,訊飛星火X1化身學(xué)生和家長的智能教師助手,助力全國百個試點區(qū)域的老師們打造上萬個優(yōu)秀案例,能幫助老師們進行一題多解、教學(xué)知識關(guān)聯(lián),還能拓展學(xué)生的高階思維;
●在醫(yī)療領(lǐng)域,訊飛星火X1也大放異彩。它的模型策略已經(jīng)取得了初步驗證成效,專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控的準確率都高達90%,簡直是醫(yī)生們的“得力助手”,讓診斷更加準確、高效。
此外科大訊飛還透露,將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領(lǐng)先。
對標GPT-4o,訊飛星火4.0 Turbo全面升級
除了「訊飛星火X1」,此次發(fā)布會上訊飛星火4.0 Turbo的底座能力也迎來了全面升級。
回顧2024年,訊飛星火在大模型中標數(shù)量和中標金額上取得“雙第一”,在能源、金融、汽車、運營商等行業(yè)與客戶共同打磨了近百個智能體應(yīng)用,行業(yè)能力全面提升。而這次升級,訊飛星火4.0 Turbo的七大核心能力全面提升,對標OpenAI最新版的GPT-4o,專治行業(yè)、企業(yè)的各種痛點。

以數(shù)學(xué)能力為例,有了訊飛星火X1的高質(zhì)量合成數(shù)據(jù)加持,訊飛星火4.0 Turbo的數(shù)學(xué)能力提升了10.5%。由此能夠在在數(shù)學(xué)教學(xué)、金融分析以及科研推演等領(lǐng)域更好地幫助用戶。
除了強大的數(shù)學(xué)能力,訊飛星火4.0 Turbo的圖文識別能力也大有長進,通用文檔版面分析、文字識別的準確率相對提升了40%,復(fù)雜表格結(jié)構(gòu)、潦草手寫文字等方面的準確率相對提升了60%,大幅提升了高價值數(shù)據(jù)的獲取能力。
訊飛星火4.0 Turbo還帶來了長文本處理能力的大幅提升,而全新的句子級溯源功能,則讓用戶在搜索信息時更加放心,使得知識回復(fù)的錯誤率降低了40%,顯著緩解了問答搜索服務(wù)中因大模型幻覺而需要反復(fù)溯源確認的應(yīng)用落地難題。
更值得一提的是,訊飛星火還推出了行業(yè)首發(fā)的混域知識搜索技術(shù)。具體來說,該技術(shù)能對實現(xiàn)對個人知識、企業(yè)知識、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索,解決了用戶在不同知識領(lǐng)域之間綜合查詢的需求,一次提問即可獲得全面的答案。
正是這種全方位的能力提升,使得訊飛星火成為了真正“最懂行業(yè)的大模型”。
僅5秒時延,星火語音同傳大模型達到人類專家譯員水平
最后,科大訊飛還在智能翻譯領(lǐng)域?qū)崿F(xiàn)了重大突破:發(fā)布了國內(nèi)首個具備端到端語音同傳能力的大模型——星火語音同傳大模型:無論是日常對話、商務(wù)交流,還是行業(yè)翻譯等國際交流場景,它都能輕松應(yīng)對,最快實現(xiàn)僅5秒的同傳時延,基本達到了人類專家譯員的水平。
實際上,正如上海外國語大學(xué)高翻學(xué)院院長張愛玲所說,當前大多數(shù)的機器翻譯交傳技術(shù),很難實現(xiàn)端到端語音同傳。大體上來說,同傳的評價維度主要圍繞以下四個方面:
●內(nèi)容完整度:源語發(fā)言通常邏輯復(fù)雜、層層嵌套,而同傳則要求鎖定帽子信息,實現(xiàn)完整忠實地傳遞。
●信息準確度:無需多言,這就是同傳的靈魂核心。
●語言質(zhì)量:要求遵循規(guī)范,用詞精準,同時表達習慣需與目標語言契合。
●溝通效果:其中,同傳時延是影響溝通效果和聽眾感受的最重要指標之一,因此要求跟上源語發(fā)言者節(jié)奏,確保信息傳遞的及時性和連貫性。
針對以上維度,星火語音同傳大模型通過模仿人類同傳譯員的思維鏈路訓(xùn)練,實時意群理解、上下文精準選詞、碎片化信息重組樣樣精通,在處理復(fù)雜句式和語境時也毫無壓力,能夠迅速準確地傳達原意。
科大訊飛表示:“技術(shù)測試結(jié)果顯示,即便將訊飛的語音同傳技術(shù)和國外最優(yōu)競品的交傳技術(shù)對比,訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上都處于領(lǐng)先水平。”
那么以上,就是此次科大訊飛發(fā)布會的重點內(nèi)容,也讓我們看到了國產(chǎn)AI在深度推理、行業(yè)應(yīng)用、智能翻譯等多個領(lǐng)域的強大實力和無限潛力。
相信未來,國產(chǎn)AI的舞臺必將更加精彩,讓我們拭目以待!
我要收藏
點個贊吧
轉(zhuǎn)發(fā)分享
咨詢詳情:如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請加微信:ZiDongHuaX 。
微信聯(lián)盟:科大訊飛微信群、智能翻譯微信群,各細分行業(yè)微信群:點擊這里進入。
鴻達安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 查看各品牌在細分領(lǐng)域的定位宣傳語
微信聯(lián)盟:科大訊飛微信群、智能翻譯微信群,各細分行業(yè)微信群:點擊這里進入。
鴻達安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 查看各品牌在細分領(lǐng)域的定位宣傳語


評論排行