訊飛星火深度推理模型 X1 發(fā)布，中文數(shù)學(xué)能力國內(nèi)第一

時間：2025-01-16 15:53:28 發(fā)布：tgy 來源：CSDN 第一對焦：訊飛星火

　　【ZiDongHua之“推好新品榜”收錄關(guān)鍵詞：訊飛星火科大訊飛智能翻譯】

　　國產(chǎn)算力下的AI“學(xué)霸”！訊飛星火深度推理模型X1發(fā)布，中文數(shù)學(xué)能力國內(nèi)第一

　　整理|鄭麗媛

　　出品|CSDN（ID：CSDNnews）

　　如果科技界也有春晚，那科大訊飛今天的發(fā)布會無疑是其精心準備的第一個“王炸”節(jié)目——在短短不到40分鐘的時間里，科大訊飛一連放出三大重磅消息：

　　●發(fā)布了當前全國產(chǎn)算力平臺上唯一的深度推理大模型「訊飛星火X1」；

　　●宣布訊飛星火4.0 Turbo的底座能力再次升級，首發(fā)混域知識搜索技術(shù)；

　　●推出了業(yè)界首個具備端到端語音到語音同傳能力的大模型「星火語音同傳大模型」。

　　那么接下來，就讓我們一起來看看：這場發(fā)布會，又將哪些原本遙不可及的AI設(shè)想變成了現(xiàn)實？

　　訊飛星火X1，AI界的“學(xué)霸擔當”

　　首先登場的訊飛星火X1，如開頭所說，它是當前全國產(chǎn)算力平臺上唯一的深度推理大模型。

　　事實上，國產(chǎn)算力目前在單卡、集群生態(tài)上和國際領(lǐng)先水平還有一定距離。在這種情況下，想要訓(xùn)練出和像OpenAI這種國際領(lǐng)先的模型來“扳手腕”的深度推理模型，需解決不少訓(xùn)練難點：

　?。?）訓(xùn)練推理涉及多個模型且需要強交互；

　　（2）跨任務(wù)傳輸數(shù)據(jù)及模型權(quán)重；

　　（3）訓(xùn)推任務(wù)類型由在線實時響應(yīng)變?yōu)殡x線高吞吐。

　　為此，科大訊飛聯(lián)手華為，共同攻克了全國產(chǎn)算力下推理模型訓(xùn)練的重重難關(guān)，成功推出了「訊飛星火X1」——這款具有里程碑意義的大模型。

　　不同于其他快速給出答案的通用模型，訊飛星火X1具備三個典型特點：化繁為簡，將復(fù)雜問題分步拆解簡化；進行自我探索和反思驗證；基于答案正確與否的優(yōu)質(zhì)反饋信息進行強化訓(xùn)練?；谝陨咸攸c，訊飛星火X1可以模擬人類的“慢思考”，通過分步拆解復(fù)雜問題、自我探索驗證以及反饋強化訓(xùn)練，為用戶提供更加貼近人類思維的解題思路。

　　在發(fā)布會的演示中，無論是高考難題還是奧數(shù)競賽，訊飛星火X1都能一一破解，不僅答案精準，解題思路和步驟更是條理清晰，幾乎把人類的“慢思考”模式完美復(fù)刻。據(jù)悉，訊飛星火X1在近期參加的小初高（含競賽）、大學(xué)（含競賽）、AIME、MATH 500等多項“考試”中成績十分亮眼，多項指標都拿到了國內(nèi)第一。

　　當然，訊飛星火X1也不只是活躍于各項大模型競賽中，它目前已經(jīng)在教育、醫(yī)療等真實場景中實現(xiàn)了應(yīng)用落地。

　　●在教育領(lǐng)域，訊飛星火X1化身學(xué)生和家長的智能教師助手，助力全國百個試點區(qū)域的老師們打造上萬個優(yōu)秀案例，能幫助老師們進行一題多解、教學(xué)知識關(guān)聯(lián)，還能拓展學(xué)生的高階思維；

　　●在醫(yī)療領(lǐng)域，訊飛星火X1也大放異彩。它的模型策略已經(jīng)取得了初步驗證成效，專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控的準確率都高達90%，簡直是醫(yī)生們的“得力助手”，讓診斷更加準確、高效。

　　此外科大訊飛還透露，將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版，確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領(lǐng)先。

　　對標GPT-4o，訊飛星火4.0 Turbo全面升級

　　除了「訊飛星火X1」，此次發(fā)布會上訊飛星火4.0 Turbo的底座能力也迎來了全面升級。

　　回顧2024年，訊飛星火在大模型中標數(shù)量和中標金額上取得“雙第一”，在能源、金融、汽車、運營商等行業(yè)與客戶共同打磨了近百個智能體應(yīng)用，行業(yè)能力全面提升。而這次升級，訊飛星火4.0 Turbo的七大核心能力全面提升，對標OpenAI最新版的GPT-4o，專治行業(yè)、企業(yè)的各種痛點。

　　以數(shù)學(xué)能力為例，有了訊飛星火X1的高質(zhì)量合成數(shù)據(jù)加持，訊飛星火4.0 Turbo的數(shù)學(xué)能力提升了10.5%。由此能夠在在數(shù)學(xué)教學(xué)、金融分析以及科研推演等領(lǐng)域更好地幫助用戶。

　　除了強大的數(shù)學(xué)能力，訊飛星火4.0 Turbo的圖文識別能力也大有長進，通用文檔版面分析、文字識別的準確率相對提升了40%，復(fù)雜表格結(jié)構(gòu)、潦草手寫文字等方面的準確率相對提升了60%，大幅提升了高價值數(shù)據(jù)的獲取能力。

　　訊飛星火4.0 Turbo還帶來了長文本處理能力的大幅提升，而全新的句子級溯源功能，則讓用戶在搜索信息時更加放心，使得知識回復(fù)的錯誤率降低了40%，顯著緩解了問答搜索服務(wù)中因大模型幻覺而需要反復(fù)溯源確認的應(yīng)用落地難題。

　　更值得一提的是，訊飛星火還推出了行業(yè)首發(fā)的混域知識搜索技術(shù)。具體來說，該技術(shù)能對實現(xiàn)對個人知識、企業(yè)知識、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索，解決了用戶在不同知識領(lǐng)域之間綜合查詢的需求，一次提問即可獲得全面的答案。

　　正是這種全方位的能力提升，使得訊飛星火成為了真正“最懂行業(yè)的大模型”。

　　僅5秒時延，星火語音同傳大模型達到人類專家譯員水平

　　最后，科大訊飛還在智能翻譯領(lǐng)域?qū)崿F(xiàn)了重大突破：發(fā)布了國內(nèi)首個具備端到端語音同傳能力的大模型——星火語音同傳大模型：無論是日常對話、商務(wù)交流，還是行業(yè)翻譯等國際交流場景，它都能輕松應(yīng)對，最快實現(xiàn)僅5秒的同傳時延，基本達到了人類專家譯員的水平。

　　實際上，正如上海外國語大學(xué)高翻學(xué)院院長張愛玲所說，當前大多數(shù)的機器翻譯交傳技術(shù)，很難實現(xiàn)端到端語音同傳。大體上來說，同傳的評價維度主要圍繞以下四個方面：

　　●內(nèi)容完整度：源語發(fā)言通常邏輯復(fù)雜、層層嵌套，而同傳則要求鎖定帽子信息，實現(xiàn)完整忠實地傳遞。

　　●信息準確度：無需多言，這就是同傳的靈魂核心。

　　●語言質(zhì)量：要求遵循規(guī)范，用詞精準，同時表達習慣需與目標語言契合。

　　●溝通效果：其中，同傳時延是影響溝通效果和聽眾感受的最重要指標之一，因此要求跟上源語發(fā)言者節(jié)奏，確保信息傳遞的及時性和連貫性。

　　針對以上維度，星火語音同傳大模型通過模仿人類同傳譯員的思維鏈路訓(xùn)練，實時意群理解、上下文精準選詞、碎片化信息重組樣樣精通，在處理復(fù)雜句式和語境時也毫無壓力，能夠迅速準確地傳達原意。

　　科大訊飛表示：“技術(shù)測試結(jié)果顯示，即便將訊飛的語音同傳技術(shù)和國外最優(yōu)競品的交傳技術(shù)對比，訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上都處于領(lǐng)先水平。”

　　那么以上，就是此次科大訊飛發(fā)布會的重點內(nèi)容，也讓我們看到了國產(chǎn)AI在深度推理、行業(yè)應(yīng)用、智能翻譯等多個領(lǐng)域的強大實力和無限潛力。

　　相信未來，國產(chǎn)AI的舞臺必將更加精彩，讓我們拭目以待！

我要收藏

點個贊吧

自動對焦：科大訊飛智能翻譯

咨詢詳情：如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情，請加微信：ZiDongHuaX 。

微信聯(lián)盟：科大訊飛微信群、智能翻譯微信群，各細分行業(yè)微信群：點擊這里進入。

鴻達安視：水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器　　　　　　查看各品牌在細分領(lǐng)域的定位宣傳語