2025高考方才落下大幕,其間,AI大模型也迎來了一場“被動大考”。在這場比拼中,訊飛星火表現亮眼:據三方權威媒體評測顯示,訊飛星火X1在語文作文的綜合得分,位列主流大模型榜首;在英語作文盲評中,獲得第一;數學測評中,訊飛星火成為僅有的兩個整卷得分突破140分的大模型之一。
6月9日,科大訊飛成立26周年之際,董事長劉慶峰透露,星火X1升級版將于7月推出。
兩年前,AI大模型剛開始做高考數學題的時候,洋相百出,被調侃“強如大模型,不識一二三四五”。短短兩年,大模型在高考數學中已能輕松達到一個優秀學生的水平。為什么70B模型在高考中表現優秀?新民晚報記者了解到,科大訊飛在原有的技術優勢基礎上,提出了三大創新點:第一,國內首發基于快慢思考的統一模型訓練推理方法;第二,提出結合評語模型和細粒度反饋的強化學習技術;第三,研發國產平臺強化學習算法包,實現了全國產化算力深度推理模型訓練效率優化。
“我們要有一桶水,才能倒出一碗水。”劉慶峰表示,科大訊飛做教育不僅要讓AI會答題、能評分,更要實現因材施教、五育并舉。通過AI批改、推薦等個性化場景,讓每個孩子都能找到適合自己的學習路徑,并關注創造力、心理健康和全面發展。
在技術路線選擇上,劉慶峰表現出堅定態度。他坦言,相比使用英偉達等海外算力,基于國產算力開展大模型訓練和算法創新存在諸多挑戰,需要增加移植適配、性能調優、對比驗證等額外步驟和額外算力。“基于國產算力的所有新算法的研發會慢三個月。三個月,在今天這個你追我趕的時代,是不得了的差別。”他告訴記者,“訊飛要堅定不移地走自主可控之路!如果訊飛不付出,中國的算力支撐不了深度推理模型的訓練!基于國產算力的新算法研發,會慢一些,但不會矮!”
正在舉行的大阪世博會也有科大訊飛的身影——作為中國館唯一大模型展項,科大訊飛帶來的支持中、日、英三語實時交互的“AI孫悟空”成為世博會上的“科技網紅”。開館50多天,大模型互動4萬+次,每分鐘至少完成1次講解+交互。
劉慶峰透露,在高考和世博會等場合表現不俗的星火X1,將在7月發布升級版。
“2025還有一個時代特征,是全民AI的開啟之年。”數據顯示,截至2024年底,中國生成式人工智能用戶已達2.49億,占全國人口17.7%,“科大訊飛也要搶占AI時代的根紅利,做到自主可控、通專結合、軟硬一體、行業深耕,探索大模型和具身智能的天花板,做好底座大模型和專業模型,真正推進時代進步。”
創業26年,從語音合成、語音識別到機器翻譯、再到認知智能和大模型,劉慶峰坦言科大訊飛走著“彎曲的直線”,“事物發展規律是波浪式鋸齒式前進的,沒有一蹴而就的成功,26年如一日堅持人工智能主賽道,源于熱愛的初心。”
原標題:《高考數學140+,英語作文盲評第一……這款大模型7月將迎升級》
欄目編輯:王蕾 圖片來源:采訪對象供圖
來源:作者:新民晚報 郜陽
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.