99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

該輪到梁文鋒出手了

0
分享至



大模型扎堆更新,AI大戰風暴將至

最近這段時間,大模型領域又出現了爆發式更新。

各大科技巨頭紛紛亮出自己的王牌,大模型的更新如同雨后春筍般涌現,一場關于智能、效率和成本的較量即將拉開帷幕。

百度在上周的Create 2025大會上可謂是動作頻頻,風頭無兩。

百度創始人李彥宏高調宣布開源文心4.5系列,并毫不避諱地直指DeepSeek“慢又貴”。在他的介紹下,百度的新模型在性能和成本上才是真正實現了質的飛躍。


圖源:微博

事實上,在過去的一個月中,百度已經連續發布了多款大模型,例如文心大模型4.5 Turbo、深度思考模型X1 Turbo……

其中,文心4.5 Turbo模型在多模態基準測試成績上已經追平了DeepSeek,并且還在API調用價格方面做到了DeepSeek的40%,詳細的介紹可以去看上一篇《李彥宏炮轟DeepSeek,百度AI才是未來》。


圖源:小紅書

而就在今天凌晨,阿里巴巴緊隨其后,發布了新一代通義千問模型Qwen3

阿里云方面宣稱,Qwen3是國內首個“混合推理模型”,將“快思考”與“慢思考”集成進同一個模型,參數量僅為DeepSeek-R1的三分之一,但性能卻全面超越了R1以及OpenAI的o1等全球頂尖模型。這一消息無疑再次讓科技圈為之震動。

據官方介紹,Qwen3采用了混合專家(MoE)架構,總參數量達到235B,但激活僅需22B,預訓練數據量高達36T。

通過多輪強化學習,Qwen3將非思考模式無縫整合到思考模型中,實現了簡單需求的低算力“秒回”和復雜問題的多步驟“深度思考”。

這種“推理/非推理”二合一的設計,不僅提升了模型的智能水平,還大幅降低了算力資源消耗。


圖源:觀察者網

并且在性能方面,Qwen3在推理指令遵循工具調用多語言能力等多個維度都創下了新的紀錄。

例如,在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新了開源紀錄;在代碼能力測試中,Qwen3也表現不俗,突破了70分大關……

此外,如前文所說,Qwen3的部署成本極低,僅需4張H20顯卡即可部署滿血版,顯存占用僅為性能相近模型的三分之一。

阿里云還提供了豐富的模型版本,從30B到235B的MoE模型,再到0.6B到32B的密集模型,每款模型都實現了同尺寸開源模型的最佳性能。


圖源:觀察者網

與此同時,OpenAI也在悄然發力。

近日,OpenAI又一次更新了GPT-4o模型,其CEO奧特曼親自介紹,更新后的GPT-4o在智力個性方面有了顯著提升。

更新后的模型不僅優化了記憶保存時間,還增強了在STEM領域的問題解決能力。新GPT-4o還在響應方式上進行了改進,能夠更主動地引導對話,輸出更有效的結果。


圖源:X平臺

另一方面,根據數據顯示,目前GPT-4o在LMArena排行榜上已經上升至第二名,而DeepSeek上一次更新的V3新模型,已經下滑至第7名。


圖源:X平臺

種種背景的加持下,許多從業者的目光已經不自覺地聚焦在了一個人身上——梁文鋒

作為DeepSeek的創始人,梁文鋒在過去的一年中憑借多款模型在全球AI市場中一鳴驚人。然而,隨著國內外科技巨頭的相繼發力,圈內外都在期待梁文鋒的下一次出手,期待DeepSeek又將會帶來一個怎樣“驚天動地”的更新。

從目前的消息來看,梁文鋒應該不會讓大家失望。



“舊世界分崩離析,新時代正在光速到來”

在AI領域,梁文鋒的名字已經成為了一個傳奇。

2025年開年,DeepSeek“燃爆”了整個AI圈,其發布的R1模型憑借超低的訓練成本和卓越的性能,迅速在全球范圍內引起了轟動。

而迄今為止,距離R1模型正式發布已經過去了整整99天,馬上就要超百日。這99天,對于DeepSeek來說,是輝煌的起點,也是新的挑戰的預熱。


圖源:中國企業家雜志

2025年1月20日,DeepSeek R1大模型正式發布。而在R1發布之前,DeepSeek團隊已經經歷了無數次的實驗和優化。梁文鋒和他的團隊深知,要在這個競爭激烈的AI市場中脫穎而出,必須要有獨特的優勢和創新的技術。

在招人過程中,梁文鋒的團隊展現了極高的標準和獨特的理念。梁文鋒對人才沒有標簽,不論學歷背景,不論過往業績,他只看這個人的個人能力和個人素質。

這種人才觀,讓DeepSeek的團隊成員不僅具備強大的技術能力,更有著對AI的熱情和創新精神。

梁文鋒曾經說過:“我們招人的原則是看能力,而不是看經驗。如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性與熱愛等更重要。”

此外,梁文鋒對AI和公司的思考,也貫穿了整個R1模型的研發過程。

他認為,語言大模型是通往通用人工智能(AGI)的關鍵路徑。因此,DeepSeek專注于基礎研究,而不是急于開展應用開發。

梁文鋒堅信,通過不斷優化和創新,語言大模型可以逐步實現類人的人工智能。這或許也是DeepSeek如今仍在語言類大模型這條路上走到黑的原因。

但無論怎樣,隨著時間的推移,距離DeepSeek上一次推理模型的更新時間越來越長,外界對R2模型的期待也越來越高。


圖源:微信

此前,DeepSeek曾表示R2模型會在今年年內推出,但否認了前段時間宣稱5月甚至4月底會上線的傳言。盡管如此,外界對R2的期待并未減少。

許多業內人士認為,R2模型將是DeepSeek的又一力作,有望在性能和功能上實現更大的突破。

據了解,DeepSeek公司目前對外界的各種傳言采取不予理睬的態度,更多的是專注于自己的研究當中。梁文鋒和他的團隊深知,只有通過不斷的技術創新和優化,才能在激烈的市場競爭中保持領先地位。

在DeepSeek的崛起過程中,OpenAI一直是其主要競爭對手之一。

然而,國外多家媒體近期卻紛紛表示,OpenAI給梁文鋒的壓力還不夠,所以梁文鋒才能一直高枕無憂地做自己的事,而不用考慮過多的去對外宣傳自己的新模型。

他們認為,OpenAI在面對DeepSeek的快速崛起時,似乎顯得有些力不從心,這種感覺美國的AI公司此前幾乎從未有過。

不過,OpenAI并未如他們口中所說的那么不堪,可能正應了那句話“瞧不起的往往是自家人”

實際上,OpenAI近期只是換了打法,更專注于DeepSeek從未涉及的文生圖領域。

目前,OpenAI的GPT-4模型在文生圖領域可謂是一馬當先,其能力也得到了國外眾多用戶的驗證,并且還能駕馭格式各樣的風格。


圖源:ChatGPT生成圖片

隨著ChatGPT帶來更多的震撼,美國硅谷已經出現一些“文生圖和文生視頻領域將是未來AI發展的新方向”類似的聲音。

因此,外界同樣在期望DeepSeek文生圖、文生視頻大模型的出現。但這個愿望可能不太容易被實現。

梁文鋒曾經表示:“我們不會過早設計基于模型的一些應用,會專注在大模型上。從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。”

如今,擺在梁文鋒面前的現實是,美國政府正在限制英偉達H20芯片等高端芯片向中國出口,而這正是絕大部分AI公司發展的“地基”。

此外,伴隨著關稅政策不斷變化,貿易全球化的大勢正在遭受美國單方面的削弱,這也很可能增加DeepSeek團隊的研發成本。

因此,在重重壓力的考驗下,聚光燈下的梁文鋒能否帶領團隊沖破枷鎖,讓中國AI再次對世界發出震耳欲聾的咆哮,成為了國內外不少人心中的掛念。

作者 | 劉峰

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
重慶談判時,張治中宴請毛主席,席間張的一句話,讓江青終生難忘

重慶談判時,張治中宴請毛主席,席間張的一句話,讓江青終生難忘

z千年歷史老號
2025-07-23 19:22:21
蔡依林回應與彭于晏復合6年

蔡依林回應與彭于晏復合6年

大象新聞
2025-07-23 19:08:27
75歲港星宣布征婚,自曝37歲兒子內地求學失敗,回家躺平需要他養

75歲港星宣布征婚,自曝37歲兒子內地求學失敗,回家躺平需要他養

探源歷史
2025-07-21 07:29:49
印企倒賣稀土給美國軍火商,被中國抓個正著,莫迪還有臉陰陽中國

印企倒賣稀土給美國軍火商,被中國抓個正著,莫迪還有臉陰陽中國

boss外傳
2025-07-19 13:45:03
對話周鴻祎:DeepSeek流量確實在下降,他們就沒花心思做,梁文鋒是有夢想的人

對話周鴻祎:DeepSeek流量確實在下降,他們就沒花心思做,梁文鋒是有夢想的人

搜狐科技
2025-07-23 20:04:50
沖著王傳君去看《她的生存之道》,卻被王菲女兒嚇到,不美體態差

沖著王傳君去看《她的生存之道》,卻被王菲女兒嚇到,不美體態差

一娛三分地
2025-07-22 16:45:24
斯盧茨基:點球大戰有兩次機會能終結比賽 現在還沉浸在情緒當中

斯盧茨基:點球大戰有兩次機會能終結比賽 現在還沉浸在情緒當中

直播吧
2025-07-23 23:01:28
朱珠和天仙之間,不可說的瓜

朱珠和天仙之間,不可說的瓜

熱鬧吃瓜大姐
2025-07-22 19:54:21
程瀟不再隱瞞!曾確診精神疾病,為梁朝偉日本產子傳聞早真相大白

程瀟不再隱瞞!曾確診精神疾病,為梁朝偉日本產子傳聞早真相大白

情感大頭說說
2025-07-24 03:49:12
斯諾克冷門不斷!3冠軍陪跑,6冠王157天后再進決賽,90后破荒?

斯諾克冷門不斷!3冠軍陪跑,6冠王157天后再進決賽,90后破荒?

劉姚堯的文字城堡
2025-07-24 02:49:37
瘋狂作死!法媒:中國不該建雅魯藏布江電站,歐盟對華劃2條紅線

瘋狂作死!法媒:中國不該建雅魯藏布江電站,歐盟對華劃2條紅線

智慧生活筆記
2025-07-24 00:04:14
丁字褲那根帶子,聞起來到底有多臭?

丁字褲那根帶子,聞起來到底有多臭?

beebee
2025-02-20 11:20:25
沉默24小時,奧巴馬開始上場,特朗普圍魏救趙,美國一場暗戰開打

沉默24小時,奧巴馬開始上場,特朗普圍魏救趙,美國一場暗戰開打

小陸搞笑日常
2025-07-24 01:49:52
湖南兩高中生騎電動兩輪車撞圍墻雙雙身亡,家屬稱系改裝車輛,最高時速達100多公里,警方回應

湖南兩高中生騎電動兩輪車撞圍墻雙雙身亡,家屬稱系改裝車輛,最高時速達100多公里,警方回應

FM93浙江交通之聲
2025-07-23 08:46:10
娃哈哈老員工爆料:宗馥莉與杜建英都不算太厲害,真正厲的還是她

娃哈哈老員工爆料:宗馥莉與杜建英都不算太厲害,真正厲的還是她

南南說娛
2025-07-16 15:10:38
央視曝光多種“有毒”食品!毒性比砒霜高68倍,很多人家里都有

央視曝光多種“有毒”食品!毒性比砒霜高68倍,很多人家里都有

米果說識
2025-07-22 19:43:36
演員關山:與女兒28年斷絕來往,女兒關之琳為其準備400萬墓地

演員關山:與女兒28年斷絕來往,女兒關之琳為其準備400萬墓地

芳芳歷史燴
2025-07-23 17:49:39
中國香港足總會長確認:C羅只要不是突然受傷都會來港 他比較nice

中國香港足總會長確認:C羅只要不是突然受傷都會來港 他比較nice

直播吧
2025-07-23 01:00:11
加納喬在拉什福德評論區留言:干就完了

加納喬在拉什福德評論區留言:干就完了

懂球帝
2025-07-24 02:42:15
高速上兒子一直說后備箱有聲音,在服務區停車后,全家被抓進警局

高速上兒子一直說后備箱有聲音,在服務區停車后,全家被抓進警局

蕭竹輕語
2025-07-18 19:07:01
2025-07-24 04:27:00
科技頭版Pro incentive-icons
科技頭版Pro
一起見證改變世界的力量
411文章數 146關注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

游戲
房產
健康
教育
時尚

《光環無限》美術組曾用辭職"逼宮":要求用虛幻引擎

房產要聞

海南自由貿易港全島封關,2025年12月18日正式啟動!

呼吸科專家破解呼吸道九大謠言!

教育要聞

撿漏王誕生!黑龍江一考生389分上211鄭州大學,讓人羨慕

搶戲《醬園弄》、尬演《長安荔枝》,雷佳音的舒適圈正在反噬

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 随州市| 西乌| 民丰县| 瓮安县| 西华县| 肇源县| 肇州县| 双城市| 霍山县| 江城| 页游| 西宁市| 日土县| 肇东市| 台安县| 阿尔山市| 伊金霍洛旗| 恭城| 洛川县| 砚山县| 姚安县| 衡东县| 建湖县| 拉孜县| 连平县| 鹤壁市| 扎鲁特旗| 嘉义市| 东兰县| 将乐县| 秦皇岛市| 视频| 梁平县| 常山县| 托里县| 南召县| 都兰县| 舞钢市| 丰台区| 丹江口市| 报价|