99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

楊植麟摸著DeepSeek過河

0
分享至

文|鄧詠儀

編輯|蘇建勛

發布開源模型K2一周后,Kimi引起的全球熱潮還在繼續。

7月11日,月之暗面(Moonshot AI)開源了萬億參數的MoE模型Kimi K2。這是一個參數高達1T,激活參數32B的MoE模型,包括兩款開源模型版本Kimi-Base和Kimi-instruct。

K2是個“偏科”選手,擅長編程、智能體類的任務。在Kimi公布的測評結果中,Kimi K2在自主編程、工具調用和數學推理三個維度的表現上,都超過了同為開源模型的DeepSeek-V3和阿里Qwen3。


△圖源:Kimi

Hugging Face數據顯示,開源一周后,K2下載量累計超過10萬,還在快速攀升中。在大模型權威競技場LMSYS中,K2-Instruct已經沖到總榜第四,僅次于GPT-4o、Claude-3.5、Gemini-1.5-Pro。

馬斯克在推特上轉發了的OpenRouter趨勢數據顯示,K2的在一周內攀升至全球趨勢榜第二,僅次于Grok 4。


△圖源:Twitter

月之暗面這次沒有選擇大規模營銷,而是在用一種全新的方式開源。

K2發布后,Kimi的算法工程師、研究員,在推特、小紅書、知乎上積極分享K2的工作和技術,回復用戶疑問;Kimi的官方推特也在不間斷地刷屏,轉發社區里對K2的贊美和建議。

熱情的互動引來了更多的“自來水”。Hugging Face聯合創始人Thomas Wolf就對Kimi K2大加贊賞,表示開源模型正在挑戰最新的閉源權重模型。

發布熱鬧得像團建,與這家公司過去半年的沉默形成鮮明對比。

過去兩年,Kimi經歷了一場過山車般的起伏:幾乎是最后一個推出ChatBot助手Kimi,但是憑借著長文本和出圈的策劃一炮而紅,成為最先出圈的大模型應用產品。

但2025年,幾乎所有模型廠商,都被橫空出世的DeepSeek打得失語。追逐AGI,證明自己還有技術實力,變成了所有廠商要做的證明題。

曾經擁有夢幻開端的Kimi,在今年來了個猛轉彎:To C的Kimi應用停止投流,專心主攻模型。去年曾經試水的Ohai、Noisee等其他C端應用,以及Kimi在多模態上的嘗試也迅速暫停。這也讓它遭受的質疑更猛烈——是不是放棄了預訓練?停止投流后,To C應用放棄了嗎?

蟄伏半年,Kimi需要一場翻身仗。K2的發布,就是回歸AGI主線的一種宣言。

“又一個DeepSeek時刻”

K2發布,已經引起了全球開發者社區的震動。7月16日,著名的《Nature》雜志發文,表示K2的發布為“另一個DeepSeek時刻”,足見其贊美。

為什么K2的發布如此重要?簡單來說,因為K2把DeepSeek模式再走了一遍:主打高性能、低成本,而且真開源。最重要的是,端出了真的好東西。

K2是個性能強悍的模型。它很專注,目標清晰——就是為了智能體(Agentic AI)而生。

一位Kimi的算法工程師Justin Wong在博客里說:Kimi希望把人與AI的交互方式,從chat-first變成artifact-first,即交付一個具體的交付物(比如一個3D模型、一個表格),而非交付一段聊天上下文。

用大白話說,就是要真能干活,不只是純聊天了。

了解了這點,才能理解Kimi在模型訓練路線上的諸多選擇。

DeepSeek R1發布時,更多注重思考、推理能力,在發布后相當長一段時間才加入工具調用功能。而K2并沒有像DeepSeek R1那樣帶上推理模式(如展現思考過程),雖然也著重提升了風格化寫作能力,但并沒有過多強調。

K2最看重的還是Agentic(智能體)能力,把提升“自主使用工具、完成任務”的能力,放到最高優先級?!斑@在整個領域里是一個非常罕見的選擇?!币晃粡臉I者評論道。

更具體地說,K2把優化的重點放在了:根據聊天的上下文,調用外部的工具,要讓調用速度更快,完成任務的質量更高——比如瀏覽器、PPT、Excel、3D繪畫軟件等等。用戶也可以接入owl、Cline、RooCode 等 Agent/Coding 框架,來自主編程。

所以,在K2的使用案例中,你可以看到,直接輸入Prompt,不用怎么等K2“思考”,K2就迅速生成3D旋轉地球模型、生成PPT、生成晝夜循環的山川峽谷3D景觀、3D粒子星系、交易看盤等等。


△Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines... (創建一個 3D HTML 山脈場景,包含懸崖、河流和晝夜光照變化。支持拖動和縮放、動畫過渡、真實感漸變色,并可切換等高線顯示...) 來源:Kimi

把13萬行的原始數據丟給 Kimi K2,可以幫你分析遠程辦公比例對薪資的影響,分析顯著差異,自動生成統計圖表與回歸模型解讀等等,用統一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業圖表,整理成報告。


△來源:Kimi

K2的另一個核心貢獻在于,把模型的訓練和使用成本又拉到了一個地板價,同時還保持著接近Claude主流模型的性能,主打一個性價比高。

Kimi K2 API的定價是:每百萬輸入tokens 4元,每百萬輸出tokens 16元;直接和同樣主打編程的Claude 4 Sonnet(每百萬輸入3美元,每百萬輸出15美元)的API價格相比,整體成本可以下降超過75%。

別小看這75%,如今AI編程已經成為創業賽道的“明牌”,賽道里包括Cursor等頭部AI編程公司估值已經迅速起飛。截至2025年6月,Cursor的ARR(年度經常性收入)已突破5億美元大關,相較于4月中旬披露的3億美元,短短兩個月內飆升了60%。

開發者會實實在在用腳投票。K2一出,Hugging Face的下載量漲得飛快,K2很快就登上了OpenRouter的趨勢榜周第二,開發者頻頻吐槽為什么API還這么慢,用不上。

K2現在并不完美,輸出的結果還是會有不足之處,比如Token輸出比較啰嗦,代碼質量和頂尖的Claude相比還是有差距——但架不住它性價比高。很多博主的測試案例中,普通程序員寫一天代碼也就幾塊錢,大大降低了AI編程的算力使用門檻。

性價比高,也源于Kimi一些原創性的創新。

Kimi從訓練階段引入了新的優化器Muon,取代了原來主流的AdamW優化器,在不同Llama架構模型上,Muon的算力需求只有AdamW的52%。

優化器是大模型里的一個核心組件,決定著在訓練時的模型參數如何調整。優化器優化得越好,模型在同樣的硬件環境下跑得更快、更穩,換種角度說,也更節省了算力。

這可以說是一場技術冒險。Muon原本是一個比較前沿的優化器方向,甚至沒有發表正式論文,以前只在小型模型上訓練成功過。但Kimi選擇將Muon擴大到萬億參數去嘗試,并且解決了大規模訓練下的很多技術難點,讓Muon成為這次K2發布最受尊重的工作之一。

在公司門口放鋼琴、公司名字用傳奇搖滾專輯命名,這看起來是很朋克。但在巨大的市場壓力下,專注在一個方向,把一個新技術架構直接上到萬億參數去訓練,用真金白銀去試,還成功了。

這才是真的朋克。

六小龍沒有回頭路

從K2發布的細節看,DeepSeek在全球造成的影響仍在持續。

今年1月發布的DeepSeek R1是全球AI敘事的分水嶺。在那之前,國內無論是大廠,還是AI初創,大家都在卷AI應用,搶奪用戶和留存。

Kimi曾經在2024年做過一波激進投流,和字節的豆包對打。但投流、增長是在大廠舒適區里的事情,Kimi很快就顯得力不從心。2024年11月,豆包宣布MAU過億,在國內一時風頭無兩。

很快,這些成果都被DeepSeek R1迅速超越。

DeepSeek之后,無論是大廠還是初創,大家都形成共識:追求模型能力提升才是最重要的事。國內To C應用的戰場上,幾乎就剩下元寶、夸克和豆包在廝殺。

如今商業化已經是個有點遙遠,且不是最重要的問題了。面對在模型和應用上都在All in的大廠,留給大模型初創的路幾乎只有一條:開源,和攻克最難的問題。

前不久的36氪Waves大會上,真格基金合伙人戴雨森在談到Kimi與Minimax時曾說: “一年前,大家比投放、比用戶,比投放,其實是大廠的機會?,F在則回到技術前沿,回到強認知,我相信反而更適合以技術大牛為核心的創業團隊。 ”

六小龍們都做出了自己的選擇。DeepSeek R1的沖擊后,各家呈上的答卷,實則表明了一種路線的分野:Kimi已經有點像Anthropic,主打提升編程、智能體的能力;Minimax和階躍牢牢抓緊多模態;智譜則是走更本土、To B/To G的路線;百川選擇繼續做醫療模型;01早已宣布不再做超大基礎模型迭代,轉而專注在大模型落地上。

此前,Kimi在海外知名度有限,但K2的爆火已經帶來實在的回報:全球開發者圈子里開始關注起Kimi,有人開始研究CEO楊植麟的過往經歷。開發者們喜歡這個充滿朋克文化的團隊——Kimi團隊成員在小紅書、推特展示公司里以傳奇樂隊命名的會議室,也會在Twitter坦承“現在K2還不完美,infra還有很多不足,正在加班加點修復。”


△來源:Twitter

而更早之前,在Kimi專注提升模型能力,推出包括深度研究等產品后,其實也反哺到了產品上:Kimi的Web端數據從6月開始反彈,訪問量環比增長30%。

某種程度上,開源和朋克有著同樣的精神內核,自由、開放、尊重技術,這是現在AI圈子里最強勢的"注意力貨幣",不僅能建立名聲、展現信仰,還有招攬人才——這才是AI初創現在最著急的事。

K2發布后,一位Kimi研究員曾經在博客里提到:“ 2025年,智能的上限仍然完全由模型決定,作為一家以AGI為目標的公司,如果不去追求智能的上限,那我一天也不會多呆下去?!?/p>

追求AGI看似是一條窄路,對還在這條路上的初創公司而言,還是一條康莊大道。

只要足夠專注。

封面來源|視覺中國

歡迎交流

本文來自微信公眾號“智能涌現”,作者:鄧詠儀,36氪經授權發布。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美媒曬布朗尼夏聯數據為其抱不平:若他非詹姆斯兒子,所有人都會大肆吹捧他

美媒曬布朗尼夏聯數據為其抱不平:若他非詹姆斯兒子,所有人都會大肆吹捧他

雷速體育
2025-07-19 11:22:12
GAI《歌手》被刪減原因曝光!大量Rapper發聲!

GAI《歌手》被刪減原因曝光!大量Rapper發聲!

SwagFuck
2025-07-19 13:29:42
沒想到,于文文的一組“不雅照”,照出了娛樂圈“惡臭”的另一面

沒想到,于文文的一組“不雅照”,照出了娛樂圈“惡臭”的另一面

湘村大余
2025-07-19 17:05:34
日本調查多名胃癌患者,吃驚發現:患胃癌的中老年人,有8大惡習

日本調查多名胃癌患者,吃驚發現:患胃癌的中老年人,有8大惡習

觀星賞月
2025-07-19 14:13:49
馬蓉脫衣帶貨被舉報!崩潰大哭賣慘,網友:早干嘛去了?

馬蓉脫衣帶貨被舉報!崩潰大哭賣慘,網友:早干嘛去了?

TVB的四小花
2025-06-23 00:05:45
俄羅斯終于被打醒了,繼續拖下去危及存亡,只有一招可以打垮西方

俄羅斯終于被打醒了,繼續拖下去危及存亡,只有一招可以打垮西方

薦史
2025-07-19 18:38:12
鄧紫棋因不雅動作上熱搜,網友:一覺醒來,天都塌了

鄧紫棋因不雅動作上熱搜,網友:一覺醒來,天都塌了

丫頭舫
2025-07-11 16:09:17
東莞這所新大學,分數線驚人!只比中大低6分!追平華南理工!

東莞這所新大學,分數線驚人!只比中大低6分!追平華南理工!

我們的東莞
2025-07-19 16:41:25
王心凌開演唱會有必要穿這么大膽嗎?畢竟四十多歲的人了

王心凌開演唱會有必要穿這么大膽嗎?畢竟四十多歲的人了

小椰的奶奶
2025-07-19 13:51:34
安徽學子成績不好,準備復讀,送外賣途中得知被空軍航空大學錄取

安徽學子成績不好,準備復讀,送外賣途中得知被空軍航空大學錄取

聯友說娛
2025-07-19 14:12:10
尼泊爾特里布萬機場2024年墜機事件調查報告公布

尼泊爾特里布萬機場2024年墜機事件調查報告公布

環球網資訊
2025-07-19 09:36:11
吃下去的布洛芬,到底是怎么找到身體哪兒疼的?

吃下去的布洛芬,到底是怎么找到身體哪兒疼的?

科普中國
2025-07-12 19:53:01
中央紀委國家監委駐海關總署紀檢監察組原副組長楊青錄被查

中央紀委國家監委駐海關總署紀檢監察組原副組長楊青錄被查

新京報
2025-07-19 16:04:06
湖北唯一!李汪晏(621分),已被錄??!

湖北唯一!李汪晏(621分),已被錄取!

魯中晨報
2025-07-18 12:17:53
三年1.65億!湖人如釋重負!詹姆斯停止抱怨吧,誰是門面一目了然

三年1.65億!湖人如釋重負!詹姆斯停止抱怨吧,誰是門面一目了然

張家大院趣說天下事
2025-07-19 08:20:03
鬧大了!男子給失業女友1000打掃家務,她花200叫家政被趕出家門

鬧大了!男子給失業女友1000打掃家務,她花200叫家政被趕出家門

火山詩話
2025-07-18 09:02:03
心臟決定壽命!建議中老年:別太節儉,多吃這4樣對心臟好

心臟決定壽命!建議中老年:別太節儉,多吃這4樣對心臟好

袁醫生課堂
2025-07-13 07:36:11
俄專家:美國現在才發現,中國是天然超級大國

俄專家:美國現在才發現,中國是天然超級大國

星辰夜語
2025-07-18 21:44:14
你有沒有發現,父母有穩定養老金的家庭,好像過得特別“帶勁”?

你有沒有發現,父母有穩定養老金的家庭,好像過得特別“帶勁”?

西莫的藝術宮殿
2025-07-19 14:05:58
塞爾:阿森納已放棄追求羅德里戈!利物浦想要他替代迪亞斯

塞爾:阿森納已放棄追求羅德里戈!利物浦想要他替代迪亞斯

直播吧
2025-07-19 19:35:07
2025-07-19 19:59:00
36氪 incentive-icons
36氪
讓一部分人先看到未來
148734文章數 2846080關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

頭條要聞

緬甸園區老板送回19歲高考生:你前途光明 不該留在這

體育要聞

韋德:楊瀚森讓我想起王治郅 打球都非常聰明

娛樂要聞

肖戰微博改名:去掉X玖少年團頭銜

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

家居
時尚
藝術
游戲
公開課

家居要聞

簡構智居 現代功能美學

造城者“她”,用設計重塑城市溫度

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

Faker敗了!T1戰隊0:2不敵AL戰隊 無緣EWC決賽

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 正蓝旗| 沂南县| 维西| 铜陵市| 临江市| 武邑县| 玉树县| 乐亭县| 潜江市| 泽普县| 屯门区| 五家渠市| 卢龙县| 仁布县| 庄河市| 屏南县| 桐柏县| 名山县| 合作市| 桃园市| 徐汇区| 商都县| 甘南县| 富阳市| 纳雍县| 专栏| 景谷| 鲁甸县| 怀化市| 贵定县| 夹江县| 康马县| 山东省| 敦化市| 昌黎县| 桃源县| 九江县| 安图县| 西充县| 龙游县| 锦屏县|