《科創板日報》6月26日訊(記者 李明明)Agent又卷起來了。
近日,月之暗面Kimi推出了第一個 Agent ——Kimi-Researcher(深度研究),并開始小范圍灰度測試。
據介紹,模型即 Agent,Kimi-Researcher 是基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,也是一個專為深度研究任務而生的 Agent 產品,強調模型即Agent。
此外,月之暗面稱也將逐步開源 Kimi-Researcher 基礎預訓練模型、以及強化學習后的模型。
《科創板日報》記者在實測中發現,Kimi-Researcher可生成詳細豐富的研究報告,專業性和報告可視化可圈可點,是國內少有的基于自研模型打造的Agent。生成時間一般在15—20分鐘左右,后續也可以適當縮短時長。通過自主調用瀏覽器、代碼等工具,在平均規劃70多個關鍵詞及對200多個網址的搜索后,可以自動生成分析報告,完成端到端的交付。
記者實測“Kimi-Researcher”
《科創板日報》記者使用“ Kimi-Researcher”實測了七個任務,它均能較好地完成,舉其中三個例子來展示其推理過程。
任務一:近期獲得融資的 AI 硬件創業公司天數智芯,分析其硬件產品的技術特點、性能優勢和應用場景,研究其在與巨頭競爭中的創新策略和市場突破路徑,給出一個是否值得投資的結論。
大約15—20分鐘左右,Kimi-Researcher搜索數百個網站,生成了一份數萬字的詳細報告—《天數智芯深度研究報告:AI芯片新勢力的崛起與投資價值分析》,包括公司概覽與核心優勢產、品與技術實力分析、市場競爭與戰略分析等方面,還用表總結了天數智芯主要產品系列及其特點、競品概況等,另外,最后還附帶一份可視化報告,該報告還可以通過復制文本、鏈接和生成圖片保存。
任務二:人形機器人是風口還是泡沫?制約人形機器人商業化落地關鍵環節有哪些?何時能夠商業化落地?
20分鐘左右,Kimi-Researcher生成了報告《人形機器人:風口還是泡沫?商業化落地的深度剖析與未來發展路徑》,引言表示:人形機器人產業目前正處于技術加速迭代與資本高度關注的風口期,但其商業化落地仍面臨智能化水平不足、運動控制能力有限、核心零部件成本高昂、應用場景不明朗以及產業鏈成熟度不高等多重制約環節。短期內,人形機器人將在工業、特定商業服務等B端場景持續滲透;中期(3-10年)有望迎來技術突破與成本下降的關鍵期,應用領域將進一步拓展;長期(10年以上)則可能實現大規模普及。
任務三:我需要一份 7 月 2-7日從北京出發的日本行程,預算為3 -8萬元,適合我和閨蜜。我們喜歡名勝古跡、美食美景等,并需要一個特別的歷史地點推薦。請提供一份詳細的旅行手冊,其中包含地圖、景點介紹、必要的外語短語和旅行小貼士,供我們在旅途中參考。
對于Kimi選擇進軍Agent領域,北京計算機學會AI專委會秘書長、北大人工智能博士張有魚告訴《科創板日報》記者,這樣的選擇既是其技術勢能的釋放,也是商業戰略主動躍遷的結果。
在技術層面,Kimi將其長文本(Long Context)處理能力及端到端的強化學習技術“Agent化”,并讓模型從一個“被動”的知識庫變為一個能進行“主動”研究、自主交付成果的智能體。這不僅是技術價值最大化的必由之路,更是幫助Kimi在基礎模型“卷參數”的紅海中,開辟“卷應用”藍海的重要一步。
當前,在激烈的商業競爭格局下,單純提供API調用的模式護城河過淺。Kimi推出Kimi Researcher,可以直接切入的核心知識生產流程。其商業模式也從“賣API”到“賣解決方案”的根本性轉變,試圖通過深度綁定用戶工作流,構建更強的用戶粘性與商業壁壘。
全球Agent競賽已從“能力展示”轉向“場景交付”
2025年是AI Agent技術的爆發之年,國內外多家科技企業紛紛推出差異化Agent產品,覆蓋研究、辦公、企業服務、消費電子等多場景。
國內企業Agent發布方面,月之暗面推出產品Kimi-Researcher(深度研究),智譜推出AutoGLM沉思,定位是首個“邊想邊干”型智能體,字節跳動推出扣子空間(Coze Space),定位全能型智能體開發平臺,火山引擎、昆侖萬維、榮耀等也推出智能體;國外企業OpenAI、DeepMind、Anthropic等也紛紛發布智能體。
《科創板日報》記者注意到,2025年全球Agent競賽已從“能力展示”轉向“場景交付”,國產Agent憑借免費策略、垂直整合與端到端自動化,正快速搶占企業及C端市場高地。
國內外科技大廠紛紛發布Agent的背后,是大模型基礎能力的提升。
智源研究院院長王仲遠告訴《科創板日報》記者,當基礎大模型發展至一定階段并達到可用狀態后,Agent將成為產業界可重點發力的領域。隨著Agent能力的不斷增強,其將具備更廣泛的擴展性。現階段,基礎大模型的思考能力與智能化程度已有所提升,使得部分Agent能夠表現出較為出色的效果,而這正是產業界所擅長且具備優勢的領域,亦是未來產業發展的趨勢。
王仲遠認為,基礎模型需達到或接近GPT-4的能力水平,才能滿足實際應用需求。對于創業公司而言,投入產出比(ROI)是關鍵考量因素。因此,在模型開發中需兼顧性能與效率,在保證能力的前提下,盡量縮小模型規模,提升推理速度。盡管當前仍存在技術瓶頸,但隨著研究深入,這些問題有望逐步得到解決 。
談及深度研究任務Agent,市場上還存在哪些痛點和需求未被滿足的方面,張有魚表示,當前AI輔助深度研究市場,存在“通用”與“個性”的矛盾,大多數AI工具為追求普適性而犧牲了個性化。然而,深度研究恰恰是高度定制化的。不同領域、不同課題、不同研究者都有獨特的分析框架與偏好。市場亟需能理解并適應研究者個性化需求的AI工具,提供更靈活、可定制的解決方案。
其次, 還存在“自主”與“可控”的悖論: 這也是研究類Agent面臨的終極考驗。用戶既希望AI足夠“自主”,能從繁瑣流程中解放自己,又要求AI在嚴肅的研究場景中絕對“可控”與“可信”,過程透明、結果可溯源。不同Agent產品常在兩者間博弈:要么過于自主而出現不可信的“黑箱”,要么過于人工可控而顯得笨拙低效。如何優雅地平衡這對矛盾,是決定產品成敗的關鍵。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.