99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

怎么回事?剛被OpenAI收購,Windsurf就發(fā)了個自己的模型

0
分享至

文章轉載自「新智元」

5 月初,

AI 編程熱門公司 Windsurf 又有了新的動作。Windsurf 發(fā)布了其 AI 編程模型SWE-1。官方介紹稱,SWE-1 針對整個軟件工程過程,而不僅僅是編碼任務。

SWE-1 的核心關鍵為流動感知(Flow Awareness),涉及到軟件開發(fā)過程的全流程,強調實現(xiàn) 模型和人類之間「自然交接」:AI做一部分,用戶校正,AI再繼續(xù),形成順暢銜接。

SWE-1系列包含三個模型:

  • SWE-1:具備與Claude 3.5 Sonnet類似的工具調用推理能力,但運行成本更低。在推廣期內,所有付費用戶可免費使用。

  • SWE-1-lite:一個更小但質量更高的模型,全面取代Cascade Base,對所有用戶(包括免費用戶)開放。

  • SWE-1-mini:更小、更快,專為Windsurf Tab中的低延遲被動體驗而設計,適用于所有用戶。


目前,SWE-1 模型已在 Windsurf 中上線,用戶可以免費使用。

Founder Park 正在搭建「AI 產(chǎn)品市集」社群,邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,掃碼加群:

進群后,你有機會得到:

  • 最新、最值得關注的 AI 新品資訊;

  • 不定期贈送熱門新品的邀請碼、會員碼;

  • 最精準的AI產(chǎn)品曝光渠道

01

AI編程發(fā)展「快閃」

近幾年,「會寫代碼」的模型取得了巨大進步,已經(jīng)能從簡單的自動補全發(fā)展到一次性構建出完整的小型應用。

但這種能力仍然存在明顯的上限:

其一,軟件開發(fā)不僅僅是寫代碼。

開發(fā)者要做的事情遠不止編碼,還要操作終端、獲取知識、調試產(chǎn)品、理解用戶反饋等。因此需要的是更全面的模型,能覆蓋整個開發(fā)流程。

其二,工程過程是跨階段的、持續(xù)變化的。

目前主流的基礎模型仍然是基于「代碼能否編譯」和「是否通過單元測試」來訓練的。但現(xiàn)實中,這只是更大工程任務中的一小部分。

真正需要的是能處理「尚未完成的狀態(tài)」、理解模糊目標的模型。

否則,即使模型寫出了能運行的功能,后續(xù)維護與擴展性可能會非常差。

因此,僅僅提高「寫代碼」的能力,無法真正提升整個工程效率。需要打造的是支持完整軟件工程流程的模型——簡稱SWE模型。


02

SWE-1的開發(fā)過程

SWE-1的開發(fā)靈感來自廣受歡迎的Windsurf編輯器,構建了全新的數(shù)據(jù)結構(共享時間線)和訓練方法,能夠理解未完成的狀態(tài)、長周期任務以及多種交互界面。

其初衷是在資源有限的情況下,通過這種方法做出一流性能的模型。

SWE-1是這個目標的第一個驗證成果。

在整體表現(xiàn)上,SWE-1接近最前沿的基礎模型,在多個維度上超過了所有非前沿模型和開源對手??梢酝ㄟ^離線評估與線上實測兩種方式進行驗證。

離線評估

評估將SWE-1與Anthropic系列(Cascade中使用最頻繁的模型之一)以及Deepseek、Qwen等主流開源模型對比,主要有兩個基準測試:

  • 會話式SWE任務基準

從一個正在進行中的Cascade會話中截取,任務尚未完成。評估模型如何響應用戶的下一步請求,打分標準綜合考慮幫助程度、效率、正確性以及目標文件編輯的準確率。這項測試關注模型在「人機協(xié)作」環(huán)境中的表現(xiàn)。


  • 端到端SWE任務基準

從會話一開始就評估模型是否能完全獨立解決問題,并通過一組單元測試。得分基于測試通過率和專家打分。這項測試衡量模型自主完成任務的能力。


評估結果表明,SWE-1在這些任務上接近頂級實驗室的前沿模型,遠超中等體量和開源的對手。雖然還不是絕對領先,但非常有潛力。

線上實測(生產(chǎn)實驗)

Windsurf有大量用戶,因此也通過盲測實驗評估真實使用中的表現(xiàn)。

Windsurf將用戶分組,分別使用不同模型,在不告知模型類型的前提下觀察行為和效果。

Windsurf主要看兩個指標:

  • 每位用戶每天接受的代碼行數(shù)

即Cascade編寫、用戶實際接受并保留的代碼行數(shù),反映模型的實際幫助程度、響應質量和用戶粘性。


  • Cascade代碼貢獻率

對于被Cascade修改過的文件,模型所做的代碼改動所占比例。這是一個反映模型「主動性」以及「用戶信任程度」的指標。

SWE-1專為Cascade場景設計和優(yōu)化,因此在這些指標上表現(xiàn)幾乎是行業(yè)領先,效果優(yōu)于所有非前沿模型。


其他模型分析

你可能在上面的圖表中注意到SWE-1-lite,這是SWE-1的中型版本,使用相同訓練方式,在非前沿模型中表現(xiàn)最佳,現(xiàn)已取代Cascade Base,向所有用戶開放。

Windsurf還開發(fā)了SWE-1-mini,體積更小,速度更快,適用于Windsurf Tab這種對延遲要求極高的被動預測場景。

需要說明的是,這只是一個起點。

Windsurf不僅希望趕上最前沿實驗室的水平,最終目標是全面超越它們。

Windsurf堅信自己已經(jīng)具備了實現(xiàn)這個目標的引擎,并將持續(xù)加大投入。

03

流動感知系統(tǒng)(Flow-Aware System)

Windsurf提到SWE-1的靈感來源于Windsurf編輯器。

關鍵在于Windsurf獨特的設計理念:流動感知(Flow Awareness)。

什么是流動感知?

Windsurf打造的Windsurf編輯器實現(xiàn)了用戶與AI的「共識時間線」:AI的每一步用戶都能看到并干預,反過來,AI也能理解并跟進用戶的行為。

這種「共享時間線」的感知能力,Windsurf稱之為Flow Awareness(流動感知),也因此Windsurf一直把這種人機協(xié)作的體驗稱為「AI flows」。

為什么流動感知很重要?

因為短時間內,沒有模型能完全獨立完成所有開發(fā)任務。

流動感知允許模型和人類之間「自然交接」:AI做一部分,用戶校正,AI再繼續(xù),形成順暢銜接。

借助共享時間線,Windsurf可以持續(xù)追蹤當前模型的能力邊界,觀察哪些任務需要用戶介入、哪些能完全自動完成。

這是SWE-1能快速成長為當前水平的關鍵原因之一。

共享時間線在Windsurf中的演進

構建共享時間線是Windsurf許多功能背后的核心理念:

  • 初代Cascade就支持「你在編輯器改完內容后輸入continue,AI就能繼續(xù)理解你改了什么」——這是對編輯器的感知。

  • 后來Windsurf加入了終端輸出感知——AI能理解你執(zhí)行命令時出現(xiàn)的錯誤。

  • Wave 4中加入了「預覽」功能——AI開始理解你看到的前端組件和錯誤。

  • Wave 5和 Wave 6中,Tab增加了對終端命令、剪貼板內容、IDE搜索內容等的感知。

這不是一堆隨機新功能,而是Windsurf構建「最全面軟件工程時間線」的一部分。

即便使用的是通用模型,只要Windsurf記錄和利用好了這些上下文信息,AI的表現(xiàn)就會大幅提升。

而現(xiàn)在Windsurf有了自研的SWE系列模型,這個正反饋循環(huán)將真正開始加速:模型能更好地理解時間線并參與其中更多部分。

接下來會發(fā)生什么?

SWE-1只是開始。它是由一個小而專注的團隊打造的,利用Windsurf在產(chǎn)品和基礎設施方面的優(yōu)勢,展示了Windsurf完全有能力打造接近最前沿的模型。

未來,Windsurf將持續(xù)改進SWE系列模型,在保證低成本的同時不斷提升性能,讓開發(fā)者能用Windsurf構建更大、更強的軟件項目。

隨著SWE-1的發(fā)布和OpenAI對Windsurf的收購,AI編程工具正迎來一個新的時代。

從簡單的代碼補全到全面的工程協(xié)作,AI正在深刻改變軟件開發(fā)的方式。

對于開發(fā)者來說,這是一個充滿機遇和挑戰(zhàn)的時代,如何利用這些新工具提升開發(fā)效率,將成為他們需要思考的重要問題。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
比越南還可恨,多國一致將槍口瞄準我國,俄羅斯:動手時不必心軟

比越南還可恨,多國一致將槍口瞄準我國,俄羅斯:動手時不必心軟

通文知史
2025-07-16 16:40:03
12分鐘超長補時!亞泰詭異烏龍,進球被吹激怒主帥,戲劇性拉滿

12分鐘超長補時!亞泰詭異烏龍,進球被吹激怒主帥,戲劇性拉滿

奧拜爾
2025-07-18 17:47:39
宋佳回山東老家,褲子挺有個性引關注,網(wǎng)友: 以為是發(fā)霉臟了

宋佳回山東老家,褲子挺有個性引關注,網(wǎng)友: 以為是發(fā)霉臟了

銀河史記
2025-07-17 23:03:42
“真相到底是什么?”天水幼兒園家長試吃饅頭,發(fā)現(xiàn)撒謊的證據(jù)

“真相到底是什么?”天水幼兒園家長試吃饅頭,發(fā)現(xiàn)撒謊的證據(jù)

知曉科普
2025-07-16 14:16:56
中國正式授權:“可以開火射擊!”外機再挑釁真會吃炮彈?

中國正式授權:“可以開火射擊!”外機再挑釁真會吃炮彈?

一個有靈魂的作者
2025-07-15 15:53:43
宗慶后違反了多少規(guī)章制度?

宗慶后違反了多少規(guī)章制度?

隱于山海
2025-07-16 11:41:17
娃哈哈的“繼承迷局”:宗馥莉轉錢不是關鍵,信托是否有效才關鍵

娃哈哈的“繼承迷局”:宗馥莉轉錢不是關鍵,信托是否有效才關鍵

藍鯨新聞
2025-07-17 20:39:10
00后給老板定凌晨四點的出差機票~評論區(qū):老板有時候也挺無助的

00后給老板定凌晨四點的出差機票~評論區(qū):老板有時候也挺無助的

滑稽斑馬呀
2025-07-10 14:38:36
上海34歲剩女相親失敗 , 回家后崩潰大哭:我又不丑 , 憑什么沒人要!

上海34歲剩女相親失敗 , 回家后崩潰大哭:我又不丑 , 憑什么沒人要!

三農(nóng)老歷
2025-07-17 18:05:35
拓記:開拓者明確告訴我不可能讓楊瀚森掉到16以下 16都危險

拓記:開拓者明確告訴我不可能讓楊瀚森掉到16以下 16都危險

直播吧
2025-07-18 11:38:24
人民網(wǎng)還原扒垃圾找手表事件全貌,評論風向反轉,原來我們都錯了

人民網(wǎng)還原扒垃圾找手表事件全貌,評論風向反轉,原來我們都錯了

曉踏就是我
2025-07-17 06:24:38
向佐欠百萬賭債真相大白,豪門體面徹底被撕碎,郭碧婷實慘

向佐欠百萬賭債真相大白,豪門體面徹底被撕碎,郭碧婷實慘

青途歷史
2025-07-16 18:08:18
英偉達H20芯片解禁,國產(chǎn)芯片慌了?華為:不足為懼!

英偉達H20芯片解禁,國產(chǎn)芯片慌了?華為:不足為懼!

瘋狂小菠蘿
2025-07-18 13:57:31
8個跌停,終于開板,原來繞一圈回來,是為了換一批人進去站崗!

8個跌停,終于開板,原來繞一圈回來,是為了換一批人進去站崗!

小舟談歷史
2025-07-18 15:19:24
李連杰大大方方地承認了:對,我有

李連杰大大方方地承認了:對,我有

猛哥的搞笑視頻
2025-07-17 21:27:32
63歲老人中800萬大獎,裝患病測試子女,住院當晚一人潛入病房拔管

63歲老人中800萬大獎,裝患病測試子女,住院當晚一人潛入病房拔管

懸案解密檔案
2025-07-15 14:58:19
黃楊鈿甜天價耳環(huán)大結局!央媒通報調查結果,這次終于真相大白了

黃楊鈿甜天價耳環(huán)大結局!央媒通報調查結果,這次終于真相大白了

洲洲影視娛評
2025-07-16 22:03:30
意媒:國米準備明夏免簽弗拉霍維奇,這會阻礙穆阿尼留在尤文

意媒:國米準備明夏免簽弗拉霍維奇,這會阻礙穆阿尼留在尤文

雷速體育
2025-07-18 16:58:16
上任不到150天,越南“70后”部長被處分

上任不到150天,越南“70后”部長被處分

中國新聞周刊
2025-07-18 17:03:23
拿下世界冠軍覃海洋的女富婆,被官媒曝真實身份,靠詐騙賺幾個億

拿下世界冠軍覃海洋的女富婆,被官媒曝真實身份,靠詐騙賺幾個億

說說史事
2025-07-18 16:14:40
2025-07-18 18:15:00
FounderPark incentive-icons
FounderPark
關注AI創(chuàng)業(yè),專注和創(chuàng)業(yè)者聊真問題
850文章數(shù) 134關注度
往期回顧 全部

科技要聞

凌晨,OpenAI重磅更新,Manus們算白忙活嗎

頭條要聞

女正部任上被查 今年已有6名正部級官員落馬

頭條要聞

女正部任上被查 今年已有6名正部級官員落馬

體育要聞

楊瀚森4戰(zhàn)43+20+15+9帽:開拓者4戰(zhàn)3勝

娛樂要聞

王琳自曝被兒子打,承認自己水性楊花

財經(jīng)要聞

美國國會正式批準穩(wěn)定幣法案

汽車要聞

售30萬?方程豹鈦7高配版有激光雷達/車載無人機

態(tài)度原創(chuàng)

家居
教育
健康
數(shù)碼
公開課

家居要聞

簡構智居 現(xiàn)代功能美學

教育要聞

3分鐘學會一個雅思7分句/段(第300期)

呼吸科專家破解呼吸道九大謠言!

數(shù)碼要聞

iKKO 推出 Mind One AI 小手機:提供全鍵盤保護殼,299 美元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 广南县| 深泽县| 石屏县| 台南市| 宁南县| 磴口县| 会泽县| 和田市| 嵊州市| 嘉兴市| 阿克陶县| 无锡市| 尚志市| 宝丰县| 亳州市| 莒南县| 长岛县| 成武县| 鄱阳县| 休宁县| 绥棱县| 尚义县| 隆尧县| 离岛区| 英吉沙县| 双牌县| 饶平县| 黄平县| 钟祥市| 将乐县| 顺义区| 达日县| 沐川县| 沂源县| 山丹县| 天等县| 正阳县| 永丰县| 辽宁省| 福海县| 射洪县|