AI這個行業真的卷生卷死,凌晨2點半,剛想早睡一點點,9點起來蹲DeepSeek的開源。
結果,Claude直接玩偷襲了。
Claude 3.7 Sonnet來了,也是Claude家族,第一個能推理的模型。
還掏出了他們自己的AI編程工具。
一個一個說吧。。。我真的很想睡覺啊。。。
一. Claude 3.7 Sonnet
Claude 3.7 Sonnet跟市面上的其他推理模型有點不一樣,也印證了之前TheInformation的爆料,這一次的Claude 3.7 Sonnet,是一個混合推理模型。
簡單的說,就是Claude 3.7 Sonnet即是一個普通的大模型,也是一個推理模型,你可以理解為把DeepSeek V3和R1直接揉在了一起。
切換模式使用下拉菜單去控制。
分為普通模式和擴展(其實就是推理)模式。
普通模式下,它就是個升級版 Claude 3.5 Sonnet,回答迅速,跟以前一樣流暢,牛逼了一些,沒法大區別。
如果你想讓它認真思考,比如一些數學、物理、編程、復雜分析場景,就可以切換到擴展模式,這時它就會跟R1和o1一樣,開始思維鏈展開,自己推理。
比如說我就用普通模式去問,會發現跟之前沒法區別。
但是切換到擴展模式,他就會開始思考了。
整體坦率的講,在交互上跟其他的推理模型沒有任何區別。
能力還是那些老能力,在數學、物理、遵循指令、編碼以及許多其他任務上的表現上會更強。
然后我還發現一個非常der比的事情,就是他都說自己是混合模型了,我以為我可以有無縫的體驗,在一個對話窗口中可以實現普通模型和擴展模型來回切換的體驗,甚至有一些黑科技加持。
結果。。。
這個New chat看到沒,一點就切換到一個新窗口了。。。
不是,DeepSeek都能在一個對話窗口上進行R1和V3的隨時切換呢,你這是干啥啊。。。
但是有一說一,Claude的文筆是真的好啊,在推理能力的加持下,感覺寫出來的內容,味道更正,更真人了,甚至,劇情的邏輯都更順了。
不過,這些都不重要,Claude最牛逼的東西,還是它的編程。
非推理模型加持下的Claude 3.5,就能跟o1打的有來有回,甚至至今還是cursor他們認為最優的模型。
而Claude 3.7,直接就是屬于斷檔式把其他人按在地上摩擦了。
在遵循指令、一般推理、多模態能力和自主編碼方面的表現都很牛逼,特別是加了推理之后,在數學和科學方面也是一飛沖天。
然后有一個是我覺得最騷的基準,就是他們讓Claude 3.7 Sonnet,玩寶可夢紅。。。
一款非常老但是非常經典的游戲,整個寶可夢系列的第一世代。
他們給了Claude 配備了基本的內存、屏幕像素輸入和按鍵操作功能,讓Claude開著擴展思維去玩寶可夢,最后結果是這樣的。
之前的版本在游戲早期就直接廢了,Claude 3.0 Sonnet 甚至沒能出新手村。。。
但是Claude 3.7 Sonnet的AI代理(Agent)的能力就非常強,成功挑戰了三個道館的館主,贏了他們的徽章。
非常的有意思,可以非常直觀的看出來,Claude 3.7 Sonnet在編程、代理、數學等等的能力上,幾乎有了質的飛躍。
AI編程這個領域,看來又要前進一大步了。
在API的定價上,Claude 3.7 Sonnet每百萬輸入是3美刀,美百萬輸出是15美刀,最長能干到128k的輸出,通過prompt caching可節省高達90%的成本,通過batch processing可節省50%的成本,整體還是稍微良心一點的。
不過跟DeepSeek這種價格屠夫比起來,還是有不少距離,但是也比OpenAI好了。。。
主要還是DeepSeek實在太便宜了。
在推理控制上,開發者還是比較自由的,甚至可以設置“思維預算”,精確控制Claude在一個問題上花費的時間。
整體來說,Claude 3.7 Sonnet還是非常香的。
當然,如果他不封號且格局不是那么小的話,會更好。。。
二. Claude Code
他們自己的類似于Cursor的AI編程工具。
可以搜索和閱讀代碼,編輯文件,編寫和運行測試,提交并推送代碼到 GitHub,并使用命令行工具。
他們自己的界面,也非常的命令行。
目前開放了限量預覽,有興趣的可以去這個地方查看所有的詳情:
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
整個手冊已經寫的非常詳細了,我就不過多贅述了。
但是對于一些剛開始我那AI編程的或者是沒代碼知識的,我還是無腦建議Trea或者Cursor。
三. 寫在最后
AI圈的進化速度實在是太快了,前腳馬斯克的Grok3地球最聰明的稱號屁股還沒坐熱,Claude 3.7 Sonnet直接殺出來了。
而且把模型的上限,再一次拔高了一個臺階。
這就是AI的江湖啊,深刻的感覺到了連睡覺都是罪過。
早上9點還要起來蹲DeepSeek的開源。
你們就卷吧,AI公司肯定沒啥事,第一個卷死的一定是AI自媒體。。。
但這就是AI時代最刺激的部分。
沒得覺睡,也開心。
畢竟,每天都在見證歷史。
你說呢。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.