99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

碾壓Cursor?谷歌突發Gemini 2.5 Pro 預覽版,編碼能力全網第一

0
分享至


整理|冬梅、核子可樂

I/O 前夕,谷歌突發 Gemini 2.5 Pro 預覽版

昨晚,谷歌在 I/O 大會之前宣布推出 Gemini 2.5 Pro Preview(I/O 版)。作為其旗艦產品 Gemini 2.5 Pro AI 模型的升級版本,搜索巨頭宣稱該模型在多項主流基準測試中均名列前茅。

Gemini 2.5 Pro Preview(I/O 版)可通過 Gemini API 以及谷歌的 Vertex AI 與 AI Studio 平臺獲取,價格則與升級前的 Gemini 2.5 Pro 模型相同。預覽版也被引入到谷歌的 Gemini 聊天機器人應用當中,主要供 Web 及移動設備端使用。

谷歌 DeepMind CEO Demis Hassabis 在 X 上發帖稱:“非常高興能與大家分享我們迄今為止構建的最佳編程模型!今天,我們發布了 Gemini 2.5 Pro Preview 的‘I/O 版’,其編程能力得到了大幅提升。此版本在 LMArena 編程類別中排名第一,在 WebDev Arena 排行榜上同樣拔得頭籌。”


這套模型的發布正值谷歌年度 I/O 開發者大會(因此得名「I/O 版」)召開在際。預計谷歌將在大會上發布一系列模型以及 AI 驅動的工具和平臺。在這場殘酷的 AI 競賽中,谷歌正奮力奪取市場份額與用戶關注;OpenAI 及 xAI 等競爭對手也即將發布性能強大的同類模型。

最新版模型實際上能做些什么?

根據谷歌的介紹,Gemini 2.5 Pro Preview(I/O 版)在編碼和構建交互式 Web 應用方面實現了“顯著”提升。此外,新版本模型在代碼轉換(即修改一段代碼以實現特定目標)與代碼編輯等任務上同樣表現出色。


谷歌在一篇博文中指出,Gemini 2.5 Pro Preview(I/O 版)在 Web Arena 排行榜(旨在衡量模型創建美觀且功能強大的 Web 應用的能力)上名列前茅,比上一版本高出 147 個 Elo 積分。該排行榜衡量了人類對模型構建美觀且功能強大的 Web 應用的能力的偏好。它還繼續鞏固了其在原生多模態和長上下文方面的堅實基礎。


WebDev Arena 由 LMArena 開發,是一項實時 AI 編碼競賽,模型在 Web 開發挑戰中展開正面交鋒

視頻轉代碼

值得一提的是,新版本模型在視頻理解方面同樣擁有一流表現,在熱門基準測試 VideoMME 上取得 84.8% 的得分。

結合編碼功能,Gemini 2.5 Pro Preview 實現了之前版本無法實現的全新流程。憑借更強大的視頻理解能力和更完善的用戶界面,升級后的 Gemini 2.5 Pro 模型比之前的簡單示例提供了更豐富的功能體驗。

谷歌在博文中寫道,“對于正在使用 Gemini 2.5 Pro Preview 的開發者們來說,此次發布的新版本不僅能夠提升編程性能,還將解決開發者提出的多項關鍵反饋,包括減少函數調用中的錯誤并提高函數調用的觸發率。默認情況下,該模型既能保持良好的可操控性,也真正體現出對 Web 開發的審美追求?!?/p>

讓功能開發更簡單

Gemini 2.5 Pro Preview 在前端 Web 開發方面表現優異。實現新功能意味著用戶需要手動深入設計文件,檢查組件以匹配顏色、字體、內邊距、外邊距和邊框等樣式屬性,然后手動編寫所需的 CSS 代碼來準確復制這些視覺屬性。想象一下,在 IDE 中使用 Gemini 2.5 Pro Preview,并讓模型生成新功能,例如添加一個與 Gemini 95 入門應用中其他應用風格相同的視頻播放器。

讓創意更易落地

Gemini 2.5 Pro Preview 讓創意落地變得簡單高效,它既提供強大的實用功能,又擁有優雅的用戶界面。以全新升級的聽寫入門應用為例,該應用基于最新模型構建,充分展現了 Gemini 2.5 Pro Preview 的優勢。

值得關注的是其精致的細節設計:動態波長動畫、流暢的響應式布局,以及巧妙的按鈕懸停交互效果。這一模型天然具備現代化的 Web 開發風格,在確保視覺美感的同時,更注重操作便捷性,幫助開發者快速將概念轉化為可實際運行的 Web 應用。

例如,Gemini 2.5 Pro Preview 能夠為聽寫應用智能設計麥克風 UI 動畫,并自動生成相應代碼,顯著提升開發效率。

外界如何評價?

Gemini 2.5 Pro Preview 發布后立即在社區中引發熱議,AI 編碼工具 Cursor CEO Michael Truell?也忍不住稱贊 Gemini 2.5 Pro Preview 讓編碼能力更進一步。

“我們對最新的 Gemini 2.5 Pro Preview 感到非常興奮,它在其強大的實際編程能力基礎上進一步提升。我們內部觀察到,新型號調用工具失敗的情況顯著減少,我們相信用戶會發現這一改進使 2.5 Pro Preview 在 Cursor 中的效率比以前更高?!?/blockquote>

在 Hacker News 上,有用戶認為 Gemini 2.5 系列比其他模型要可靠,但仍然無法與人類開發者媲美:

“前在使用其他模型編程時,我經常遇到一個令人頭疼的問題:它們有時會生成根本不存在的 API。相比之下,Gemini 2.5 系列(包括 Pro 和 Flash 版本)在這方面表現要好得多,比我所嘗試過的任何其他模型都更可靠。 當然,它仍然存在一些明顯的局限性。無論怎樣優化提示詞,當前的模型在抽象思維和系統架構方面還是無法與人類開發者相媲美。但即便如此,我發現 Gemini 已經能夠替代我日常的很多搜索和 StackOverflow 查詢,顯著提升了我的編程效率。”

有用戶贊同了上述觀點,認為即使 Gemini 2.5 Pro Preview 在智能編碼方面已經足夠出色,但目前仍無法媲美人類,不過,他認為 AI 在編碼能力方面超越人類只是時間問題。

“很明顯,在代碼設計領域,人類被超越只是時間問題(至于這是 1 年還是 5 年后的事,其實并不重要)。與其糾結于這些無法改變的趨勢,不如把精力放在更有價值的問題上:在這個即將到來的新世界里,我們能做些什么? 我們需要更多建設性的想法,而這里正是推動這些討論的最佳場所?!?/blockquote>

一位每日都在使用大模型輔助編程的開發者表示:

“我每天都在使用大語言模型輔助編程。多年來,LLM 的編程能力確實有了顯著進步,但主要集中在"自然語言到代碼"的映射能力上。這種能力雖然強大,使用時仍需注意:需要精心管理上下文以保持模型專注;必須主動引導模型考慮性能優化和系統架構等關鍵因素。我對大模型的推理能力仍持保留態度。這并非否定其價值,而是要認識到其固有局限。我認為,要實現真正類人智能,我們可能需要探索完全不同于 LLM 的技術路徑。”

但也有 X 用戶認為,Gemini 2.5 Pro Preview 只有編碼技能略有提高。其他一切都略有下降。因此,這只是一個專為編碼而生的大模型,不適合一般用途(與之前的版本相比)。


https://blog.google/products/gemini/gemini-2-5-pro-updates/

聲明:本文為 AI 前線翻譯整理,不代表平臺觀點,未經許可禁止轉載。

AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯動,全覽 AI 技術前沿和行業落地。大會聚焦技術與應用深度融合,匯聚 AI Agent、多模態、場景應用、大模型架構創新、智能數據基建、AI 產品設計和出海策略等話題。即刻掃碼購票,一同探索 AI 應用邊界?。?/p>

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
原來這就是火彩!

原來這就是火彩!

時尚COSMO
2025-05-21 20:07:37
印度網友開始反擊,針對豪哥哥的視頻,發布了張100多年前的照片

印度網友開始反擊,針對豪哥哥的視頻,發布了張100多年前的照片

一個有靈魂的作者
2025-05-21 08:06:32
上海市區這個路口,大量非機動車每天集體闖紅燈!一波接一波,土方車都不怕…警方出手:上無人機

上海市區這個路口,大量非機動車每天集體闖紅燈!一波接一波,土方車都不怕…警方出手:上無人機

上觀新聞
2025-05-21 18:18:24
51歲曹穎患癌化療剛結束,直播帶貨14個小時,害怕兒子失去媽媽

51歲曹穎患癌化療剛結束,直播帶貨14個小時,害怕兒子失去媽媽

大娛聚合
2025-05-21 20:25:04
福特之后,通用汽車也將停止從美國向中國出口汽車

福特之后,通用汽車也將停止從美國向中國出口汽車

環球網資訊
2025-05-21 11:56:03
臺媒主持人:S媽很可能要無家可歸!房子不是S媽的,車庫歸誰?

臺媒主持人:S媽很可能要無家可歸!房子不是S媽的,車庫歸誰?

小娛樂悠悠
2025-05-22 11:16:23
被年輕人的“住酒店智慧”驚呆了,換個思路后,就解決了很多痛點

被年輕人的“住酒店智慧”驚呆了,換個思路后,就解決了很多痛點

阿離家居
2025-05-22 07:33:56
神射手,內史密斯成有記錄以來首位季后賽末節進6記三分球員

神射手,內史密斯成有記錄以來首位季后賽末節進6記三分球員

懂球帝
2025-05-22 14:45:45
中國又干成了一件大事,兩架專機飛抵北京,三方會談達成7項成果

中國又干成了一件大事,兩架專機飛抵北京,三方會談達成7項成果

愛看劇的阿峰
2025-05-22 11:10:56
對話阿蘭·阿斯佩:“駁倒”愛因斯坦之后,量子物理的界限何在?

對話阿蘭·阿斯佩:“駁倒”愛因斯坦之后,量子物理的界限何在?

返樸
2025-05-21 10:44:25
50歲陳奕迅因新冠并發癥不幸離世?環球音樂回應了

50歲陳奕迅因新冠并發癥不幸離世?環球音樂回應了

拾娛先生
2025-05-19 16:37:07
輝煌的大明王朝對他的敵人們有多狠:那些被大明“修正”的亞洲史

輝煌的大明王朝對他的敵人們有多狠:那些被大明“修正”的亞洲史

國學聚焦
2025-05-21 14:20:10
扯下了曼聯最后的遮羞布

扯下了曼聯最后的遮羞布

世界足球博物館
2025-05-22 08:54:16
把觀眾當傻子?又丑又沒演技,這一次,沒有人會為她的作品買單

把觀眾當傻子?又丑又沒演技,這一次,沒有人會為她的作品買單

近史閣
2025-04-19 17:31:13
電廠二板面的板面大戰:老板娘一怒之下,濟南40家店招牌全換了

電廠二板面的板面大戰:老板娘一怒之下,濟南40家店招牌全換了

阿傖說事
2025-05-22 12:58:27
80年代,鄧樸方請朋友幫他找個老婆,但提出一個要求:不能有孩子

80年代,鄧樸方請朋友幫他找個老婆,但提出一個要求:不能有孩子

帝哥說史
2025-05-15 06:35:02
演員朱媛媛喪禮在福建舉行!入殮師曝她遺容慈祥,身形因患癌消瘦

演員朱媛媛喪禮在福建舉行!入殮師曝她遺容慈祥,身形因患癌消瘦

東方不敗然多多
2025-05-22 10:46:48
A股,徹底的沒法看了,兩市超4000多只個股下跌,成交進一步縮量

A股,徹底的沒法看了,兩市超4000多只個股下跌,成交進一步縮量

云鵬敘事
2025-05-22 15:49:27
加裝電梯成“爛尾工程”!珠海一小區居民盼到“崩潰”

加裝電梯成“爛尾工程”!珠海一小區居民盼到“崩潰”

南方都市報
2025-05-22 11:51:27
?俞灝明成最大笑話了!官宣戀情女方毫無回應,圈內好友集體消失

?俞灝明成最大笑話了!官宣戀情女方毫無回應,圈內好友集體消失

小娛樂悠悠
2025-05-21 12:27:28
2025-05-22 17:04:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
859文章數 80關注度
往期回顧 全部

科技要聞

中國科學界ChatGPT來了,70萬科研人涌入

頭條要聞

美商務部長首次承認:中國對美加征關稅 特朗普怕了

頭條要聞

美商務部長首次承認:中國對美加征關稅 特朗普怕了

體育要聞

威少被交易時,雷霆下一個MVP已在陣中

娛樂要聞

朱媛媛喪事一切從簡,親戚剛知她去世

財經要聞

格力再度牽手孟羽童?董明珠急了

汽車要聞

配1.5T插混/2000km續航 一汽奔騰悅意07即將上市

態度原創

本地
健康
手機
數碼
房產

本地新聞

巴黎沒有倍兒甜,但天津巧克力腦袋倍兒多

唇皰疹和口腔潰瘍是"同伙"嗎?

手機要聞

realme 真我 Neo7 Turbo 手機“透明黑”配色亮相

數碼要聞

清華同方超銳 T40-Z70 信創筆記本發布,搭載兆芯 KX-7000 處理器

房產要聞

??谧〗ü傩合迌r商品房上市交易細則要來了!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南投市| 乐昌市| 澄城县| 潼南县| 大同市| 武乡县| 措勤县| 屏南县| 大新县| 静海县| 辽阳市| 会昌县| 赤壁市| 沅陵县| 色达县| 遵化市| 凉城县| 改则县| 桂林市| 平塘县| 余庆县| 甘泉县| 奉新县| 肥东县| 磐石市| 汾阳市| 教育| 格尔木市| 南投市| 崇阳县| 静海县| 潜江市| 安国市| 临泽县| 古丈县| 卢龙县| 鲁山县| 黑龙江省| 高清| 乐平市| 长顺县|