現在AI屆有兩大羊毛,一個是Cursor的edu郵箱用戶可以免費使用一年,價值200刀,非常實用,但是缺點是只有美國的學生才能享受;另一個就是Gemini的Pro會員,只要是學生就能在認證后免費用15個月,親測老師也行,只要是教育體系里面有官方給的郵箱即可。
Pro訂閱里面包含了2TB的存儲空間,特別是還有Veo3的使用權限,暫時一天能生成三次,按照視頻生成的成本,怎么也能算10-15塊錢了。
根據Google近一年來的默默發力,Gemini-2.5-Pro絕對是世界上最頂級的那一檔,未來肯定還會加大力度搞大模型,搞視頻生成模型,所以這15個月的免費羊毛必須得薅。
搜Gemini Student Discount即可
秦始皇看了也都得點贊-由Gemini Veo3生成。
Gemini現在就倆模型,一個2.5 Flash主打通用任務,快,理解能力還可以,多模態也沒問題。
2.5-Pro重推理,每一次的推理都會花更多的token以及更長的思考時間,當然效果也更好,在今年的高考數學測試也看到了,幾乎都能做對(前提是你給它足夠精準的數學表達)。
性能來說,我們先不看論文和技術報告,先從openrouter看下Gemini-2.5-Pro的關鍵參數,主要就看紅框里面的這個。
Context:1.05M
Max Output:66k
這倆指標非常牛逼,context代表了它可以一次對話處理的內容長度,理論上肯定是越多越好,因為有時候真的需要幾篇甚至十幾篇論文扔給AI來讀;Max Output代表了它可以輸出內容的最大長度。
模型性能好,但是輸入輸出長度太短,這種在應用中只能寫寫詩,對對對聯,實際中作用并不大。
這倆長度在大模型領域里面都是Top級別的,這代表了什么,你可以一次性的扔給它一大堆的文檔,word,pdf,excel,txt等,然后它可以一次性給你生成一整篇論文或者報告。
一般來說,一篇理工類型的英文論文6000字左右,換成token也就8000+,完全在66000之內,這代表了它不僅可以一次性的給你把草稿潤色完,順便還有非常大的余力給你出一份修改記錄。
論文類型
常見字數(英文)
約等于Token數(英文)
常見字數(中文)
約等于Token數(中文)
期刊文章(人文社科)
8,000 - 12,000
10,400 - 15,600
8,000 - 12,000
16,000 - 30,000
期刊文章(自然科學)
3,000 - 6,000
3,900 - 7,800
3,000 - 6,000
6,000 - 15,000
碩士學位論文
20,000 - 80,000
26,000 - 104,000
20,000 - 80,000
40,000 - 200,000
博士學位論文
80,000+
104,000+
80,000+
200,000+
這在碰到revision的時候更有用,一次性扔給它修改稿和原稿,讓它一次性的輸出修改記錄,給審稿人的cover letter等一堆東西。
不是說別的模型做不了,而是這種大輸出的模型,做長上下文的場景時候就是神器。
技術報告中的數據略有不同,但不影響,你要有學生驗證,就猛猛的用Pro完事。
現在的Gemini性價比,說在世界前三肯定不為過,綜合能力跟OpenAI不相上下,甚至略高也是可以說的。
最后說一點標準化評分,在已有的公開數據集上,也是那些刷榜的題目上,其實大多數的模型做的都不錯,Gemini也不例外。
但實際上是因為這些題公開的時間很久了,套路都已經被學的差不多了,這幾天紐約大學的saining xie教授團隊搞了一個新的測試集,叫LiveCodeBench Pro,看名字也知道,就是做編程測試的,分為了三個檔,簡單,中級和困難,簡單問題那些比較強的模型都做的不錯,o3-high能做對87%+的簡單題,中級的也有44.9%的正確率,但是難題一道也做不對(而人類的編程高手完全沒問題)。
而Claude這個編程為主要賣點的模型,中級的一道都做不對。
可以說,現在的模型強,得實際用,數據已經過擬合了。
地址:https://livecodebenchpro.com/
Gemini-2.5-Pro,用起來一點兒沒問題,強推。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.