大家好,我是Ai學習的老章
最近各種最新最強大模型輪番上場,[[20250307 阿里通義千問,汪峰附體了]]
? QwQ-32B與具備 6710 億參數的 DeepSeek-R1 媲美,數學能力、代碼能力表現與 DeepSeek-R1 相當,遠勝于 o1-mini 及相同尺寸的 R1 蒸餾模型。
阿里之后,谷歌昨天也發布了開源模型Gemma 3
,號稱也很強。
? Gemma 3 能用 27B 參數量達到開源模型第二的水平,模型在 LMArena 排行榜中勝過 Llama-405B、DeepSeek-V3 和 o3-mini。[圖片]
今天老章就順便分享一下,一個個大模型輪番面世,我們應該如何去認識、使用它。
一共三步
第一步:了解模型性能
主要看官方公布的技術文檔、博客等
技術文件:https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf
博客:https://huggingface.co/blog/gemma3 https://blog.google/technology/developers/gemma-3/
這些一般會把模型等優點介紹的非常清楚了
其實官方或一眾博主都會出高度總結
? 多模態 - 理解圖像、視頻和文本,生成文本
多語言 - 140 種語言!
設備就緒 - 1B、4B、12B、27B 的大小
非常有用 - 27B 在 Chatbot Arena (*) 上的表現與 OpenAI o1 持平
Mucho Capable - 128k 令牌上下文窗口
第二步:確定模型擅長領域
官方介紹自己,一般會特別突出其在某一領域的亮點去與其他模型對比
所以我還會去第三方平臺看看,做全面對比
這里推薦幾個我常看的
大語言模型的情商基準:
https://eqbench.com/creative_writing.html
數學能力
https://www.datalearner.com/ai-models/llm-benchmark-tests/37
人工智能模型和 API 提供商的獨立分析平臺,這也是我最喜歡看的,各個領域看大模型的排名情況
https://artificialanalysis.ai/
光看不練假把式,可以去官方或其他開放平臺去測試一下
比如本次谷歌這個,在huggingface可以嘗試:https://huggingface.co/spaces/huggingface-projects/gemma-3-12b-it
官網更方便:https://aistudio.google.com/app/prompts/new_chat
通過以上三步,你可能已經對這個模型有完整、深入的了解了
再有大模型面世,照此三步走即可。
如果想動手部署,也可以
模型文件:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
https://huggingface.co/google/gemma-3-27b-it/tree/main
制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.