在業界,有個著名的“不可能三角”
甲方乙方都懂的
想要又便宜又快又好的
那就只能做夢了
巧了,今天又看到一個
【大模型的不可能三角】
嘿嘿,風光無限的大模型
也逃不過三角形魔咒呀
成本指的是企業大模型落地的整體費用,包括大模型的訓練成本、推理成本以及部署、運維和升級成本等。
企業有時僅關注有形成本:例如GPU購置費用、消耗的電費,或從第三方服務商購買模型服務的費用;而會忽略無形成本:包括為實現大模型服務而配置的人力成本,以及大模型在部署、訓練或調試階段消耗的時間成本等。
核算成本時,需要考量總持有成本,特別是不要忽略無形成本。按成本從高到低,一般為深度研發大模型、微調、RAG、提示詞工程、直接調用。
效果指的是大模型生成內容的質量,包括內容的準確性,是否存在幻覺問題,或是否會生成不合適的內容。
大模型效果可以基于“3H”原則進行評價:1)Helpful:內容可用有幫助,不要廢話連篇、泛泛而談;2)Harmless:內容合規無害處,符合倫理規范和監管要求;3)Honest:內容正確無幻覺,不要一本正經地胡說八道,甚至給出錯誤信息。
通常來說,大模型的參數規模越大,生成效果越好。因此,當業務需求對生成內容質量要求嚴苛時,應盡量選擇參數規模更大的模型。
此外,目前市場上主流商業化模型的效果,大多優于同期同參數規模的開源模型。
性能指的是大模型服務的速度,包括大模型的訓練速度,推理時的響應速度、生成速度等。
一般而言,大模型的參數規模越大,則需要的訓練時間越長,即訓練速度越慢,而其進行推理服務時的需求響應速度和內容生成速度也越慢。
因此,大模型的效果和性能不可兼得,當成本固定時,大模型的選擇主要是在效果和性能之間進行平衡和取舍。對于性能要求較高而對效果有一定容忍度的場景,可以選擇參數規模相對較小的大模型。
來源:GenAI技術落地白皮書
當然,這個三角很好
讓癡迷大模型的甲方們認清現實
更加理性的去選擇大模型落地路徑
在成本、效果、性能間進行權衡和取舍
這三角不是我杜撰出來的
來自于我今天剛剛讀到的一份報告
《GenAI技術落地白皮書》
新鮮出爐,干貨不少
這份白皮書是阿里云研究院出品的
但幾乎沒有夾帶任何“私貨”
更沒有吹自家的通義大模型多NB
而是站在客觀立場,從企業視角出發
講述大模型在企業落地的關鍵點
包括“選-育-用”三段論
基本上,做好這三步
企業的大模型,就算沒白上
比如:在選擇階段
如何評估各種技術路線
如何權衡不可能三角
比如:在培育階段
如何利用提示詞工程、RAG、微調
來進行大模型工程化適配
每種方式的優劣和成本如何考量
比如:在使用階段
企業的基礎設施該如何建設
業務流程如何升級
GenAI時代的DevOps如何運轉
大模型的安全與合規問題如何保障
總之,這份白皮書,站在企業視角
從大模型選擇、適配、優化、業務整合
再到基礎設施搭建、開發運維、模型安全
覆蓋了整個生命周期
給出了很多真知灼見
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.