網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Google推出的Gemma 2 2B模型可以在手機(jī)、筆記本電腦和臺(tái)式機(jī)等邊緣設(shè)備上運(yùn)行

2024-08-02 06:48:22　來源: 小微模型

北京舉報(bào)

分享至

Gemma2 2B是Google推出的Gemma2系列中一款重量級(jí)的輕量級(jí)A1模型，具有2億參數(shù)。Gemma2 2B 利用了知識(shí)蒸餾技術(shù)，通過從更大、更復(fù)雜的模型中學(xué)習(xí)，將其知識(shí)傳遞到較小的模型中，取得了超出預(yù)期的性能表現(xiàn)。

Gemma2 2B 模型適用于多種文本生成任務(wù)，包括問答、摘要和推理。其相對(duì)較小的體積使其能夠在筆記本電腦、臺(tái)式機(jī)或私人云基礎(chǔ)設(shè)施等資源有限的環(huán)境中部署。

主要能力

1.卓越性能

性能表現(xiàn):Gemma2 2B在LMSYS Chatbot Arena排行榜上超過了所有GPT-3.5模型，可以處理多種文本生成任務(wù)，如問答、摘要和推理，展示了其出色的對(duì)話AI能力。它在同類模型中表現(xiàn)最佳，能夠在實(shí)際應(yīng)用中提供高質(zhì)量的對(duì)話體驗(yàn)。

優(yōu)化:該模型經(jīng)過優(yōu)化，能夠在各種硬件上高效運(yùn)行。這包括各種邊緣設(shè)備、筆記本電腦和強(qiáng)大的云部署，如Google的Vertex Al和Kubernetes Engine。

2.靈活且具有成本效益的部署

硬件兼容性:Gemma2 2B可在從邊緣設(shè)備到大型數(shù)據(jù)中心的廣泛硬件上高效運(yùn)行。它使用NVIDIA TensorRT-LLM庫(kù)進(jìn)行優(yōu)化，支持NVIDIA RTX、GeForce RTX GPU和Jetson模塊，適合名種AI應(yīng)用場(chǎng)景。

經(jīng)濟(jì)高效:其設(shè)計(jì)允許在成本效益較高的硬件上運(yùn)行，甚至可以在Google Colab的T4 GPU免費(fèi)層上運(yùn)行，使開發(fā)和實(shí)驗(yàn)更具經(jīng)濟(jì)效益。

3.模型集成與兼容性

Gemma2 2B 設(shè)計(jì)為與多種主流 AI開發(fā)平臺(tái)無(wú)縫集成，方便開發(fā)人員在不同環(huán)境中使用:

Keras 和 JAX:支持流行的深度學(xué)習(xí)框架，便于模型訓(xùn)練和推理。

Hugging Face:兼容 Hugging Face 的模型和工具，簡(jiǎn)化模型管理和部署,

NVIDIA NeMo 和 Ollama:利用這些平臺(tái)的優(yōu)化功能，進(jìn)一步提升模型性能。

MediaPipe(即將推出):支持實(shí)時(shí)處理任務(wù)，如視頻和音頻流理。

評(píng)估結(jié)果

GEMMA2 2B在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)出色，尤其是在文本生成和問答任務(wù)中。以下是一些關(guān)鍵性能指標(biāo):

MMLU(5-shot, top-1):51.3

Hellaswag (10-shot):73.0

PIQA(0-shot):77.8

BoolQ (0-shot):72.5

ARC-e(0-shot):80.1

TriviaQA(5-shot):59.4

GSM8K (5-shot, maj@1): 23.9

下載地址：https://huggingface.co/google/gemma-2-2b

▲ 滑動(dòng)查看往期內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.