2023年初,大模型的橫空出世,為世界帶來無比的震撼,也讓我們愈發相信生成式AI會改變整個世界的運行軌跡。
但兩年來,大模型的創新似乎陷入泥沼,萬眾期待的顛覆性并沒有出現,反而逐漸進入到漸進式創新的軌道。尼古拉斯·尼葛洛龐帝在《數字化生存》中寫道:漸進思想是創新的最大敵人。
正是要改變這種局面,向大模型的漸進式創新 say NO,在今年的亞馬遜云科技 re:Invent大會上,亞馬遜云科技發布了全新自研基礎模型Amazon Nova,接過大模型時代創新的“黃色領騎衫”。
01
讓大模型創新不再“遙不可及”
科技文明的進步,一方面依賴技術創新,另一方面則要依靠技術的普惠。只有將技術的應用成本逐漸降低,才能盤活生態,讓更多的組織和人參與到廣泛的技術創新當中來,才能最終推動科技文明的演進。
在大模型時代開啟以來,創新的進展并沒有如業界所想象的那樣快,高昂的成本因素是讓很多創新者望而卻步的主要原因。
亞馬遜云科技剛剛發布的AI 基礎模型“Amazon Nova”,正在帶來模型應用的技術普惠。
根據亞馬遜云科技公布的數據,AmazonNova的每百萬token的輸入價格低至0.0175美元,輸出價格低至0.07美元??!相比于業界主流的基礎模型,使用成本可以大幅降低75%。
這是一次巨大的突破,為什么呢?
我們知道,決定大模型應用深度的是推理側的發展。而大模型在處理復雜推理任務時,往往伴隨更高的計算、存儲的資源依賴,和更高的數據量和更精細的數據處理需求,導致模型使用的成本居高不下,限制了AI推理側的應用創新。
而Amazon Nova在使用成本上的明顯優勢,在處理復雜推理任務時具有很高的成本效益,在諸如分析復雜文檔、視頻,理解圖表、示意圖,生成高質量的視頻內容等應用上具備明顯優勢,這就減輕了模型使用者的創新成本。
當然,更高的性價比,并不代表性能更低。相反,在多項基準測試中,Amazon Nova Pro成功超越了GPT-4o,顯示出其在性能上的強大競爭力?。同時?AmazonNova系列模型支持任意模態輸入和輸出,能夠處理文本、圖像、視頻等多種類型的數據,適用于多種應用場景。
?以性價比作為Amazon Nova的突破口,其實也并不是無的放矢。據悉,亞馬遜云科技內部構建的AI應用中,開發者需要處理多種類型的數據,并且希望有更低的延遲、更低的成本、具備微調能力等。正是注意到了開發者和用戶的切實需求,Amazon Nova最終以高性價比的形態,并以多樣化的模型選擇,來開這場基礎模型應用的“普惠”之路。
02
面向更多場景,為大模型“瘦身”
Amazon Nova之所以是系列基礎模型,是源于對用戶需求的理解。
客觀地說,模型并不是越大越好,由于不同應用場景對模型的需求各異,大模型并不能適用于所有情況。在選擇模型時,需綜合考慮任務需求、數據規模和成本效益等因素,找到最適合的模型平衡點。
大模型也要“瘦身”,針對具體任務要求,匹配不同的模型已是大勢所向。
正是基于此,Amazon Nova 系列提供了六種大模型,其中包括四種基礎模型,以及生成圖像和視頻的兩種視覺內容生成模型。
首先,Amazon Nova Micro 模型就是典型的“瘦身”模型,作為一個純文本模型,它擁有最輕的體量。可以在 Amazon Nova 系列模型中以極低的成本提供最低的延遲響應。據了解,Amazon Nova Micro模型的上下文長度為 128K 個令牌,并針對速度和成本進行了優化,在文本摘要、翻譯、內容分類、交互式聊天和頭腦風暴以及簡單的數學推理和編碼等任務上表現出色。
對于開發者的日常簡單任務處理,Amazon Nova Micro模型就完全可以勝任,且速度更快,成本更低。
其次,Amazon NovaLite 模型是一個高效且經濟的多模態模型,具備強大的圖像、視頻和文本處理能力。模型同樣以低成本著稱,支持高達300k的上下文或長達30分鐘的視頻輸入,能夠快速且準確地生成文本輸出。
比如在內容創作方面,Amazon Nova Lite模型能夠將多媒體內容轉化為文本描述,幫助用戶輕松實現內容的創作和編輯。同時,該模型還能夠從圖像和視頻中提取關鍵信息,并將其轉化為文本形式,為新聞、廣告、娛樂等行業提供了重要的應用價值。
第三,Amazon Nova Pro模型同樣是一個功能強大的多模態模型,它支持處理廣泛的任務,能夠在準確性、速度和成本之間實現絕佳平衡。對用戶而言,Amazon Nova Pro模型可以顯著提升內容創作和處理的效率,支持圖像、視頻和文本的快速理解和生成,助力用戶高效完成各種復雜任務。此外,Amazon Nova Pro還支持自定義微調,能夠根據用戶的數據和需求進行個性化優化,提供更加精準的響應和輸出。
第四,Amazon Nova Premier模型號稱是最強大的多模態模型,其特點在于能夠處理復雜推理任務,具備卓越的性能和準確性。從用戶的角度,Amazon Nova Premier模型可以作為“教師模型”使用,幫助用戶蒸餾出定制化的專用模型,以滿足特定任務的需求。
另外,兩個新發布的Amazon Nova模型,分別是:圖形生成模型Amazon Nova Canvas和視頻生成模型Amazon Nova Reel,可用于提升宣傳廣告的創意。比如Amazon Nova Canvas支持生成和編輯圖像,提供配色方案和布局控件,并內置有安全控件,用于可追溯性的水印和用于限制有害內容生成的內容審核。
Amazon Nova Reel可根據關鍵詞或可選的參考圖像生成6秒視頻,支持用戶調整攝像機運動以生成具有平移、360度旋轉和縮放的視頻,據悉可制作2分鐘視頻的版本即將推出。
03
站在用戶視角做創新
創新的“第一性原理”要回歸業務的本源和本質,并從用戶需求處入手,這意為一種用戶視角。
過去一些新的產品推出,總是“我能提供什么樣的服務?”而站在用戶視角的“第一性原理”,這個邏輯就變成了“用戶需要什么樣的服務?”,這其實應該是未來創新的一種思維轉變。
在筆者看來,Amazon Nova系列模型,就是站在用戶視角做創新的典范。
第一,通過多樣化的模型系列,涵蓋了文本、圖像和視頻生成等多個領域,使得Amazon Nova能夠滿足不同客戶的多樣化需求,無論是處理簡單文本任務還是復雜創意內容生成,都能找到合適的模型。
第二,通過高性能與成本效益的平衡,拉低了模型使用的“門檻”。讓更多開發者和用戶有能力參與到模型推理的創新中來。
第三、在創意內容生成方面,Amazon Nova系列也展現出了強大的實力。如Amazon Nova Canvas模型能夠通過文本提示生成并編輯專業級別的圖像。而Amazon Nova Reel模型則提供了視頻生成功能,可以創建長達6秒的視頻內容。這些功能Nova在廣告、營銷或培訓內容創作等領域擁有了廣泛的應用前景。
第四、安全性與負責任的AI應用。所有Amazon Nova模型中都植入了內容審核和水印等安全措施,以防止有害內容的傳播。此外,亞馬遜云科技還推出了AI服務卡(Service Cards),以提供關于使用案例、限制和負責任的AI實踐等信息。這些措施有助于確保Amazon Nova系列模型在應用過程中的安全性和合規性。
第五、無縫集成與便捷的開發環境。對于企業用戶來說,Amazon Nova系列最具吸引力的特點之一是其與亞馬遜云科技基礎設施的無縫集成。通過Amazon Bedrock平臺,企業可以直接對這些模型進行微調和知識蒸餾,使其更好地適應特定的業務需求。
第六、持續的創新與發展規劃。亞馬遜云科技在推出Amazon Nova系列模型的同時,也展示了其持續創新和發展規劃。例如,計劃在2025年推出Speech-to-Speech模型(語音到語音)以及Any-to-Any模型(即支持跨文本、語音、圖像和視頻的多模態轉換)。這些新的模型將進一步擴展Amazon Nova系列的應用場景和功能范圍,為用戶帶來更加便捷和智能的體驗。
無疑,AI時代的創新將是一次漫長的過程,但我們不能因為它的周期漫長而失去創新的“爆發力”,亞馬遜云科技對Amazon Nova系列模型的技術普惠,和一攬子的創新,證明了其正站在大模型創新的山巔之上。
*前述特定亞馬遜云科技生成式人工智能相關的服務僅在亞馬遜云科技海外區域可用,亞馬遜云科技中國僅為幫助您發展海外業務和/或了解行業前沿技術選擇推薦該服務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.