昨兒夜里刷到一條熱搜,把我驚得差點把手機摔了——阿里巴巴這回搞了個大動作,直接把自家王牌視頻生成模型萬相2.1整個開源了!消息一出,美股阿里巴巴直接暴力拉升,連馬斯克都轉發評論區湊熱鬧。要說這年頭AI圈最卷的,真不是搞文本生成的那些老家伙,現在連視頻賽道都殺成紅海了!
要說這萬相2.1有多猛?咱們先看個直觀案例。去年春晚上《難忘今宵》那個花燈特效,就是它畫的背景。當時我盯著電視屏幕還以為是特效組熬了三天三夜,結果人家AI分分鐘搞定。更絕的是這次升級后的"水墨變福"特效——你輸入一句"紅色宣紙暈染出福字",它不僅能生成動態視頻,連毛筆飛白、墨色漸變這種細節都能精準拿捏。有網友說這簡直是給Adobe After Effects裝了個永動機,美圖秀秀的老板估計得連夜改PPT。
不過最讓老外直呼內行的,是這玩意兒對中國風的深刻理解。之前OpenAI的Sora雖然能生成視頻,但用中文描述"江南水鄉煙雨朦朧"這種意象,經常會出現水土不服的情況。萬相2.1直接內置了東方美學基因,就像給AI安了個文化濾鏡。有業內人士爆料,他們團隊專門收集了十萬條中國傳統藝術視頻做訓練數據,這才練就了這身"文化功底"。
要說技術突破,得提兩個硬核配置。14B的大模型專業搞創作,1.3B的小模型直接讓普通玩家8G顯卡就能玩轉480P高清視頻。這讓我想起前兩年搞AI繪畫的老張,當時他吭哧吭哧攢錢買的RTX 4080,現在看來都貶值到姥姥不認得了。更刺激的是,這開源代碼是真·全量開源,連權重參數都不藏著掖著,這就相當于把米其林大廚的菜譜公之于眾,以后學做菜的直接照著抄就行。
不過這事兒最值得細品的,是阿里這波操作背后的陽謀。要知道前陣子DeepSeek搞了個開源周,五天連發五個代碼庫,現在連蘋果都憋不住要推AI升級。萬相2.1這時候開源,明顯是要在視頻生成領域卡位。有分析師算過一筆賬,Sora每秒生成視頻要燒掉0.5美元,而萬相開源后估計能讓成本直接砍半。這就好比電商大戰突然有人把運費全包,整個行業不得重新洗牌?
爭議點當然也有。有人說開源雖然降低了門檻,但會不會導致技術同質化?就像手機廠商都在卷攝像頭像素,最后大家都在比誰堆料更狠。另外,那些靠閉源模型收會員費的廠商怎么辦?比如Adobe剛推出的Firefly,估計得連夜改收費策略。不過也有大佬站出來力挺,硅谷工程師Mike就吐槽:"以前我們總抱怨AI貴得離譜,現在終于能體驗真正的普惠科技了。"
要說這波開源潮的最大贏家,還得是普通創作者。以前想做個短視頻特效,要么花幾千塊買專業軟件,要么被各種中間商坑。現在好了,注冊個Github賬號就能下載最新模型,連大學生宿舍里拿筆記本都能搞創作。有位B站UP主試了萬相2.1,用宿舍電腦生成了個賽博朋克風格的城市宣傳片,播放量直接破萬——這要是擱兩年前,得請半個團隊才能干成。
不過話又說回來,技術再先進也得接地氣。就像去年大火的AI歌手,雖然能模仿周杰倫唱歌,但總讓人覺得少了點靈魂。萬相2.1這次主打的"聽懂中國話"功能,能不能真正理解導演的腦洞呢?有影視公司測試過,當輸入"要表現角色猶豫時的眼神變化"這種抽象描述,生成的視頻居然能通過80%的專業打分。這要是用在網劇拍攝里,估計劇組能省下三分之一的拍攝經費。
站在行業風口浪尖,這場開源大戰才剛剛開始。OpenAI的GPT-4.5還沒露面,Anthropic又整出個Claude 3.7 Sonnet,亞馬遜Alexa的AI升級更是箭在弦上。不過對于咱們普通觀眾來說,最實在的福利就是能免費享用這些技術成果。就像網友說的:"以前覺得AI離我們很遠,現在才發現它已經悄悄把門檻踩到了腳下。"您說是不是這個理兒?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.