99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

最強視覺生成模型獲馬斯克連夜關注,吉卜力風格轉繪不需要GPT了

0
分享至

  • 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

“史上最強視覺生成模型”,現(xiàn)在屬于快手。

一基雙子的可靈AI基礎模型——文/圖生圖的可圖、文/圖生視頻的可靈,都重磅升級到2.0版本。

  • 可圖2.0,對比MidJourney 7.0,勝負比「(good+same) / (same+bad)」超300%,對比FLUX超過150%;
  • 可靈2.0,文生視頻對比Sora勝負比超360%,圖生視頻對比谷歌Veo2勝負比超180%。

新版本當中,兩款模型的語義遵循能力和美學能力均大幅提升,還新增了圖像編輯、風格轉繪等一系列新功能。

并且一如既往堅持不搞期貨,發(fā)布會一結束,兩款模型及新功能就立即上線可用。

模型發(fā)布后,也引發(fā)國內外廣泛討論,就連馬斯克也在X上連夜關注了可靈AI官方賬號。



實測可圖全新升級

在過去,MidJourney生圖+可靈圖生視頻是一種常用的創(chuàng)作工作流。

但隨著可圖的全新升級,創(chuàng)作者們可以告別MidJourney,在可靈AI的平臺內完成這一系列操作了。

相比前一代模型,可圖2.0基礎模型的第一個亮點,就是語義遵循能力大幅提升,具體又可以分為三個方面——

復雜元素響應更精準、鏡頭語言設計更合理、畫面細節(jié)表現(xiàn)更豐富。

話不多說,直接看案例:

  • 黑白照片,少女照鏡子,鏡子里映出她老年的樣子,寫實攝影,左右對比,側面構圖,電影光照,一位白裙少女正在一個復古圓鏡前照鏡子,倫勃朗光照,景深攝影。

這組提示詞設置了“現(xiàn)實”中的少女樣貌和鏡子中老年形象的反差,這樣的場景是一種藝術設計,在真實世界中并不存在。

即便如此,可圖2.0還是按照提示詞中的要求完成了創(chuàng)作,構圖、顏色等設置也都滿足提示詞要求。



相比之下,前一代生成的圖片,除了確實有一位少女和一個鏡子之外,和提示詞幾乎沒有什么關聯(lián)。



再看第二組。

  • 春節(jié),爺爺奶奶,爸爸媽媽,1個男孩,5個人其樂融融的互相聊天,桌上的菜肴豐富。

這個設定看似簡單,但實際上想要讓準確呈現(xiàn)人或物體的數(shù)量,一直以來都不是一件容易的事。

但可圖2.0的作品當中,人物的數(shù)量,以及人和人之間的關系,都完美契合了提示詞的要求。



而前一代產品,四張圖無一例外地出現(xiàn)了6個甚至更多的人物,性別和年齡設定就更隨意了。



內容和細節(jié)之外,可圖2.0對提示詞中的構圖、光線和景別設定的響應,也變得更加精準

  • 一位盤著淺色毛衣發(fā)髻的絕美的東方女性背對鏡頭,倚坐在木質窗邊的扶手椅上,手中的書本在自然光下泛著柔和的紙頁光澤。她的姿態(tài)松弛而專注,淺色長裙垂落椅邊,與窗外險峻的雪山形成奇妙呼應——遠處峰巒正被夕陽染成熔金般的色彩,雪線與藍天交界處泛起淡紫的暮靄,粗獷的自然景觀透過玻璃窗框,化作室內暖色空間里一幅流動的油畫。窗臺上冒著水珠的玻璃瓶和搖曳的燭火,在木紋窗臺投下細長的光影,昏暗的室內環(huán)境,極簡,大面積留白,影視化構圖,光影美學,夢核,迷惑,豐富的細節(jié),逼真,憂郁,悲傷,朦朧,模糊,虛焦,逆光,攝影,寶麗來風格。



在翻譯行業(yè)里,能否做到“信、達、雅”是衡量結果質量的常用標準,放到AI繪圖當中,這套標準也同樣適用。

因為AI繪圖,也可以看作是從文本到視覺信息的一種“翻譯”。

如果說對指令的遵循體現(xiàn)了“信”和“達”,那么可圖2.0的“電影美學表現(xiàn)”,就是在向著“雅”的層次邁進。

來看實測效果。

  • 電影質感,下午一位穿淺色衣服的亞洲男人站在路邊打電話,前景有綠色汽車飛速駛過。光影柔和。參考《重慶森林》電影質感。



  • 電影感,參考《贖罪》風格,樹林里光線明暗交替,一個女生拿著花束,穿著法式綠色紗裙在樹林中奔跑,她飄逸的卷發(fā)隨風飛舞,中景,動態(tài)模糊。



可以看出,可圖2.0在勾勒電影質感時,運用了更高級的色彩及光影,使得情緒表達更具感染力。

另外可圖2.0也進行了多風格化響應,支持近百種風格,無論是古典還是現(xiàn)代、寫實還是夸張、實拍還是動漫都能搞定,包括GPT-4o帶火的吉卜力風也能生成。

  • 白衣劍客動態(tài)姿勢,絲質長袍飄動,劍鋒直指前方。背景懸浮萬劍陣列呈幾何矩陣排列,冷鋼質感伴隨青藍刃光。金色光粒子在氣流中旋繞,柔和的體積光照。強烈明暗對比搭配輪廓光強化肌肉線條。純黑虛空背景增強景深對比。超精細8K渲染,ZBrush級布料雕刻紋理,Octane金屬反射材質。劍身霧氣效果含次表面散射。構圖融合天野喜孝幻想美學、Greg Rutkowski電影級打光與《劍靈》概念設計元素。



  • 新海城風格,穿著運動裝的少女在霓虹閃爍的都市街道上疾速奔跑,飄動的長發(fā)掠過街邊玻璃櫥窗倒影,交通信號燈在暮色中切換成流動的光帶,背包上的掛飾隨著步伐晃動,柏油路面蒸騰著雨后水汽,廣告牌與電子屏的光斑交織成迷離的背景光暈。



不僅模型,可圖這次更新也增加了兩大全新功能——風格轉繪和圖片編輯

下面的這12張圖,就是由同一張圖片,搭配不同風格提示詞,使用可圖轉繪而成的。



而圖片編輯具體包括了局部重繪和擴圖兩個方面。

有了局部重繪,不僅可以對現(xiàn)實中的圖像進行修改,當?shù)玫揭粡堬L格特別好但細節(jié)有瑕疵的圖片時,也不用再從頭開始“抽卡”了。

比如想要把前面展示的年夜飯照片中小男孩手里的魔方換成螃蟹,就可以框選或涂抹目標區(qū)域,然后提出修改要求,就可以等待成果了。



生成的結果是這樣,完成了選中部分的重繪要求,同時未選擇的部分沒有任何變動。



在擴圖功能中,既可以把自己的想法交給可圖實現(xiàn),也可以什么也不說,給定一個比例,讓可圖自行發(fā)揮想象。



擴圖結果,無提示詞

當然,可圖2.0的局部重繪和擴圖并不局限于上面的傳統(tǒng)用法,創(chuàng)作者可以充分發(fā)揮想象力,創(chuàng)造出別具一格的作品。

這里就用一個例子拋磚引玉,更多的玩法就交給創(chuàng)作者們自行探索了~



在可圖模型和功能全面上新的背后,是可靈大模型團隊做出的一系列技術創(chuàng)新。

首先是利用全新升級的文本表征處理鏈路,精準建模預訓練文本到視覺表征的映射,這正是可圖2.0語義遵循能力提升的關鍵。

可圖2.0還采用了自適配圖像Caption構建策略,顯著提升了各階段的學習效率。

此外,可靈大模型團隊還在探索后訓練階段的Scaling Law,對數(shù)據(jù)體系和多樣性進行了全面升級,并應用全新提示詞工程和去噪策略,從而提升模型的表現(xiàn)力。

超越文本,AI創(chuàng)作的新方式

可圖的升級,既是為了更好滿足圖像創(chuàng)作者的需求,也是為了給視頻創(chuàng)作者提供更好的素材獲取途徑。

發(fā)布會上,快手副總裁、可靈AI負責人張迪介紹,在使用可靈生成視頻的用戶當中,有85%使用的是圖生視頻。

但其中涉及到的圖片素材,不一定是拍攝或手繪而成,也可能包括生成結果。

相比于完全由文字生成視頻,圖片能夠體現(xiàn)出文本無法精準描述的細節(jié),從而讓視頻生成模型對目標的把控更加清晰。

因此,這種“曲線救國”的方式,可以降低視頻生成結果的不確定性,減少試錯成本,因此受到了用戶的青睞。

這樣看來,可靈AI團隊不斷打磨圖像生成模型的目的,就顯而易見了。

當然除了可圖,視頻生成模型可靈也進行了升級,針對之前指令遵循不好、動態(tài)效果不佳、美感缺乏的問題做出了全面升級。

可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關性、畫面質量、動態(tài)質量等維度上顯著超越對手。

模型與產品升級之外,快手也在探索一種人與AI之間的新型交互方式。

快手高級副總裁蓋坤表示,文字在表達影像信息時是不完備的,我們需要探索新的方式,才能讓人真正精準地表達出心中所想。

所以在本次發(fā)布會上,可靈AI正式發(fā)布AI視頻生成的全新交互理念——多模態(tài)視覺語言(Multi-modal Visual Language,MVL)。

MVL讓用戶能夠結合圖像參考、視頻片段等多模態(tài)信息,將腦海中包含身份、外觀、風格、場景、動作、表情、運鏡在內的多維度復雜創(chuàng)意,直接高效地傳達給AI。

基于MVL這一全新交互方式,可靈2.0大師版全面升級了視頻及圖像創(chuàng)作可控生成與編輯能力,上線了全新的多模態(tài)視頻編輯功能。

加上之前已有的提示詞優(yōu)化、音效生成、對口型等一系列功能,快手已經初步構建出了從創(chuàng)意到視覺呈現(xiàn)的完整創(chuàng)作鏈路

這不僅讓專業(yè)創(chuàng)作者能夠精準還原腦海中的藝術構思,更讓普通用戶通過“所見即所得”的交互邏輯釋放創(chuàng)作潛能。

讓每個人都能用AI講出好故事

發(fā)布會上,蓋坤再一次講到了可靈的愿景——讓每個人都能用AI講出好故事。

自去年6月發(fā)布以來,可靈AI已累計完成超20次迭代,累計生成1.68億段視頻和3.44億張圖片素材。

在這一過程當中,可靈AI一直堅守初心,不斷提升模型基礎質量和模型效果,并引入更多創(chuàng)新功能,以滿足用戶的多樣化需求。

包括可圖和可靈2.0版本升級,以及MVL的提出,同樣是在掃清“用AI講好故事”的道路上的障礙。

可靈越來越完備的產品體系和工作鏈路,正在讓AI創(chuàng)作變得愈加觸手可得。

甚至為了幫助不懂提示詞的純小白用戶完成創(chuàng)作,可靈還在Web和APP當中接入了經過專門為設計提示詞而調整的DeepSeek模型,進一步降低了AI視頻創(chuàng)作的門檻。

可靈的表現(xiàn)也獲得了大佬的認可,比如馬斯克早在去年八月就曾評論一則由可靈AI制作的內容,稱“AI娛樂產業(yè)正飛速發(fā)展”。



到現(xiàn)在馬斯克連夜關注官方賬號,進一步說明可靈已經徹底打造出了國際口碑。

總之,快手正在用技術讓影像創(chuàng)作回歸本真——專業(yè)者能精準雕琢每個光影細節(jié),普通人也可憑直覺編織動人故事。

當技術逐漸溶解專業(yè)壁壘,那些曾遙不可及的藝術表達,終將成為每個人記錄世界的本能,讓每個平凡瞬間都自帶美學重量。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國新星晉級卻惹爭議!球迷質疑奧沙利文,故意放水,讓著趙心童

中國新星晉級卻惹爭議!球迷質疑奧沙利文,故意放水,讓著趙心童

小李子愛體育
2025-05-04 00:45:34
小獵豹趕走小姨子?張云龍娜扎見父母?田曦薇狂踩宋祖兒?曹駿翻紅了?姨太問答

小獵豹趕走小姨子?張云龍娜扎見父母?田曦薇狂踩宋祖兒?曹駿翻紅了?姨太問答

毒舌扒姨太
2025-05-03 22:16:59
CBA最新消息!古德溫離開山西,張寧確定續(xù)約,韓德君不退役

CBA最新消息!古德溫離開山西,張寧確定續(xù)約,韓德君不退役

體壇瞎白話
2025-05-04 16:24:49
百米飛人博爾特現(xiàn)狀:退役6年生3個孩子,每年400萬美元領一輩子

百米飛人博爾特現(xiàn)狀:退役6年生3個孩子,每年400萬美元領一輩子

煙潯渺渺
2025-05-04 10:54:29
我爸出軌小秘長達42年,我媽不哭不鬧,在他66歲生日當天絕地反擊

我爸出軌小秘長達42年,我媽不哭不鬧,在他66歲生日當天絕地反擊

紅豆講堂
2025-04-22 10:46:51
血賺利物浦最新估值近60億美元,芬威10年收購時才5億美元

血賺利物浦最新估值近60億美元,芬威10年收購時才5億美元

直播吧
2025-05-04 18:57:12
梗知識:什么是“天龍人”

梗知識:什么是“天龍人”

老白讀書
2025-05-04 11:39:56
“300972”,不到1年漲超8倍!誰是下一個內需潛力股?

“300972”,不到1年漲超8倍!誰是下一個內需潛力股?

數(shù)據(jù)寶
2025-05-04 17:52:39
神秘的出席俄勝利日閱兵名單!朝伊印匈不出席就有點古怪了

神秘的出席俄勝利日閱兵名單!朝伊印匈不出席就有點古怪了

大風文字
2025-04-30 08:02:10
胖東來法務部確實牛??!知名博主直言“柴懟懟”,真不懂法還硬剛

胖東來法務部確實牛?。≈┲髦毖浴安駪粦弧保娌欢ㄟ€硬剛

火山詩話
2025-05-04 15:56:08
協(xié)和醫(yī)學院現(xiàn)任領導團隊一覽表

協(xié)和醫(yī)學院現(xiàn)任領導團隊一覽表

鬼菜生活
2025-05-02 20:14:37
“數(shù)據(jù)還是美化過的”,一班57人只有11人正經就業(yè),大學生累了

“數(shù)據(jù)還是美化過的”,一班57人只有11人正經就業(yè),大學生累了

熙熙說教
2025-05-03 21:11:25
得了胃癌后,曹穎不吃盒飯,感嘆:晚上不要吃寒涼的水果和夜宵

得了胃癌后,曹穎不吃盒飯,感嘆:晚上不要吃寒涼的水果和夜宵

清游說娛
2025-05-04 13:42:47
喬欣曬闊太太假期,帶小狗野餐好愜意,微微隆起的小肚子好真實

喬欣曬闊太太假期,帶小狗野餐好愜意,微微隆起的小肚子好真實

鄉(xiāng)野小珥
2025-05-03 02:51:07
扎心了,快船被淘汰后威少羞辱哈登,虎落平陽,只怪大胡子不爭氣

扎心了,快船被淘汰后威少羞辱哈登,虎落平陽,只怪大胡子不爭氣

姜大叔侃球
2025-05-04 11:47:08
真正有遠見的父母,都在給孩子做"多巴胺戒斷",手機癮瞬間消失了

真正有遠見的父母,都在給孩子做"多巴胺戒斷",手機癮瞬間消失了

第一心理
2025-05-04 17:30:22
“燒屏機”在閑魚泛濫成災,價格賊便宜,到底能不能買?

“燒屏機”在閑魚泛濫成災,價格賊便宜,到底能不能買?

金科技觀察家
2025-05-03 17:10:08
美國兵推結果:中美開戰(zhàn)7天后4萬解放軍陣亡,美10多個基地損毀

美國兵推結果:中美開戰(zhàn)7天后4萬解放軍陣亡,美10多個基地損毀

科學知識點秀
2025-05-04 19:07:37
不當調解人,軍援會繼續(xù)!特朗普已經對普京完全失望了

不當調解人,軍援會繼續(xù)!特朗普已經對普京完全失望了

大風文字
2025-05-02 11:56:24
好消息!北京國安官宣恩加德烏了 能在御林軍滿打滿算3年也不容易

好消息!北京國安官宣恩加德烏了 能在御林軍滿打滿算3年也不容易

80后體育大蜀黍
2025-05-04 22:52:10
2025-05-05 00:36:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
10424文章數(shù) 176129關注度
往期回顧 全部

科技要聞

巴菲特:理性看待AI炒作 耐心是關鍵

頭條要聞

胡塞武裝高超音速導彈襲擊以機場 以媒:彈頭大威力強

頭條要聞

胡塞武裝高超音速導彈襲擊以機場 以媒:彈頭大威力強

體育要聞

聯(lián)盟30隊首發(fā)得分后衛(wèi),他只能排第29位?

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同!

財經要聞

一個時代的結束!巴菲特年底將卸任

汽車要聞

小米SU7大優(yōu)惠!5月限時購車權益送輔助駕駛

態(tài)度原創(chuàng)

本地
時尚
數(shù)碼
藝術
公開課

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

卷首語 | 今天,致敬青春,致敬自己!

數(shù)碼要聞

多年來首次設計重構:微軟13英寸Surface Laptop曝光,5月6日發(fā)布

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 博爱县| 龙胜| 江西省| 邢台市| 监利县| 沂源县| 象州县| 龙州县| 辉县市| 鹰潭市| 社旗县| 金阳县| 武汉市| 乌拉特前旗| 辽中县| 中山市| 唐河县| 垫江县| 潮安县| 阳东县| 嘉义市| 资溪县| 泾阳县| 阳城县| 桦南县| 高密市| 二连浩特市| 通道| 高阳县| 灯塔市| 岫岩| 增城市| 马鞍山市| 上犹县| 平定县| 贵州省| 合水县| 河北省| 磐安县| 泸定县| 阳曲县|