01
量子學派,你這個渣男!
一向以鋼鐵著稱的理工直男“量子學派”,
一直聲稱對數理哲的激情,遠超與異性的關系。
一生牽手牛頓,終生只愛圖靈。
可近日被曝光與多名女子KISS!
親密照火遍全網!
More
人模狗樣的量子君
照片中的美女們,
要身材有身材,要美貌有美貌,性感而酷颯。
而且,在同一時間內多名女性交往。
詭辯無用,有圖有真相。
量子學派,你這個渣男!
AI繪畫對人類的沖擊,
不僅僅只有上面這個渣男。
2023年9月,深圳地鐵站,
乘客抬頭即現AI短片。
首屆AI FASHION WEEK紐約時裝周,
70%的服裝使借用AI設計。
各大社交短視頻平臺,
開始簽約AI繪畫創造的美女主播
這些日前的過去進行時,
正以光速滲透至人類的商業世界與現實生活。
AI FASHION WEEK紐約時裝周
02
AI繪圖的技術本質
在AI繪畫背后的技術黑匣子里,到底藏著什么?
其實,AI幾秒成像魔力背后,是先做加法再做減法的自虐過程。
做加法,指前向階段對圖像逐步施加噪聲。
直至圖像被破壞變成完全的高斯噪聲,導致信息衰減。
把與主題相關的顏色形狀信息通通加上,不去判斷匹配或不匹配。
做減法,指反向過程對圖像逐漸降噪,從噪聲中重構所需的數據樣本,使模型在給定噪聲輸入的情況下學習生成新圖像。
即逐步減去前向階段添加的冗雜色塊,在此過程中學習每個色塊的意義。
最終將這些意義經驗,積累成自己的大模型數據庫。
當大模型成型,AI學成出山與人類打交道時。
只需將人類的需求指令 ,與大模型數據庫進行對應連線,即可幾秒成像,驚艷世人。
AI的繪畫學習邏輯與人類大相徑庭。
人類大腦共有860 億個神經元,每一個神經元都與其它神經元有數十個至上千個的鏈接。
所以,我們可以從無到有地進行:
線條、素描、構圖、上色的學習
近乎自動化地賦予每個色塊意義,并作出繪畫反應。
而AI計算機的數字邏輯電路,只能理解二進制中的0和1。
因此只有在不斷降噪的過程中,讓AI理解每個色塊的數據意義。
并不斷積累到自己的大模型數據庫中,最終才能做出對人類來說輕而易舉的繪畫行為。
所以,AI不是從無到有地進行繪畫學習。
它是從密密麻麻的涂鴉中,學會了被壓在底層的顏色幾何形狀用法,最后才能做到根據指令生成圖畫。
03
噪聲會很吵嗎?
在現實生活中,絕大多數的隨機并非均勻分布。
正態分布,是連續型隨機變量中最重要的分布。
如同一條鐘形曲,中間高,兩邊低,左右對稱。
大部分數據集中在某處,小部分往兩端傾斜。
帕累托法則、橄欖型收入分布、壟斷性企業分布等隨機分布,都是正態分布。
比如說,在某些國家里:
20%的大城市中居住80%人口、20%人口掌握80%社會財富。
這就是真實世界中的“隨機”。
正態分布,也稱高斯分布。
正態分布的概率密度函數也可以稱為高斯函數。
從一個均值為0、標準差為1的標準正態分布中隨機抽取樣本,生成一組符合該分布的隨機變量,這組變量就稱為標準正態分布隨機變量。
以下這組隨機數,仔細觀察可以發現他們大部分都接近均值零。
只有小部分超出了正負一個標準差的范圍,這樣的隨機變量即高斯噪聲。
在AI的繪畫學習過程中,正是在不斷去除冗雜信息時,習得獲取核心信息的能力。
04
3分鐘拆解前向過程
在一杯水中,加入一滴墨水。
物質粒子便從高濃度區域向低濃度區域移動,這就是熱力學中的分子擴散現象。
AI繪畫技術受擴散現象啟發,通過逐步向圖片中加入高斯噪聲來模擬這種現象。
即對原始圖像通過逐步添加方差為βt的高斯噪聲變成純噪聲圖像,從而達到破壞圖片的目的。
可以將以下公式看作擴散器,用其對圖片加噪來模擬逐步擴散的過程。
開始時,墨水滴入清水中。
逐漸擴散開來,水變得混濁。
即原始圖像x0經過以上公式處理后,得到圖像x1。
墨水的擴散,使得水中的顏色逐漸改變,圖像的細節模糊化。
接下來,將得到的混濁水作為新的狀態,再次滴入一滴墨水。
墨水在水中擴散,使得水變得更加混濁,即將x1圖像經過以上公式處理后得到x2圖像。
對于任意的x(t-1)圖像,我們都可以將其作為新的狀態,代入公式進行迭代,得到xt的圖像。
每次迭代中,墨水的擴散使得水變得更加渾濁,即噪聲使得圖像的細節更加模糊。
在這個過程中,每一步中的β并不相同,βt最開始是某個接近0的數字,然后逐步遞增至接近1。
因為墨水的擴散速度會越來越快,使得水變得更加渾濁,圖像的特征也更加模糊。
為何一定要加噪點模糊原始圖像?
每張圖片都可以用RGB紅綠藍3個通道表示,一張1000×1000像素大小的圖片。
在計算機的眼中,可被轉化為1000x1000x3的一組數字。
對于計算機來說,讀取3000000枚數據很容易。
但是若把它放在算法中,對這個算力有相當高的要求。這種級別的算力,大眾顯卡無法承擔。
所以為了解決這個問題,需要先進行加噪點為圖片降維。
減少算力需求,讓AI繪畫具備在消費級顯卡上運行的可能性。
通過循序漸進為圖片添加噪點來不斷訓練AI,讓AI從滿是噪點的圖片中執行降噪。
使其掌握提取關鍵信息、識別圖片內容的能力,這是需要先做加法的另一個原因。
一旦AI學會抓取重點信息,摒棄次要信息,所需要用到的數據量相對原圖來說就變得非常小。
所以AI可以學習更多的圖片,而眾多的圖片通過AI的學習和分類,就被打包成了我們當前大熱的“模型”。
05
3分鐘拆解反向過程
反向過程,是不斷去除噪聲的過程。
給定一個噪聲圖片,對其一步步的去噪還原,直至最終將原始圖像恢復。
從第T個timestep開始,模型的輸入為Xt與當前的timestep t。
模型中蘊含一個噪聲預測器(UNet),它會根據當前的輸入預測出噪聲,再將當前圖片減去預測出來的噪聲,就可以得到去噪后的圖片。
重復這個過程,直到還原出原始圖片為止。
AI通過原始圖片在去噪中不斷顯露,學會了繪畫技法,這是對人類繪畫的神奇逆練。
什么是噪聲預測器(UNet)?
UNet是一種深度學習模型,最初用于解決醫學影像分割問題。
它的結構特點是U字形,因此得名UNet。
UNet模型由編碼器(Encoder)和解碼器(Decoder)組成:
編碼器負責逐步壓縮輸入圖像的大小,提取圖像的高級特征表示。
解碼器則逐步還原壓縮后的圖像大小,恢復圖像的細節信息。
編碼器部分,通常由卷積層和池化層組成,用于逐步降低圖像的空間分辨率和提取特征。
解碼器部分,通常由反卷積層和跳躍連接(skip connections)組成。
跳躍連接,將編碼器中的特征圖與解碼器中的對應層進行連接,確保在推理和還原圖片信息時,不會丟失掉之前步驟的信息。
反向過程的降噪程序對應到SD中,即“采樣迭代步數”“采樣器”參數的來源。
采樣器,指用于在生成圖像的過程對圖像進行去噪聲的方法。
去噪的方法有很多種,通常需要在速度和準確性之間做出權衡。
采樣步數迭代,指降噪的次數,即生成圖像需要的步數,
每一次采樣步數,都是在上一次迭代生成的圖像基礎上生成一張新的圖片。
一般來說,采樣迭代步數設置在20-40之間即可。
06
數據構成的畫有價值嗎?
實現AI生成圖畫,需要兩個條件。
首先,必須有一個足夠大的降維數據庫,
能夠快速提供運算的圖片,即模型。
模型在前文提到的加噪降噪過程中逐漸練成。
其次,讓AI把人類需求轉為數據之后,需要在圖片數據庫中進行精準連線。
在模型中找到符合要求的圖片,進行創作。
所以,AI繪出的圖畫本質上是一堆數據集。
那AI繪畫到底有沒有價值?
No.1
價值一:生長1.5個大腦
傳統工作流,在創意發散階段點子有限,組織頭腦風暴會動輒幾個小時。
當掌握了ChatGPT等大語言模型后,它就可以很好的扮演一個創意助手的角色。
當我們需要發散創意的時候,可以分分鐘就能產生幾十個不同的思路。
除了文字idea,也可以發散一些畫面創意。
比如:確定了大致的元素和畫面,通過參考圖和關鍵詞,
利用圖片模型生成海量的圖片創意,進一步開拓設計師的思路。
No.2
價值二:提速器
甲方領導對畫面想法多,訴求不明確,給出的方向過廣
想要設計出多版設定看效果,但時間不允許怎么辦?
可以用生成式AI工具快速產出多版接近成稿的設定。
STEP1:
以中秋為例,提煉相關元素——中秋、嫦娥奔月、月餅、禮物盒、圓月、燈籠、玉兔、家人團聚賞月、煙花等元素;
STEP2:
開始嘗試“拆盲盒”,通過Midjourney生成想要風格的對應元素:一位美麗的仙女,騎著玉兔在云彩中翱翔。
STEP3:
快速拼合元素由于只是設定階段,快速合成大感覺即可。細節不好的地方,可以用多張圖取長補短來合成。
No.3
價值三:拓展能力圈
AI可以拓展我們的能力圈,跨職能完成一些以往需要開發介入才能完成的工作。
我們以一張設計3D科幻風格海報為例。
STEP1:
根據既定的設計風格,選擇相關的模型。
【大模型】此次選擇的是Rev animated作為大模型,作為萬能模型可以較好的適配各種風格場景。
除此以外,也可以選擇與目標設計風格接近的大模型。
【lora模型】主要使用的是Xsarchi_127作為主要lora模型,Lunarpunkai為輔助模型。
STEP2:
關鍵詞描述:書寫關鍵詞時,可參考lora模型效果圖中生成圖的關鍵詞,再根據自己實際情況進行增加與刪減,這樣會比較省心省力。
STEP3:
Controlnet設置:主要使用了Depth這個模式,可以根據生成效果多做組合搭配。
STEP4:
采樣器推薦使用:eulera、DPM++2M Karras、DPM++SDE Karras。
STEP5:
生效成果,不同模型不同lora在某個細節表現上都會有優勢的地方。
同樣參數同樣模型下,前后生成的效果也可能不一樣。選擇一個較滿意的效果作為基礎圖,嘗試切換其他lora繼續生成。擇優合成到基礎圖中。
STEP6:
最終合成效果,一些高級的創意,用傳統的美學工具我們很難完全執行落地,借助AI則可以突破自己的能力限制。
No.4
價值四:賺固定工資以外的錢
AI的能力有多強,在于AI‘懂’你的能力有多強。
學會“調教”AI,掌握與AI對話從而調用知識的能力,
便能掌握駕馭AI的魔法,率先吃上AI的第一口紅利。
AI 新時代,信息碎片化和信息差,
使得獲取高質量的信息和數據,
變得十分困難。
最好最直接的辦法,
就是與行業高手交流學習!
量子學派聯合工信部人民郵電出版社,
歷時180天打造,
邀請國內AIGC行業頭部大佬。
誠意推出這門——
免費「AI前沿工具的直播訓練營。」
前300強數字人企業技術創意總監王澤武,
帶你實踐以下硅基封面AI視頻,
構建一個人的媒體帝國!
從入門到實踐一站式打通。
往期學員作品+反饋
陪伴式服務
助教陪伴式服務
「督學+知識拓展+社群答疑+一對一輔導」
貫穿整個學習周期,
保證每個學員的學習進度和學習質量,
確保最終的技能交付質量。
在AIGC訓練營中,你能學到什么?
No.1
掌握向AI“提需求”的能力
這次課程,與市面上的工具課不同。
它提煉了訓練AI最核心的技巧,注重訓練向AI“提需求”能力。
教你與AI高效對話的模板,簡單的提問公式或者幾個提示詞,就能讓AI秒出成果。
根據老師教授的方法,可立刻產出高質商品圖。
No.2
提升個人能力,經濟選型“保住飯碗”
其次,這門課程還將讓你學會如何利用AI工具結合日常工作、學習,實現個人能力的暴增:
a.為你解析AI時代會對普通人造成什么影響;
b.如何抓住AI帶來的機遇開啟小事業?
c.為你演示AI設計的多種使用場景和應用渠道。
同時,我們會通過實戰案例。
讓大家體驗用AI工具完成變現,增加睡后收入:
a.為你講解市面上最火的AI繪畫工具的用法;
b.AI軟件如何一分鐘高效做出可變素材;
c.沒有基礎的小白,如何利用AI快速變?
現在就和我們一起走進AI,成為第一批駕馭AI的人!
No.3
AIGC:一站式持續成長方案
AI如同一個六邊形戰士,當你有一個絕妙點子,它能隨時點亮技能樹,用編程、寫作、繪畫等技能把你的想法落地:
? AI智能對話實訓,打造AI高效辦公助理
? AI繪畫專項實訓,讓你的商業設計落地
? AI高階部署實訓,靈活定制個人AI需求
? AI商業變現實戰,多開拓副業賺錢渠道
在「AI+」時代,
我們不妨在技術上開掛,
在作為人類的獨有優勢上加碼,
做那個被AI解放的人!
用AI重塑你的核心競爭力!
即刻掃碼預約
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.