大家好,今天繼續和大家分享科技圈最近發生的那些事兒!
一、女博士 OnlyFans 創業
這事看著還挺離譜...
美國一位名叫扎拉·達爾(Zara Dar)的計算機科學女碩士因放棄攻讀博士學位,轉而全職經營 OnlyFans 平臺,成功賺取百萬美元并還清學生貸款。
她擁有計算機和生物學位,曾在 YouTube 上創建頻道講解神經網絡、機器學習、梯度下降等知識:
Zara Dar 在德克薩斯大學取得計算機碩士學位后,繼續攻讀計算機科學博士學位。
起初只是把 OnlyFans 當副業,但隨著收入的逐漸增長,她選擇退學全職經營。
這一決定讓她在短時間內賺取了 100 萬美元,并還清了家里的抵押貸款。
二、ColorFlow
對于喜歡畫漫畫的人來說,給黑白線稿上色,是一項既耗時又需要高超技巧的過程。
好在AI算法不斷更迭,這樣的工作交給AI,可以極大提高工作效率。但目前的AI在處理線稿序列的時候,可控能力還是有些差的,一方面是很難保持角色顏色的一致性,另一方面是配色天馬行空,生成的作品可能不是最合適的。
為了解決上述問題,清華大學聯合騰訊提出了ColorFlow,一個全新的圖像自動上色方法!
ColorFlow是一個基于擴散的三階段框架,不同于現有需要對每個身份進行微調或顯式身份嵌入提取的方法,是一種新穎且具有高度通用性的檢索增強上色流程,用于對圖片進行相關色彩參考的上色。
具體的實現流程分為三步:增強檢索流程(Retrieval-Augmented Pipeline,RAP)、上下文內上色流程(In-context Colorization Pipeline,ICP)和引導超分辨率流程(Guided Super-Resolution Pipeline,GSRP)。每個部分都很重要,它們共同保證了在黑白圖像序列中,物體的顏色保持一致,同時實現高質量的上色效果。
ColorFlow也和其他的工作進行了對比,可以看到最左側是原始圖像,第二列是黑白圖像,參考圖像即為原故事已有的色彩圖像,可以看到ColorFlow生成的作品,還原度和藝術感非常高。
如果你感興趣的話,可以訪問 ColorFlow 的主頁自行體驗一下。
官方地址:
https://zhuang2002.github.io/ColorFlow
在線體驗Demo:
https://huggingface.co/spaces/TencentARC/ColorFlow
三、MEMO
我在今年七月份介紹過Echomimic,僅需一張圖片 + 一段音頻,就能生成一段數字人視頻。
https://mp.weixin.qq.com/s/KdgsIbDW1Sfp-JP0vSLNGg
現在,比Echomimic更自然更具表現力的算法出現了,那就是MEMO,是由Skywork、南洋理工大學和新加坡國立大學共同推出的音頻驅動肖像動畫框架。
這是官方主頁上提供的demo示例,音唇同步保持的很好,整體很生動自然。
MEMO是一個端到端的音頻驅動擴散模型,用于生成身份一致且富有表現力的對話視頻。MEMO主要有兩個組件:參考網絡(Reference Net)和擴散網絡(Diffusion Net)。MEMO的主要貢獻在于擴散網絡中的兩個關鍵模塊:記憶引導的時間模塊和情感感知音頻模塊,它們共同作用從而實現音視頻同步并生成自然的表情。
MEMO 支持英語、普通話、西班牙語、日語、韓語和粵語等多種語言。如果你感興趣的話,可以訪問 MEMO 的主頁自行體驗一下。
官方地址:
https://memoavatar.github.io/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.