機器之心原創
作者:張倩
「2025 年,多模態生成是一個好方向嗎?」這是一位同學在今年年初提出的問題。
他之所以有此疑問,是因為在找實習時發現,狹義的 AIGC(如視頻生成)崗位較少,就業前景不佳,自己的「底層視覺 + 生成模型」背景不知道怎么才能發揮用武之地。
這位同學描述的情況相信很多同學都遇到過。確實,這兩年 AIGC、多模態生成很火,理論上很多行業都能用上,比如影視、游戲…… 但由于技術發展仍在早期,能經得起商業驗證的場景其實并不多。部分從業者曾在采訪中告訴機器之心,他們和影視行業接觸過,比如拍短劇的導演,但對方表示,目前 AI 相比普通演員仍然不具備競爭力。
不過,并非每個行業都如此悲觀。據我們觀察,至少從三年前開始,多模態生成就已經在廣告等行業成功試水,去年更是給一些大廠帶來了實打實的收益。在這些正向回報的激勵下,不少企業正在加大投入,希望用生成式 AI(尤其是多模態生成)給廣告內容的生產、分發帶來一場變革。對于相關人才來說,這里面蘊含著大量的機會。
生成式 AI + 廣告
一條已經跑通的路線
提到廣告 AI,大多數人首先想到的是用 AI 助力廣告內容的生成。這確實是一項已經開展多年的工作。
2022 年,在 AIGC 這個詞剛剛破圈,甚至還在和元宇宙畫等號的時候,機器之心曾經報道過其在電商領域的應用。當時,電商平臺已經在用生成式 AI 技術做廣告內容的生成,比如幫助商家生成商品文案、對話文本、外呼語音…… 甚至還能生成數字人幫商家賣貨。
在隨后的三年間,生成式 AI 在廣告領域的滲透愈發深入且廣泛。不少廣告平臺都推出了官方的 AI 創作工具,比如亞馬遜的「品牌起名星(助力產品出海)」,「A + 頁面 Gen AI 模塊(生成文案和圖片)」,圖片、視頻、創意生成工具等。這些工具大大提升了廣告內容的生產效率。
此外,還有些平臺對廣告行業的整個流程進行了梳理,把能用 AI 的地方都嘗試了一下,并跑出了不錯的效果。其中比較典型的是「騰訊廣告妙思」。它不僅能通過商品混剪、數字人口播,圖生圖、 商品背景合成、擴圖、特定風格 Lora 等技術助力廣告內容生成,還能在審核、分發等環節幫廣告主降本增效。這就讓生成式 AI 在廣告行業的應用不再局限于內容生產。
其實,如果再放大去看,還有不少環節可以因為生成式 AI 的引入而產生更大的經濟效益,比如能讓廣告主把預算花在刀刃上的廣告推薦
長期以來,廣告推薦一直被視為判別式任務。系統會分析用戶過去的行為記錄,然后通過區分用戶喜歡的內容(正面例子)和不喜歡的內容(負面例子)來訓練模型,從而學會給用戶推薦合適的內容。
但這種傳統做法有兩個明顯的問題。首先,在現實中我們很難知道用戶真正不喜歡什么 —— 畢竟用戶不會主動告訴我們「我討厭這個」。所以系統只能人為地制造一些「負面例子」,假設用戶不喜歡它們。這樣做顯然不夠準確,因為用戶沒點擊可能只是沒看到,而不是真的不感興趣。其次,這種方法只能在現有的內容庫里挑選推薦給用戶,就像在一個固定的商品架子上選東西一樣。這就大大限制了推薦的可能性,無法真正理解和滿足用戶更深層次的興趣需求。
為了解決這些問題,研究者們正在重新思考廣告推薦的本質:如果不把它視為判別式任務,而是生成式任務,效果能做到更好?
確實,從原理上來看,生成式推薦系統不再局限于從現有物品庫中進行選擇,而是能夠根據用戶的個性化需求生成全新的推薦內容。這種系統具備多模態信息處理能力,能夠整合文本、圖像、音頻等不同形式的數據,從而更深入地理解用戶的復雜需求和動態興趣變化,提供更具創造性和個性化的推薦結果。
不過,這個方向也有很多挑戰,比如新用戶或新物品缺乏足夠數據,生成模型難以準確捕捉其興趣;生成內容的相關性與多樣性的平衡;生成的實時性(廣告推薦通常需要毫秒級響應)與計算效率的矛盾等。所以,如果你想投身這個方向,現在正是最好的時機 —— 這些挑戰的存在恰恰說明了創新空間的巨大,而率先解決這些技術難題的人,很可能會在前景廣闊的廣告市場中占據先發優勢。
想切入廣告方向
這里有一個絕佳機會
說到投身這個領域,光有想法還不夠,關鍵是要有合適的平臺來施展。今年的騰訊廣告算法大賽恰好為想要在廣告推薦技術上有所突破的大家提供了一個絕佳的機會。
這次大賽的主題為「智 AI,『薦』未來」,賽題聚焦于「全模態序列生成式推薦 (All-Modality Generative Recommendation, AMGR)」,要求參賽者基于用戶的全模態歷史行為數據(含文本、視覺、協同行為等),預測其下一次可能交互的廣告內容。不過,在技術路線上,參賽者要突破傳統判別式框架,探索生成式推薦創新方案。
廣告推薦疊加生成式 AI,而且涉及多模態,難度簡直拉滿,說這是人工智能在廣告領域最前沿、最具挑戰性的課題之一也不為過。
為了確定這個比賽是否值得參加,我們做了一些調研,發現它至少在三個方向上給了大家參賽的理由。
一是數據。往年參賽的很多同學都提到,之前在學校做項目接觸的都是干凈數據,而且數據量比較小。即使是出去打比賽,拿到的也大多是模擬數據。面對這樣的數據,他們不需要從用戶的角度去思考行為過程,因為數據已經被高度清洗和標準化,用戶行為的復雜性和不確定性都被抽象掉了,算法只需要在理想化的環境中尋找數學規律即可。
但在騰訊廣告算法大賽中,他們拿到的是脫敏后的真實業務數據,里面有很多噪聲以及用戶行為導致的偏差、長尾分布。這就讓他們不得不去思考用戶的行為動機,就像一位同學所說,「你會想得更全,會抽絲剝繭地去想,不停地還原一個具體用戶使用這個產品的過程中到底是怎樣想的,以及可能發生什么樣的突發情況。同樣的行為,有可能有不一樣的含義。」這有助于大家提前培養商業思維和業務敏感度。
二是獎金。本次大賽設有 360 萬人民幣的總獎金池,冠軍團隊獨享 200 萬元,亞軍、季軍以及排名靠前的團隊也有豐厚獎金,可謂誠意滿滿。
三是職業發展。要知道,此次大賽的目的不僅是促進產學研交流,也是為騰訊廣告選拔并長線儲備優秀技術人才。因此,除了獎金,進入決賽的隊伍全員可獲得實習 Offer 并有機會轉正,排名前列的隊伍還有機會獲得 offer 直通卡。這有助于同學們提前鎖定廣告技術方向,避免校招「開盲盒」的不確定性。
往年通過這一途徑進入騰訊的同學告訴我們,參加比賽讓他們在入職的時候就已經具備幾個月的業務認知優勢,從而能夠快速適應工作環境,也能更快出成果。比如一個叫栗強的同學,他入職之后很快成長為技術專家,主導開發的 Bid Shading 對外報價算法為聯盟帶來了大盤三個點的收入提升。
今年,除了入職騰訊,符合條件的獲獎者還可以進一步按規定申請深圳市相關人才培養支持政策項目,為未來在粵港澳大灣區的長期發展奠定優勢。
當然,大多數同學最終沒能拿到獎項,但他們表示自己依然收獲滿滿。因為騰訊廣告算法大賽本來就是一個上千支隊伍同臺競技的舞臺,在比賽中遇到的對手很有可能成為未來的高質量人脈。而且,在比賽過程中,大家可以接觸到騰訊技術專家,實現從學術到工業界的思維轉變。
報名通道已開啟
趕緊組隊
前段時間,騰訊公布了 2025 年第一季度財報。財報顯示,該季度騰訊營銷服務收入同比增長 20% 至 319 億元,而這些增長在很大程度上要歸功于 AI 驅動的廣告平臺 AI 技術升級。這給了騰訊持續投入于廣告 AI 技術的動力。
也正因如此,騰訊廣告以及其他有廣告業務的公司對生成式 AI 人才的需求正呈上漲趨勢。參加騰訊廣告算法大賽,有助于同學們提前為此做好準備。
有人可能會說,自己從來沒有接觸過廣告行業,擔心有 gap。這點其實不用擔心,就像之前參賽的同學所說,大家參賽之前都沒有什么經驗,很多事情都是從零到一開始做,現在有很多 AI 助手可以幫助大家加速學習過程,而且很多前沿論文和已有成果也可以拿來參考。
目前,大賽的報名通道已經開啟,截止日期是 7 月 31 日,全球高等院校的全日制在校學生(本科、碩士、博士、博士后)均可報名參賽。
如果你也對這個方向感興趣,趕快報名參賽吧!
參賽鏈接:https://algo.qq.com/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.