圈哥注意到,在經(jīng)歷多次因熱點事件處置引發(fā)輿論爭議后,抖音近日首度公開了算法推薦原理和平臺治理機制,并面向公眾上線了專門網(wǎng)站,對公眾關(guān)注問題進行答疑。此次開放的算法原理說明顯示,抖音的推薦系統(tǒng)已進化至以神經(jīng)網(wǎng)絡(luò)計算為手段,通過預(yù)測用戶行為概率和用戶不同行為的價值權(quán)重來確定視頻推薦優(yōu)先級,而非依賴傳統(tǒng)認知中的狹義上給用戶或內(nèi)容打標(biāo)簽來推薦。
在推薦機制層面,抖音基于用戶行為的推薦方法包括協(xié)同過濾、雙塔召回、Wide&Deep等多種技術(shù)模型。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,將其他人感興趣的內(nèi)容推薦給該用戶。系統(tǒng)在用戶每次瀏覽時會對候選視頻進行實時打分,綜合考量完播率、點贊、評論、分享等數(shù)十項互動指標(biāo),最終選出互動價值最高的內(nèi)容進行推送。也就是說,系統(tǒng)不知道你為什么喜歡,只需推測你最喜歡什么,歸根到底,還是一種數(shù)學(xué)概率游戲。
另外,對于公眾關(guān)心的幾個熱點問題,抖音也都在官網(wǎng)上進行了回應(yīng)。
問題1、“信息繭房”是算法推薦形成的嗎?
同質(zhì)化選題的密集推送容易造成“信息繭房”現(xiàn)象,對此,抖音相關(guān)責(zé)任人回應(yīng)稱:“信息繭房”概念在推薦算法成熟之前就出現(xiàn)了,算法不是“信息繭房”形成的先決因素。現(xiàn)在行業(yè)對“信息繭房”的擔(dān)心本質(zhì)是“信息偏食”,即信息來源單一。
為引導(dǎo)算法打破信息繭房,抖音算法在多目標(biāo)建模體系下,設(shè)置了專門的探索維度。一是對用戶在平臺上已經(jīng)表現(xiàn)出的興趣,盡可能推薦更多樣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次。二是幫助用戶探索更多新興趣,采用隨機探索、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動、“不感興趣”不再展現(xiàn)等多種方式,讓用戶的主動行為影響推薦系統(tǒng),使推薦更加個性化和多樣化。
問題2、算法是否故意推薦擦邊內(nèi)容來提升用戶使用時長?
抖音算法工程師劉暢表示,抖音更關(guān)注用戶長期價值,而非追求平臺的短期數(shù)據(jù)。為此,抖音算法考慮了眾多目標(biāo),如完播、評論、點贊、對作者長期消費、分享、跟拍等,力圖計算出更符合用戶長期價值的目標(biāo)。
問題3、現(xiàn)象級網(wǎng)紅是平臺“強推”出來的嗎?
在郭有才等網(wǎng)紅走紅過程中,一些網(wǎng)友懷疑,網(wǎng)紅的走紅是否由平臺算法強推出來的。抖音對此表示,這鍋我們不背,是你們自己“選”出來的。創(chuàng)作者走紅是多個因素共同作用的結(jié)果,其中最主要的原因是用戶最大公約數(shù)的選擇——即用戶通過點贊、留言、關(guān)注、分享等行為,對自己認同的內(nèi)容“投票”。一旦算法啟動,它就會尊重廣大用戶的選擇。如果給用戶硬推不感興趣的內(nèi)容,會有大量負反饋,用戶會點不感興趣乃至舉報,會不利于用戶體驗。
問題4、App會“竊聽”用戶談話嗎?
抖音官網(wǎng)表示,平臺沒有動力這樣做,合規(guī)要求也不允許這樣做。之所以用戶有這樣的誤解,可能是兩方面的原因:一個可能是跨平臺營銷推薦。這類廣告是基于用戶在前述應(yīng)用上的網(wǎng)絡(luò)行為數(shù)據(jù),比如瀏覽、點擊、收藏等舉動而對用戶進行行為偏好預(yù)測,然后形成用戶群體畫像,進行定向營銷廣告。例如,用戶在A電商平臺搜索了一款貓糧。關(guān)閉A平臺后,打開了B社交平臺,發(fā)現(xiàn)B平臺也在推薦貓糧。這并不是B平臺對用戶做了監(jiān)控,是A平臺作為B平臺的廣告主,通過程序化廣告利用A平臺的數(shù)據(jù)定向給用戶展示了廣告,實現(xiàn)跨平臺的廣告營銷。
另一個原因可能是“幸存者偏差”。例如有一千名用戶都提到了貓,其中999名用戶打開App后推送的內(nèi)容都與貓無關(guān),但有一名用戶發(fā)現(xiàn)App推送了貓的內(nèi)容,這種反常的巧合格外引人注意,這名用戶就會將其放大,甚至猜測 App 在 “竊聽”。
除以上問題,相關(guān)負責(zé)人還解釋了抖音內(nèi)容治理體系的運營機制:實行“人工參與+機器學(xué)習(xí)”模式,包含異常感知、標(biāo)準(zhǔn)定義、機器識別、人工研判、風(fēng)險處置等過程。創(chuàng)作者將內(nèi)容上傳至抖音后,先進入機器識別環(huán)節(jié)。如果內(nèi)容被識別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問題,會被送至人工審核;若問題概率較低,獲得基礎(chǔ)流量進入下一環(huán)節(jié)。當(dāng)視頻被舉報、評論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況發(fā)生,則可能觸發(fā)“人工+機器”審核。相關(guān)內(nèi)容在上述任一環(huán)節(jié)被處置,系統(tǒng)都會立即停止進一步推薦和分發(fā)。
※ 抖音相關(guān)負責(zé)人在開放日詳解平臺治理機制。
看到上述機制,和圈哥過往工作中的治理策略經(jīng)驗基本是相符的,無非是數(shù)據(jù)生產(chǎn)-攔截-審核-入庫-分發(fā)-高曝光/負反饋-召回復(fù)審 這么一整套流程,不一樣的是,在治理閉環(huán)鏈路中,機器學(xué)習(xí)參與的比重會越來越大,畢竟降本增效永遠是各個內(nèi)容大廠永恒的追求。
另外據(jù)圈哥向內(nèi)部人士了解,抖音后續(xù)還將在專門網(wǎng)站解釋更多爭議性問題,各位圈友有興趣可以登錄網(wǎng)址 95152.douyin.com 進行查看,甚至可通過官網(wǎng)提交意見建議,參與平臺治理。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.