99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

算法與算法之外:抖音內容推薦系統如何運行?

0
分享至



算法背后:平臺和用戶相互影響。

文丨孫海寧

編輯丨高洪浩

內容平臺天生面臨一個矛盾:推薦算法太透明,不但暴露商業機密,還容易鼓勵創作者和商家針對優化特定數據搏流量;推薦算法不透明,每當攪動社會情緒的事件出現,用戶總會懷疑內容平臺在操控信息流動。

抖音是國內最大的內容平臺之一,相應也受到最猛烈的批評。去年 11 月,知名企業家鐘睒睒公開指責抖音放縱造謠賬號抹黑企業形象,引發共鳴;近期,北京大學青年教師韋東奕在抖音開通賬號,迅速獲得超千萬名粉絲,又有用戶指責抖音 “造神”。

同期,中國監管部門也發起針對互聯網平臺的治理行動,把 “以適當方式公示算法推薦服務的基本原理、目的意圖、主要運行機制等” 作為工作目標。

今年年初開始,抖音成立算法透明項目組,首次對外解釋推薦算法的原理、治理內容生態的思路。《晚點 LatePost》訪談了抖音算法、生態治理相關負責人,了解這家公司如何影響用戶、又如何被用戶影響。

推薦算法學習用戶行為規律

用戶點擊手機上的音符圖標,打開應用的幾秒內,抖音推薦算法已經在每天增加數億個視頻的內容庫中,完成推薦運算,再根據運算結果排序。大邏輯不復雜:

先分別估計視頻引起用戶某個行為——點贊、評論、進入直播間等等——的概率,再用事先確定的行為價值分數和行為概率相乘,然后加總。最終得分越高,視頻就越可能被刷出。



預測行為概率是靠歷史數據。過往視頻激發了哪些行為,以及這些視頻、視頻觀眾的特征,會源源不斷地匯入機器學習模型,就像帶有標準答案的樣題,供模型學習。理想情況下,每迭代一次,模型預測行為概率時就估得更準。

“模型本質是在學某類人對某類視頻發生特定行為的規律。” 抖音算法工程師劉暢說,“如果模型判斷你我興趣相近,之前我點贊某個歷史視頻,那模型可能估計你也容易為它點贊。”

平臺能獲取到的各類信息可能都有助于提高模型預測的準確度。為增加模型可用信息,抖音有時還會重新設計用戶界面。2021 年之前,為求首面板簡潔干凈,用戶只有長按屏幕或者點擊分享之后,才能在二級面板內收藏視頻。但在推薦團隊嘗試提升中、長視頻的分發效率后,意識到 “用戶收藏” 是反映視頻質量的重要信號,因此將收藏按鈕提至首面板,方便收集更多收藏數據。

模型估出用戶各項行為概率后,還要乘以預先確定的價值分。價值分越高,意味著某項行為越被平臺鼓勵。相比目標是提高客觀預測精度的行為概率模型,價值分更體現平臺主觀偏好,設定不好,就可能大幅影響平臺生態。



抖音確定行為價值分是靠 A/B 測試:微調一組用戶推薦算法的價值分,再和另一組沒調整的用戶對照,觀察平臺重視的各項指標如何變化。這些指標可以是日活躍用戶數量、創作者投稿數量、平臺商品銷售額等。

多個指標可能同時朝不同方向變動。這時抖音數據分析團隊會在各個指標之間創建換算關系,并約束它們對最重要的 “北極星” 指標——長期留存——的影響。

觀察上述指標變化,抖音可以判斷業務團隊是否像自己聲稱地那樣完成任務。比如抖音電商定位 “興趣電商”,目標是推薦用戶需要的商品。“衡量推薦精度的電商轉化率提高,就不能把衡量用戶體驗的活躍度指標拉下去。” 劉暢說。

用戶使用抖音的習慣不同,同一行為暗含的信息量也就不同。熱衷點贊的用戶可能不放過每次鼓勵創作者的機會,無論視頻質量優劣;要求更高的用戶則只會對自認為最高質量的內容點贊。顯然,后一種點贊顯出視頻對用戶的價值更高,價值分應該隨之調整。

為此,抖音允許價值分在平臺預設的基礎上千人千面地變化,同時也會針對有特定觀看習慣的用戶設計特定策略,由此保證價值分反應用戶偏好。

抖音會控制價值分個性化,或者針對特定行為策略的復雜程度。劉暢說這一方面是出于成本考慮,多一個模型動態調整價值分,算力成本就被堆得更高。另外,推薦系統需要控制復雜度,增強算法魯棒性——讓系統面對各種干擾時仍保持穩定運轉。

先人工定調,再機器放大

推薦算法并非萬能。它只是根據用戶可能 “點贊、評論、分享” 的概率,加上平臺給這些動作設定的權重,為內容排序,看不出視頻本身是否優質。維護內容生態,先得由平臺員工確定內容評判標準后,推薦算法才能批量執行。

抖音內容運營負責人李翔宇告訴《晚點 LatePost》,2023 年開始,抖音運營部門更重視增加優質內容占比。

新工作從定義何為 “優質供給” 開始。運營員工人工初篩出各個內容類目的優質視頻,然后定期開會二次篩選、討論,提煉出這些視頻的特點,形成可以被文字闡釋的標準。

“我們會請創作者幫忙一起研判,一些觀看次數不高、可我們覺得是優質的內容會發給創作者,請他們從專業視角評判。” 李翔宇說。過程中,播放量高但沒有創意的視頻也會被拿出來討論,“比如賣弄技巧,但沒有信息量的視頻。”

優質標準是動態調整的。“抖音剛上線時,運鏡視頻肯定屬于優質內容。但發的人越來越多,觀眾審美疲勞,創作者就需要在運鏡基礎上增加更多創新玩法。” 李翔宇說。

標準制定好,更多內容運營和審核員工就能參考它們,為更多內容打上 “優質視頻 / 非優質視頻” 的標簽。這之后,有了學習樣本的算法開始發揮效力,批量識別出還沒經過人工評判的優質視頻。

“算法的優勢在于批量處理。畢竟運營員工能研判的視頻數量是有限的,算法可以將更多優質創作者和優質視頻更早地發掘出來。” 李翔宇說。

就像所有內容平臺,抖音會對優質視頻提供流量激勵。之前的方式是保證它們獲得一定播放量,但效果有限。“比如中、長知識類視頻,用保證一定播放量的方式幫它們完成冷啟動,之后完播率還是天生不如 10 秒短視頻,得不到算法重視。” 李翔宇說。

新辦法是在定義優質內容后,看哪些用戶行為和行為價值分可以讓流量導向優質內容,抖音就強化這些目標,如收藏、反復觀看、搜索等。去年,一條 450 分講紅樓夢的視頻獲得 3 億播放、780 萬收藏、637 萬分享,大量用戶的收藏和分享,讓這條長視頻得到更好的分發,被抖音當作算法和用戶雙向選擇的最佳實踐。

提振優質內容外,內容生態治理的另一項主要工作是打擊劣質內容。這也是只有機器和人工相互配合才能完成的工作。

創作者發布視頻后,內容會經歷多層審核。第一層審核針對所有視頻,目的是擋住違法違規、觸犯底線的內容,主要靠機器,機器認定內容風險較高則會交給人工判斷;播放量再上升到一定程度后,機器、人工會配合著二次審核,處理不宜過多分發,但不涉及底線問題的視頻;高熱內容還要經過第三層審核。

除了依序推進的層級審核,某個視頻收到過多用戶負面反饋,或流量異常突變時,也會觸發研判治理環節,如果治理員工發現問題,同樣會停止分發和推薦視頻。

上述標準審核流程外,抖音還會針對網絡暴力、未成年人保護、AIGC 違規內容治理等焦點問題發起專項治理,單獨設立團隊構建治理框架。比如,和抵制網絡暴力相關的措施包括搭建網暴賬號監控池、上線一鍵關閉來自陌生人的評論、私信及被搜索到的功能等。



“之所以叫 ‘專項’,是因為治理這些問題需要調動多個部門,像上線新功能就需要產品、研發支持。但 ‘專項治理’ 不是 ‘項目制’,沒有結項日,開始之后會長期持續做。” 李翔宇說。

平臺影響用戶,用戶改變平臺

無論是提振優質內容還是打擊劣質內容,抖音治理措施不是平臺單方面意志的實施,而是和用戶行為相互影響、相互適應的結果。

電商主播在抖音賣貨時,習慣用 “米” 替代 “錢”,這是因為有傳言說 “錢” 在平臺的敏感詞列表中,主播講太多次,會影響直播間流量。

“這把治理想象得太傻了。‘錢’ 是常用字,不可能用作敏感詞過濾。” 李翔宇回應。盡管抖音 2021 年就開始澄清可以用 “錢” 字,但只要傳聞涉及流量和隨流量而來的收入,電商商家仍然寧可信其有。

相關案例增加后,抖音反而得治理非規范用字,今年會先從播放量超過千萬次的高熱視頻開始。“也不能立刻一棍子全打死,因為很多用戶已經習慣直播間里的特定表達了。”

對付謠言時,抖音留有 “舉報” 按鈕,希望理智的用戶能自發識別、對抗部分謠言。但李翔宇說舉報渠道產生的信號并不完全可信,每天最多的舉報信息都涉及明星,背后是一個明星的粉絲群體試圖壓制另一個明星相關內容的流量。

為更好地識別、對抗謠言,抖音設有一個三十人的團隊,每天主動巡檢、收集各類虛假信息,整理成一個 “謠言庫”,然后交給機器學習模型識別相關視頻。“比如人工入庫一個 ‘韋東奕解決了六個博士四個月沒解決的難題’ 的謠言,只要已有、新上傳的視頻內有相關表述,就會被機器識別然后處置。”

一些信息在傳播過程中因關鍵要素缺失,導致用戶理解偏差,演變為謠言,平臺就得通過多次核實才能 “跑贏” 這些不實信息。

一個例子是,近期網絡上廣泛傳播的 “犬類禁養名單”。謠言炮制者拼湊各地分散的養犬管理規定,把部分城市在特定區域對特定犬種的限養政策,夸大為全國性禁養政策。對此,抖音需反復查閱官方文件,才能還原事件真相:目前,國家層面尚未出臺統一的禁養政策,相關管控措施由各省市地方政府制定。

今年二季度開始,抖音治理團隊依據信息危害程度,進一步將謠言分為 “需要核實” 和 “無需核實” 兩類。

“無需核實” 類包括 “明確存在不良社會影響或違背常識的無稽之談” 的內容,如 “某高校研究發現人類可以重生”,會直接被平臺限制傳播。“需要核實” 的信息,先由聯網大語言模型進行事實核查,若模型檢索到的權威信源不足,則觸發人工核查員介入,最終根據核查結果,將內容細分為 “謠言”“疑似謠言”“爭議內容” 三類,并匹配對應的分級處置策略。

和謠言同樣棘手的是熱點事件。去年一名網名為 “胖貓” 的男生跳江身亡后,他的姐姐在抖音發聲指責 “胖貓” 女友詐騙錢財,發酵成為公共事件,但公安部門調查后發現指責不實。反思時,抖音認為熱點事件當事人有發聲權利,但在事實水落石出前,也應該防止當事人不當利用輿論,傷害其他相關方。

今年 5 月,抖音出臺社區熱點信息和賬號治理規則。基本原則之一是 “保護熱點發酵中當事人(方)的隱私、名譽、人身安全等權益。” 對事實不清的熱點信息,抖音會增加提醒標簽,并會通過熱榜、彈窗推送的方式傳播熱點事件節點信息、核心事實。

此外,爭議熱點事件爆發后,抖音會暫時禁止當事人帶貨、接廣告或接受直播打賞。這既是因為公眾反感素人走紅后立刻變現,也為防止當事人生活受巨大流量反噬。

問及是否對熱點當事人管得太嚴時,李翔宇說很難定論:“根據很多熱點事件演進的經驗,當事人可能需要冷靜一段時間想清楚后續的規劃。冷靜期過后,我們會放開對變現的限制。”

必然的變革,漫長的適應期

“和你的瀏覽器說再見吧!”1997 年,科技作家凱文 · 凱利在《推送!》(Push!)一文中寫道。他把靠人們主動搜索來傳遞信息的互聯網稱作 “拉式媒體”(Pull Media),并預言它會被 “推式媒體”(Push Media)取代:

不等用戶點擊,內容會主動出現在電視機上、電腦上、墻上、擋風玻璃上,或者其他任何能塞下一塊屏幕的地方。憑借無線傳輸技術,一度安靜的角落里也會充斥信息,廣告商爭搶人民注意力的競爭會空前激烈——總之,帶著全新的交互方式,推式媒體將塑造一個全新的世界。

只要人類創造信息的速度快于消化信息的速度,情況就不可避免地朝凱利描繪的方向演進。但速度沒那么快。2006 年 Facebook 上線無限滾動的 News Feed 信息流后,靠推薦算法變得可用的推式媒體才算登陸電腦。等推式媒體開始占領手機屏幕,還得再十年。

過程中,種種爭議也隨之而來。YouTube 推薦算法一度被報道過分追求 “用戶觀看時間”,一步步把用戶引至容易上癮的陰謀論視頻;Instagram 被指責加重用戶身材焦慮,其他主流內容平臺的信息流幾乎都引發過批評。

這不可避免。改天換地的新技術總是創造矛盾、引起爭議,這些矛盾、爭議先引致新的監管框架、社會共識,然后約束新技術更好地服務社會。

每一次公眾、監管對內容平臺的問責,每一次問責后平臺的反思、調整,都是新技術和社會的相互磨合的注腳。

最終檢驗算法的優劣的,不是它匹配內容和觀眾的精度,而是它與使用者之間相互適應的程度。

題圖來源:視覺中國

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
33歲大齡剩女吐槽相親男吃幾次飯就想確定關系,評論區罵聲一片

33歲大齡剩女吐槽相親男吃幾次飯就想確定關系,評論區罵聲一片

阿會情感
2025-06-01 12:40:06
要價1億歐!英媒:阿森納準備以8000萬歐試探性報價羅德里戈

要價1億歐!英媒:阿森納準備以8000萬歐試探性報價羅德里戈

直播吧
2025-07-18 18:02:05
日本警方指認進口中國玩具槍能“發射實彈”,日網民困惑

日本警方指認進口中國玩具槍能“發射實彈”,日網民困惑

環球網資訊
2025-07-18 15:43:42
動真格了!嚴查公務員私人開銷,這6類行為將全程監督!

動真格了!嚴查公務員私人開銷,這6類行為將全程監督!

詩詞中國
2025-07-18 17:26:34
人類史上最大最瘋狂的超級工程:已持續建設48年,還有25年才完工

人類史上最大最瘋狂的超級工程:已持續建設48年,還有25年才完工

特特農村生活
2025-07-18 04:10:23
童顏巨老師一夜爆紅:36D身材背后的流量密碼與審美狂歡

童顏巨老師一夜爆紅:36D身材背后的流量密碼與審美狂歡

云端小院
2025-07-15 09:39:56
浙江養老金要漲啦!2025年人均最多2%,千萬退休人員這樣算錢

浙江養老金要漲啦!2025年人均最多2%,千萬退休人員這樣算錢

山藥蛋TV
2025-07-18 13:55:32
亞馬爾父親:我兒子是個剛滿18歲的孩子,有權稍微享受生活

亞馬爾父親:我兒子是個剛滿18歲的孩子,有權稍微享受生活

懂球帝
2025-07-18 00:07:44
許世友酒后與王新亭打架,陳賡大怒,劉伯承直接將其調走

許世友酒后與王新亭打架,陳賡大怒,劉伯承直接將其調走

老謝談史
2025-07-18 11:57:25
樓市想活,必須改革!中央重磅定調:明年起,新房老房將是兩個物種

樓市想活,必須改革!中央重磅定調:明年起,新房老房將是兩個物種

現代小青青慕慕
2025-07-18 13:29:27
中國幾次重要的劃線

中國幾次重要的劃線

南詔鵬哥
2025-07-17 14:57:15
龔玥菲拍“婆媳溫情劇”翻車!龐麥郎全程擺爛,媽媽當場甩臉了!

龔玥菲拍“婆媳溫情劇”翻車!龐麥郎全程擺爛,媽媽當場甩臉了!

動物奇奇怪怪
2025-07-18 07:38:24
全國哪的茶葉最好喝?經過評比,這4地茶名列前茅,有你家鄉的嗎

全國哪的茶葉最好喝?經過評比,這4地茶名列前茅,有你家鄉的嗎

味谷的廚房
2025-07-11 17:47:59
韓國公寓突發大火,致65人傷亡!

韓國公寓突發大火,致65人傷亡!

奮斗在韓國
2025-07-18 09:19:56
王猛同志逝世

王猛同志逝世

政知新媒體
2025-07-18 13:18:49
李同學丟人丟到國外!被開除原因不只是Zeus,紐約時報逮由頭亂扯

李同學丟人丟到國外!被開除原因不只是Zeus,紐約時報逮由頭亂扯

凡知
2025-07-17 00:35:07
真解氣!男孩被塞后備箱后續:生父繼母被辭退,嘴硬回復:我沒錯

真解氣!男孩被塞后備箱后續:生父繼母被辭退,嘴硬回復:我沒錯

徐徐道史
2025-07-18 14:27:43
【獨家】外賣“瘋狂星期六”有多燒錢:美團單日補貼4億,淘寶閃購超12億

【獨家】外賣“瘋狂星期六”有多燒錢:美團單日補貼4億,淘寶閃購超12億

界面新聞
2025-07-18 10:51:44
霍汶希首次曬女兒合照,14歲Hanni五官精致,知情人透露生父身份

霍汶希首次曬女兒合照,14歲Hanni五官精致,知情人透露生父身份

壹點半娛樂
2025-07-17 16:29:40
全新奧迪A6實車曝光!搭載3.0T V6引擎,實力挑戰奔馳E級。

全新奧迪A6實車曝光!搭載3.0T V6引擎,實力挑戰奔馳E級。

嶺南會強吶
2025-07-16 17:54:30
2025-07-18 19:12:49
晚點LatePost
晚點LatePost
晚一點,好一點。商業的真相總是在晚點。《晚點LatePost》官方賬號
2766文章數 21795關注度
往期回顧 全部

科技要聞

凌晨,OpenAI重磅更新,Manus們算白忙活嗎

頭條要聞

宗慶后遺產之爭迎拐點 "隱身"幾十年的大股東"變臉"

頭條要聞

宗慶后遺產之爭迎拐點 "隱身"幾十年的大股東"變臉"

體育要聞

楊瀚森4戰43+20+15+9帽:開拓者4戰3勝

娛樂要聞

王琳自曝被兒子打,承認自己水性楊花

財經要聞

美國國會正式批準穩定幣法案

汽車要聞

售30萬?方程豹鈦7高配版有激光雷達/車載無人機

態度原創

本地
手機
教育
健康
公開課

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

手機要聞

由輕薄設計到全能體驗,OPPO這兩臺新機詮釋旗艦品質

教育要聞

“寧可撿垃圾,也不學師范”,女生被父親改志愿,直言未來全毀了

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 临高县| 荔波县| 鄱阳县| 康平县| 定西市| 鄢陵县| 开平市| 呼伦贝尔市| 岳阳市| 贵定县| 临武县| 浦县| 芦溪县| 莱西市| 金乡县| 凭祥市| 通许县| 安吉县| 武平县| 嘉义县| 若羌县| 新丰县| 莱州市| 扬州市| 阿拉善盟| 桓仁| 江门市| 延庆县| 潼关县| 长顺县| 温州市| 霞浦县| 蒙自县| 铅山县| 喜德县| 金门县| 娄烦县| 元谋县| 旅游| 渝北区| 文成县|