99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

算法與算法之外:抖音內容推薦系統如何運行?

0
分享至



算法背后:平臺和用戶相互影響。

文丨孫海寧

編輯丨高洪浩

內容平臺天生面臨一個矛盾:推薦算法太透明,不但暴露商業機密,還容易鼓勵創作者和商家針對優化特定數據搏流量;推薦算法不透明,每當攪動社會情緒的事件出現,用戶總會懷疑內容平臺在操控信息流動。

抖音是國內最大的內容平臺之一,相應也受到最猛烈的批評。去年 11 月,知名企業家鐘睒睒公開指責抖音放縱造謠賬號抹黑企業形象,引發共鳴;近期,北京大學青年教師韋東奕在抖音開通賬號,迅速獲得超千萬名粉絲,又有用戶指責抖音 “造神”。

同期,中國監管部門也發起針對互聯網平臺的治理行動,把 “以適當方式公示算法推薦服務的基本原理、目的意圖、主要運行機制等” 作為工作目標。

今年年初開始,抖音成立算法透明項目組,首次對外解釋推薦算法的原理、治理內容生態的思路。《晚點 LatePost》訪談了抖音算法、生態治理相關負責人,了解這家公司如何影響用戶、又如何被用戶影響。

推薦算法學習用戶行為規律

用戶點擊手機上的音符圖標,打開應用的幾秒內,抖音推薦算法已經在每天增加數億個視頻的內容庫中,完成推薦運算,再根據運算結果排序。大邏輯不復雜:

先分別估計視頻引起用戶某個行為——點贊、評論、進入直播間等等——的概率,再用事先確定的行為價值分數和行為概率相乘,然后加總。最終得分越高,視頻就越可能被刷出。



預測行為概率是靠歷史數據。過往視頻激發了哪些行為,以及這些視頻、視頻觀眾的特征,會源源不斷地匯入機器學習模型,就像帶有標準答案的樣題,供模型學習。理想情況下,每迭代一次,模型預測行為概率時就估得更準。

“模型本質是在學某類人對某類視頻發生特定行為的規律。” 抖音算法工程師劉暢說,“如果模型判斷你我興趣相近,之前我點贊某個歷史視頻,那模型可能估計你也容易為它點贊。”

平臺能獲取到的各類信息可能都有助于提高模型預測的準確度。為增加模型可用信息,抖音有時還會重新設計用戶界面。2021 年之前,為求首面板簡潔干凈,用戶只有長按屏幕或者點擊分享之后,才能在二級面板內收藏視頻。但在推薦團隊嘗試提升中、長視頻的分發效率后,意識到 “用戶收藏” 是反映視頻質量的重要信號,因此將收藏按鈕提至首面板,方便收集更多收藏數據。

模型估出用戶各項行為概率后,還要乘以預先確定的價值分。價值分越高,意味著某項行為越被平臺鼓勵。相比目標是提高客觀預測精度的行為概率模型,價值分更體現平臺主觀偏好,設定不好,就可能大幅影響平臺生態。



抖音確定行為價值分是靠 A/B 測試:微調一組用戶推薦算法的價值分,再和另一組沒調整的用戶對照,觀察平臺重視的各項指標如何變化。這些指標可以是日活躍用戶數量、創作者投稿數量、平臺商品銷售額等。

多個指標可能同時朝不同方向變動。這時抖音數據分析團隊會在各個指標之間創建換算關系,并約束它們對最重要的 “北極星” 指標——長期留存——的影響。

觀察上述指標變化,抖音可以判斷業務團隊是否像自己聲稱地那樣完成任務。比如抖音電商定位 “興趣電商”,目標是推薦用戶需要的商品。“衡量推薦精度的電商轉化率提高,就不能把衡量用戶體驗的活躍度指標拉下去。” 劉暢說。

用戶使用抖音的習慣不同,同一行為暗含的信息量也就不同。熱衷點贊的用戶可能不放過每次鼓勵創作者的機會,無論視頻質量優劣;要求更高的用戶則只會對自認為最高質量的內容點贊。顯然,后一種點贊顯出視頻對用戶的價值更高,價值分應該隨之調整。

為此,抖音允許價值分在平臺預設的基礎上千人千面地變化,同時也會針對有特定觀看習慣的用戶設計特定策略,由此保證價值分反應用戶偏好。

抖音會控制價值分個性化,或者針對特定行為策略的復雜程度。劉暢說這一方面是出于成本考慮,多一個模型動態調整價值分,算力成本就被堆得更高。另外,推薦系統需要控制復雜度,增強算法魯棒性——讓系統面對各種干擾時仍保持穩定運轉。

先人工定調,再機器放大

推薦算法并非萬能。它只是根據用戶可能 “點贊、評論、分享” 的概率,加上平臺給這些動作設定的權重,為內容排序,看不出視頻本身是否優質。維護內容生態,先得由平臺員工確定內容評判標準后,推薦算法才能批量執行。

抖音內容運營負責人李翔宇告訴《晚點 LatePost》,2023 年開始,抖音運營部門更重視增加優質內容占比。

新工作從定義何為 “優質供給” 開始。運營員工人工初篩出各個內容類目的優質視頻,然后定期開會二次篩選、討論,提煉出這些視頻的特點,形成可以被文字闡釋的標準。

“我們會請創作者幫忙一起研判,一些觀看次數不高、可我們覺得是優質的內容會發給創作者,請他們從專業視角評判。” 李翔宇說。過程中,播放量高但沒有創意的視頻也會被拿出來討論,“比如賣弄技巧,但沒有信息量的視頻。”

優質標準是動態調整的。“抖音剛上線時,運鏡視頻肯定屬于優質內容。但發的人越來越多,觀眾審美疲勞,創作者就需要在運鏡基礎上增加更多創新玩法。” 李翔宇說。

標準制定好,更多內容運營和審核員工就能參考它們,為更多內容打上 “優質視頻 / 非優質視頻” 的標簽。這之后,有了學習樣本的算法開始發揮效力,批量識別出還沒經過人工評判的優質視頻。

“算法的優勢在于批量處理。畢竟運營員工能研判的視頻數量是有限的,算法可以將更多優質創作者和優質視頻更早地發掘出來。” 李翔宇說。

就像所有內容平臺,抖音會對優質視頻提供流量激勵。之前的方式是保證它們獲得一定播放量,但效果有限。“比如中、長知識類視頻,用保證一定播放量的方式幫它們完成冷啟動,之后完播率還是天生不如 10 秒短視頻,得不到算法重視。” 李翔宇說。

新辦法是在定義優質內容后,看哪些用戶行為和行為價值分可以讓流量導向優質內容,抖音就強化這些目標,如收藏、反復觀看、搜索等。去年,一條 450 分講紅樓夢的視頻獲得 3 億播放、780 萬收藏、637 萬分享,大量用戶的收藏和分享,讓這條長視頻得到更好的分發,被抖音當作算法和用戶雙向選擇的最佳實踐。

提振優質內容外,內容生態治理的另一項主要工作是打擊劣質內容。這也是只有機器和人工相互配合才能完成的工作。

創作者發布視頻后,內容會經歷多層審核。第一層審核針對所有視頻,目的是擋住違法違規、觸犯底線的內容,主要靠機器,機器認定內容風險較高則會交給人工判斷;播放量再上升到一定程度后,機器、人工會配合著二次審核,處理不宜過多分發,但不涉及底線問題的視頻;高熱內容還要經過第三層審核。

除了依序推進的層級審核,某個視頻收到過多用戶負面反饋,或流量異常突變時,也會觸發研判治理環節,如果治理員工發現問題,同樣會停止分發和推薦視頻。

上述標準審核流程外,抖音還會針對網絡暴力、未成年人保護、AIGC 違規內容治理等焦點問題發起專項治理,單獨設立團隊構建治理框架。比如,和抵制網絡暴力相關的措施包括搭建網暴賬號監控池、上線一鍵關閉來自陌生人的評論、私信及被搜索到的功能等。



“之所以叫 ‘專項’,是因為治理這些問題需要調動多個部門,像上線新功能就需要產品、研發支持。但 ‘專項治理’ 不是 ‘項目制’,沒有結項日,開始之后會長期持續做。” 李翔宇說。

平臺影響用戶,用戶改變平臺

無論是提振優質內容還是打擊劣質內容,抖音治理措施不是平臺單方面意志的實施,而是和用戶行為相互影響、相互適應的結果。

電商主播在抖音賣貨時,習慣用 “米” 替代 “錢”,這是因為有傳言說 “錢” 在平臺的敏感詞列表中,主播講太多次,會影響直播間流量。

“這把治理想象得太傻了。‘錢’ 是常用字,不可能用作敏感詞過濾。” 李翔宇回應。盡管抖音 2021 年就開始澄清可以用 “錢” 字,但只要傳聞涉及流量和隨流量而來的收入,電商商家仍然寧可信其有。

相關案例增加后,抖音反而得治理非規范用字,今年會先從播放量超過千萬次的高熱視頻開始。“也不能立刻一棍子全打死,因為很多用戶已經習慣直播間里的特定表達了。”

對付謠言時,抖音留有 “舉報” 按鈕,希望理智的用戶能自發識別、對抗部分謠言。但李翔宇說舉報渠道產生的信號并不完全可信,每天最多的舉報信息都涉及明星,背后是一個明星的粉絲群體試圖壓制另一個明星相關內容的流量。

為更好地識別、對抗謠言,抖音設有一個三十人的團隊,每天主動巡檢、收集各類虛假信息,整理成一個 “謠言庫”,然后交給機器學習模型識別相關視頻。“比如人工入庫一個 ‘韋東奕解決了六個博士四個月沒解決的難題’ 的謠言,只要已有、新上傳的視頻內有相關表述,就會被機器識別然后處置。”

一些信息在傳播過程中因關鍵要素缺失,導致用戶理解偏差,演變為謠言,平臺就得通過多次核實才能 “跑贏” 這些不實信息。

一個例子是,近期網絡上廣泛傳播的 “犬類禁養名單”。謠言炮制者拼湊各地分散的養犬管理規定,把部分城市在特定區域對特定犬種的限養政策,夸大為全國性禁養政策。對此,抖音需反復查閱官方文件,才能還原事件真相:目前,國家層面尚未出臺統一的禁養政策,相關管控措施由各省市地方政府制定。

今年二季度開始,抖音治理團隊依據信息危害程度,進一步將謠言分為 “需要核實” 和 “無需核實” 兩類。

“無需核實” 類包括 “明確存在不良社會影響或違背常識的無稽之談” 的內容,如 “某高校研究發現人類可以重生”,會直接被平臺限制傳播。“需要核實” 的信息,先由聯網大語言模型進行事實核查,若模型檢索到的權威信源不足,則觸發人工核查員介入,最終根據核查結果,將內容細分為 “謠言”“疑似謠言”“爭議內容” 三類,并匹配對應的分級處置策略。

和謠言同樣棘手的是熱點事件。去年一名網名為 “胖貓” 的男生跳江身亡后,他的姐姐在抖音發聲指責 “胖貓” 女友詐騙錢財,發酵成為公共事件,但公安部門調查后發現指責不實。反思時,抖音認為熱點事件當事人有發聲權利,但在事實水落石出前,也應該防止當事人不當利用輿論,傷害其他相關方。

今年 5 月,抖音出臺社區熱點信息和賬號治理規則。基本原則之一是 “保護熱點發酵中當事人(方)的隱私、名譽、人身安全等權益。” 對事實不清的熱點信息,抖音會增加提醒標簽,并會通過熱榜、彈窗推送的方式傳播熱點事件節點信息、核心事實。

此外,爭議熱點事件爆發后,抖音會暫時禁止當事人帶貨、接廣告或接受直播打賞。這既是因為公眾反感素人走紅后立刻變現,也為防止當事人生活受巨大流量反噬。

問及是否對熱點當事人管得太嚴時,李翔宇說很難定論:“根據很多熱點事件演進的經驗,當事人可能需要冷靜一段時間想清楚后續的規劃。冷靜期過后,我們會放開對變現的限制。”

必然的變革,漫長的適應期

“和你的瀏覽器說再見吧!”1997 年,科技作家凱文 · 凱利在《推送!》(Push!)一文中寫道。他把靠人們主動搜索來傳遞信息的互聯網稱作 “拉式媒體”(Pull Media),并預言它會被 “推式媒體”(Push Media)取代:

不等用戶點擊,內容會主動出現在電視機上、電腦上、墻上、擋風玻璃上,或者其他任何能塞下一塊屏幕的地方。憑借無線傳輸技術,一度安靜的角落里也會充斥信息,廣告商爭搶人民注意力的競爭會空前激烈——總之,帶著全新的交互方式,推式媒體將塑造一個全新的世界。

只要人類創造信息的速度快于消化信息的速度,情況就不可避免地朝凱利描繪的方向演進。但速度沒那么快。2006 年 Facebook 上線無限滾動的 News Feed 信息流后,靠推薦算法變得可用的推式媒體才算登陸電腦。等推式媒體開始占領手機屏幕,還得再十年。

過程中,種種爭議也隨之而來。YouTube 推薦算法一度被報道過分追求 “用戶觀看時間”,一步步把用戶引至容易上癮的陰謀論視頻;Instagram 被指責加重用戶身材焦慮,其他主流內容平臺的信息流幾乎都引發過批評。

這不可避免。改天換地的新技術總是創造矛盾、引起爭議,這些矛盾、爭議先引致新的監管框架、社會共識,然后約束新技術更好地服務社會。

每一次公眾、監管對內容平臺的問責,每一次問責后平臺的反思、調整,都是新技術和社會的相互磨合的注腳。

最終檢驗算法的優劣的,不是它匹配內容和觀眾的精度,而是它與使用者之間相互適應的程度。

題圖來源:視覺中國

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
宗慶后生前購買的美國頂級豪宅曝光:奢華至極!僅浴室就有16間

宗慶后生前購買的美國頂級豪宅曝光:奢華至極!僅浴室就有16間

17譚
2025-07-18 12:28:37
71歲陳佩斯遭午夜流放?資本抹滅千萬票房杰作!觀眾舉火把反對!

71歲陳佩斯遭午夜流放?資本抹滅千萬票房杰作!觀眾舉火把反對!

觀察鑒娛
2025-07-19 12:17:00
史曉燕支持小三惡評宗馥莉!網友扒出更多黑料,生活混亂關系炸裂

史曉燕支持小三惡評宗馥莉!網友扒出更多黑料,生活混亂關系炸裂

硯底沉香LIU
2025-07-19 11:28:51
楊議稱楊少華遺產四個兒子一人一億,打不起來

楊議稱楊少華遺產四個兒子一人一億,打不起來

大象新聞
2025-07-18 14:11:28
“10公里以內不配打車?”上海虹橋出租車拒載事件后續:官方已立案

“10公里以內不配打車?”上海虹橋出租車拒載事件后續:官方已立案

極目新聞
2025-07-18 22:16:26
小蜜蜂被挖空!布倫特福德主帥+隊長+一門+核心今夏全被挖走

小蜜蜂被挖空!布倫特福德主帥+隊長+一門+核心今夏全被挖走

直播吧
2025-07-18 20:50:06
霍汶希首次曬女兒合照,14歲Hanni五官精致,知情人透露生父身份

霍汶希首次曬女兒合照,14歲Hanni五官精致,知情人透露生父身份

壹點半娛樂
2025-07-17 16:29:40
1951年一名15歲志愿軍手癢癢,朝美軍開了一炮,結果被記了二等功

1951年一名15歲志愿軍手癢癢,朝美軍開了一炮,結果被記了二等功

近史談
2025-07-18 06:16:07
看了6座加長版 Model Y L ,我覺得它并不好賣。

看了6座加長版 Model Y L ,我覺得它并不好賣。

差評XPIN
2025-07-19 00:11:02
體內有癌,肛門先知?提醒:肛門若常有3種不適,警惕癌癥在靠近

體內有癌,肛門先知?提醒:肛門若常有3種不適,警惕癌癥在靠近

39健康網
2025-05-26 20:41:11
2025年教師不再是鐵飯碗!教育部明確:這5類教師將被解聘

2025年教師不再是鐵飯碗!教育部明確:這5類教師將被解聘

感覺會火
2025-07-18 12:12:53
不出戰剩余夏季聯賽?開拓者的表態,戳穿了多少偽球迷的真實面目

不出戰剩余夏季聯賽?開拓者的表態,戳穿了多少偽球迷的真實面目

王鶔吃吃喝喝
2025-07-19 12:15:43
毛主席哭著給劉胡蘭題詞,隨后指示徐向前,把閻錫山往死里揍

毛主席哭著給劉胡蘭題詞,隨后指示徐向前,把閻錫山往死里揍

丁丁鯉史紀
2025-07-13 14:41:07
韋世豪在社媒發聲做出重要決定,球迷紛紛點贊支持,蒯紀聞留言

韋世豪在社媒發聲做出重要決定,球迷紛紛點贊支持,蒯紀聞留言

趙仔說
2025-07-18 11:28:55
賈巴爾暫別網壇

賈巴爾暫別網壇

網球之家
2025-07-18 11:00:47
百年成都的老照片,看看你家街道以前什么樣

百年成都的老照片,看看你家街道以前什么樣

魅力老照片
2025-07-17 22:20:27
明日入伏,吃餃子白菜韭菜靠邊站,這4種餡最好,清熱下火真香呀

明日入伏,吃餃子白菜韭菜靠邊站,這4種餡最好,清熱下火真香呀

Lily美食談
2025-07-19 00:34:45
女子家中常年低溫8度,找不到原因后決定搬家,搬離當天鄰居急了

女子家中常年低溫8度,找不到原因后決定搬家,搬離當天鄰居急了

第四思維
2025-07-15 13:20:17
日本媒體吐槽,有錢的中國人都不來旅游,來的都是打卡拍照的窮人

日本媒體吐槽,有錢的中國人都不來旅游,來的都是打卡拍照的窮人

西樓知趣雜談
2025-07-15 14:08:44
“終身免費換電”承諾成空談?蔚來單方面取消高里程車主權益

“終身免費換電”承諾成空談?蔚來單方面取消高里程車主權益

大象新聞
2025-07-17 20:15:34
2025-07-19 13:35:00
晚點LatePost
晚點LatePost
晚一點,好一點。商業的真相總是在晚點。《晚點LatePost》官方賬號
2766文章數 21794關注度
往期回顧 全部

科技要聞

工信部等約談17家車企巨頭,競爭劃新紅線

頭條要聞

"暴走團"群主回應阻礙消防救護車通行:1分鐘就過去了

頭條要聞

"暴走團"群主回應阻礙消防救護車通行:1分鐘就過去了

體育要聞

西蒙尼最彪悍的弟子,正成為下個“匪帥”

娛樂要聞

肖戰微博改名爆!保留了三部代表作

財經要聞

娃哈哈爭產大戰:杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

本地
旅游
親子
游戲
房產

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

重新定義生死界限!2025年中國新版兒童膿毒性休克管理共識,核心要點一覽

這還是COD嗎?爆COD將引入全新子系列!2027年新作玩法側重武術?

房產要聞

一梯一戶純板樓!斷貨三年,海口這一核心區,硬貨出場!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 阿合奇县| 册亨县| 峨眉山市| 阿坝| 内黄县| 济南市| 德州市| 金门县| 呼玛县| 阿克| 吴江市| 东乌珠穆沁旗| 靖州| 克什克腾旗| 永仁县| 多伦县| 泉州市| 旬阳县| 双流县| 新和县| 凭祥市| 西畴县| 高台县| 青海省| 克拉玛依市| 鄂托克前旗| 襄汾县| 朔州市| 横峰县| 鹤峰县| 全州县| 灵山县| 湛江市| 宜阳县| 桦南县| 平遥县| 温泉县| 什邡市| 都昌县| 宜兴市| 奎屯市|