巴川
CCF TF數據科學SIG主席
競技世界首席數據科學家
AiDD峰會分論壇出品人
曾就職于中國搜索、搜狐暢游等互聯網公司。主要研究領域包括數據挖掘、知識圖譜、人工智能、社交網絡、風控體系、推薦系統、數據可視化等。中國教育創新校企聯盟專家委員會副主任,國家技術標準創新基地(貴州大數據)數字經濟專業委員會專家,北航兼職碩導,西安交大研究生院授課專家,多所高校兼職教師及創新創業導師,AiDD等技術峰會演講嘉賓及出品人。
1974年,圖靈獎獲得者彼得·諾爾在其著作《計算機方法的簡明調研》中首次提出數據科學概念。40年后,風靡全球的神劇《紙牌屋》,開啟了網飛“大數據制片”的新世代。隨之而來的,是數據驅動為代表的商業理念快速向千行百業滲透。包括當下風光無兩的ChatGPT,某種程度上也是基于海量訓練數據的“大力出奇跡”。
這些商業壯舉背后,站著一個個鮮活的個體。是他們的所思所想,讓科幻電影里的場景走進現實。CCF TF數據科學SIG主席巴川,就是先行者中的一員。他曾是腳踩泥土向往自然的學子,在興趣的引導下踏入了數據科學的殿堂。他說,“當你感覺到趨勢已來時,就要有豁出去干一票的勇氣。”
(巴川在2024AiDD峰會上海站發表主旨演講)
抓住時代一粒沙,做人生的弄潮者
人是所有經歷的總和。主動擁抱更多樣“經歷”,就可以從時代中脫穎而出。
興于20多年前的中國互聯網行業,就是最不容錯過的大時代。四大門戶、BAT、小米、美團、字節跳動...它讓一批同行者,實現了不可思議的人生高度。出生于鄭州鄉村的巴川,也在時代洪流的激蕩下,緊緊的抓住了這粒沙。
和很多80后一樣,巴川的童年生活始于鄉野田間。三五玩伴嬉戲打鬧,餓了有菜地瓜田,累了就草垛小憩,這種與大自然建立的親密感至今仍讓他印象深刻。
但在當時,更強烈的沖擊來自中國城市化進程的浪潮。老家拆遷、生活向好,各種新鮮事物接連而至。巴川目睹著熟悉的城市日新月異——鄉村成為市區,邊緣走向中心。
而他的個人特質也愈發鮮明起來。
巴川從小喜歡數學,在升學考試和各類競賽中他發現自己的確頗有天賦。以至于到了大學時代,他依然跟隨自己的熱愛,選擇了信息與計算科學專業,并在讀研期間朝“數據挖掘算法分析方向”更進一步。
互聯網的全球普及,來的恰到好處。興趣與時代的同頻共振悄然而至,巴川順勢進入了互聯網行業,更直觀體會到數據分析帶給商業世界的價值所在。很快他發現,大數據行業與數字經濟的聯系越來越緊密。通過轉換思維、深度挖掘,紙面數據可以生成一個個具體的業務模型,在各個細分場景下大放異彩。
巴川說,“數據科學最吸引我的是它嚴謹客觀又富有想象力和藝術美感,是科學和藝術的完美結合。能用數據原料炒出各種美味大餐并跟大家分享,是件非常有成就感的事情。而且它能跟各行各業結合,帶你領略不同的人生和經驗。”
為此,巴川在工作之余開始嘗試跨界。他以數據科學為抓手,在北航、西安交大、人民大學等高校兼職授課,還成為中國國際互聯網+大學生創新創業大賽、CCF青年精英大會科技創業秀等大賽的專家評委。
巴川信奉教學相長的人生哲學。
在他看來,教書育人、指引“后浪”不僅能帶給自己別樣的成就感,更是一個交換經驗、沉淀思維深度的平臺。巴川的教學相長,與查理·芒格的多元思維模型不謀而合。后者認為,只有主動跨越學科的界限,不斷學習陌生學科,才是解決實際問題、打破現有瓶頸的捷徑。
“很多在職研究生,都有著數據行業的實操經驗。我會鼓勵他們進行小組案例共創,這樣一堂分享課下來,每個人都能收獲大量的行業案例,在有限的時間里翻倍增加行業應用經驗。有一些不錯的模型思路,還會對我的工作產生靈感和共鳴,我很享受這種獲得感。”
如今,巴川已經是不折不扣的斜桿青年,更成為自己人生的弄潮者。他是競技世界首席數據科學家,在數據挖掘、知識圖譜、人工智能、社交網絡挖掘、風控體系、推薦系統、數據可視化等領域都有所建樹。
在他眼中,似乎沒有所謂的“舒適區”,有的只是一次次突破自我,在時代浪潮中翻出自己的那朵浪花。
場景很重要,初心更重要
一種普遍觀點認為,數據科學領域非常“高大上”,從業者就像古代謀士一樣運籌帷幄,決勝千里之外。從金融投資到戰略咨詢,從影視制作到智能制造,只要搭上大數據的東風,就能無往不利。
但實際情況并非如此。
知乎就有一個高熱度問題,叫做“你為什么離開數據科學行業?”
答主普遍表示,入行前以為數據科學家處于決策鏈上游,話語權非常強。但做起來才發現,自己的模型總是受到一線業務人員“拷問”。很多資深業務寧可相信自己的經驗和直覺,也不愿意相信模型給出的結論,還沒測試效果就要灰溜溜的去改模型。
另外就是,因為數據的無處不在,任何相關需求都會被提交給數據科學部門。團隊大干一番的熱情,很快就會淹沒在各種瑣碎、低價值的需求列表當中。更大的打擊在于,哪怕是一些明確能降本提效的模型,也有可能因為“動了別人的飯碗”而被雪藏。
巴川認為,遇到類似問題時要堅持“價值導向”。在他看來,比起工作成果得到認可,在數據中挖掘價值、發現潛在規律,得到技術思維上的升華同樣意義非凡。
“首先要對業務有敬畏之心,不要和業務部門產生對抗心理。畢竟他們離業務更近,遇到一些反經驗的模型肯定有所質疑。這個時候先要反思,自己的模型是不是存在局限性。反之,真正好的模型和數據產出一定會派上用場,哪怕在現在的公司沒得到體現,也會像滾雪球一樣幫你積累價值。”
近幾年最有成就感的項目是“風險用戶識別與精細化運營”,實際上不只是在互聯網上“抓壞人”,更核心的是游戲沉迷用戶的識別與防控,在幾億用戶中找到幾百幾千個可能重度沉迷的用戶并做好防控,這在技術實現上是非常難的一件事。但是通過技術攻堅,能夠防止用戶沉淪,在另一個方向上影響用戶命運,也是非常有價值感的。當年,這個項目也獲得了競技世界的年度杰出項目獎。
在應對具體工作時,巴川傾向于場景為王。在他看來,一些冷門業務、小場景,反而是數據科學發揮價值的舞臺。
以AI自動剪輯功能為例,表面上看,這對于棋牌游戲賽道不是一個核心場景。但在業務運轉中,需要一支10人的剪輯小組加班加點,產出競技世界官號和頭部主播所需內容。尤其在賽事密集周期,產能幾乎滿足不了時效性要求。
于是,巴川與團隊嘗試通過AI自動剪輯輔助人力。這項工作的難點在于,需要把完整牌局視頻拆分成單牌局,同時智能篩選出精彩部分。針對第一個環節,團隊結合牌局開始、結束時的人員變化,巧妙運用YOLO算法速度快、識別準的特點,監測行牌過程中的人員數量變化,精準進行分拆。
至于“如何定義精彩片段”這件事,團隊經過了多輪思考。最終,以多炸局、反轉局、表情變化識別、評論爆發時間點、主持人語速波動、綜合評分等多個維度,打造出AI視頻內容分析大腦。在這些模型的加持下,剪輯小組的壓力大大減少,平臺的賽事影響力和宣傳時效性得到了大幅優化。
“不用擔心數據科學的價值創造問題,要用發展的眼光看問題,找到更多落地場景。”
巴川相信,數據科學的賦能遠遠未到瓶頸,除了互聯網、金融、游戲、文娛、政務等主流方向,很多傳統領域都有發揮潛力,尤其是勞動密集型和重復勞動較多的場景。
但在商業之外,他也非常關注數據科學的社會價值創造。對于AI、大模型的前途,他用“天之道,利而不害;圣人之道,為而不爭”來類比,呼吁行業人士不忘初心,多做利于他人,利于社會的事。
對于巴川本人來說,他的初心非常簡單:“我想用自己熱愛的數據科學,為他人命運帶去更多正面影響。”
熱愛,是最好的指南針
成為大牛,是很多從業者的終極職業目標。但如何才能走通這條路,多數人其實沒有系統性思考過。
對此,巴川給出了三條能力特質。
一是出色的技術能力。要有較好的數學功底和編程思維,不一定對某種編程語言特別熟練,但要讓自己的思想設計便于工程實現,畢竟AI可能讓將來的編程語言變成中文、英文。避免不懂原理照搬開源代碼,做搬磚俠。
二是樂于分享。GitHub也好,各種大會也罷,能利用各種平臺影響更多的人向好發展,同時多說話,多寫字,都能提高自己的影響力。當然,不排除也有一些人全憑自己超強大腦,也能做出非常牛逼的成就,這類人我們應該稱之為“大神”。
三是溝通能力。一定的共情能力、產品意識和市場意識,有利于工作展開。還有堅持實事求是,才能讓大家達成共識、形成合力,做出更多有意義的工作,而不是更多內耗。
不過相較于這三點,巴川提出了一個更重要的特質。
“你必須先熱愛,熱愛技術,更熱愛生活。”
對巴川來說,熱愛生活恰恰是他工作靈感的“活水”。“長期伏案工作,思維會變得僵硬固化,這時我喜歡通過羽毛球、八段錦這樣內外兼修的運動喚醒自己。周末閑暇時,我愿意回郊區種地摘果,撈魚烹飪,徹底放空自己做回農人。時不時回歸人類最原始的需求,反而能讓我加深‘技術為人’的覺悟。”
從行業大勢角度看,巴川認為國內AI行業存在算力、基礎設施不足等問題。唯有那些懷揣熱愛的技術大牛,才會有毅力投向基礎理論研究,通過數據優勢產出更高效的算法,甚至不惜為此消耗大量時間成本。
在個人成長層面,“熱愛與否”也變得愈發重要。“隨著通用大模型的發展,數據行業的一些基礎功能都在被機器替代,只有熱愛這個行業,愿意挑戰更高規格目標的一批人,才能享受到大模型紅利。”
包括在業務層面,“熱愛”也是遇事不決時的指南針。
巴川分享了一個有意思的案例,他發現近年來很多推薦算法開始被年輕用戶抵制。原因在于,用戶對算法黑箱產生了恐懼感,認為自己的隱私正在被侵犯。
為了解決類似問題,巴川在公司發起了一些交互創新探索——當算法向用戶推薦相關內容、道具時,會增加相關的推薦邏輯,同時向用戶開放一些交互權限,鼓勵用戶和系統互動,同時提高推薦功能的透明度。這類嘗試取得了積極反饋,帶動平臺的用戶滿意度得到了提升。
“用戶需要的是驚喜而不是驚嚇,你只有帶著熱愛去做產品,才能和用戶建立同理心,創造出真正的價值。”在巴川眼中,AI與大數據的價值絕不僅在商業范疇。他愿意看到AI與鄉村、環保、農業等領域相結合,守護青山綠水,也讓更多人像自己那樣從自然中獲得滋養和美好回憶。
“我相信最終極的AI應該是有溫度的,只要AI研發者熱愛世界熱愛生活,就能創造出有溫度的AI,將來也會被我們創造出的AI溫柔以待。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.