99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

大模型面經 - 騰訊混元

0
分享至

小森(南京大學 計算機碩士在讀)

部門與崗位:TEG - 混元大模型團隊 - 大模型對齊

一面

自我介紹,過實習,講論文,論文過的比較細,有說的籠統的地方面試官會實時進行詢問交流

了解哪些大模型,簡要挑一兩個介紹一下,當時說了 Qwen 和 DeepSeek,然后面試官又問了這兩個有什么區別

接著上一問,為什么大家都開始探索 MoE 架構,MoE 相比 Dense 有什么好處

在之前實習的時候用 LoRA 微調過 Qwen,于是問了有沒有全量微調過,有沒有對比過兩者的性能表現

講一下大模型訓練和推理的流程,SFT 和 RLHF 的作用分別是什么

在 RLHF 中,目前主流的強化學習算法有哪幾個,寫一下損失函數的表達式

代碼:22. 括號生成

代碼:多頭自注意力

一面問的八股還是比較多的,問的也比較細,而且還寫了兩道代碼題,整個面試花的時間也比較多,大概一個半小時左右

二面

自我介紹,過實習和論文,面試官會一起進行探討,包括工作的動機、貢獻和結果,也會提一些問題和建議

之前實習用 DeepSpeed 微調過 Qwen2-72B,于是面試官問了 ZeRO-1,ZeRO-2,ZeRO-3 三個模式的區別

當時你用 DeepSpeed ZeRO-3 來微調 Qwen2-72B,每一張卡占用的顯存大概是多少,估算一下為什么是占這么多的顯存

除了 DeepSpeed,還用過其他的什么優化方法嗎

我看你也用到了 LoRA,知道 LoRA 的原理嗎,A 和 B 兩個矩陣怎么初始化,有了解過其他的初始化方法嗎

對 RLHF 了解的多嗎

代碼:3. 無重復字符的最長子串

二面更多的是結合具體的工作來問的,從用到的東西來引出問題,問的也比較靈活。當然因為部門主要是做對齊的,所以也大概聊了聊 RLHF

三面

自我介紹,挑一個覺得做的比較好的論文和實習講一下,面試官問的比較詳細,為什么選現在這種方案,為什么 work,其他方案有考慮嗎

在微調 Qwen 的時候,數據是怎么構造的,有用到什么數據清洗方法嗎,數據配比是怎么做的

講一下 RLHF 的流程,之前有用 RLHF 做過模型對齊嗎

在做對齊的時候,為什么 SFT 之后還要做 RLHF,只用 SFT 可以嗎

知道哪些強化學習算法,除了 PPO 和 DPO 這些呢,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改進

開放題:對目前大模型的發展有什么看法

代碼:零錢的兩個題 322. 零錢兌換518. 零錢兌換 II

三面面試官更聚焦于對齊這一塊的內容,考的比較深。由于之前沒有接觸過強化學習,答得還是比較吃力的,不過面試官還挺好的,會一起討論來做引導

四面

自我介紹,過論文和實習,問的也比較細,這里能明顯的感受出來面試官的視角更系統,會把這些工作串起來問

我看你簡歷上沒寫 RLHF,平常有用過 RLHF 嗎

推導一下神經網絡反向傳播的過程

一道排列組合的概率題

開放題:你覺得大模型目前還有哪些可以改進的點

四面整體更看重思維和基礎,沒有考察什么八股

總結

一共四輪技術面,整體來說強度比較大,對于大模型八股的考察比較細,對大模型的理解問的也比較深刻,包括一些數理邏輯基礎,考察的比較全面


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
收到中國邀請后,李在明第二天親自答復,訪華的決心不好下

收到中國邀請后,李在明第二天親自答復,訪華的決心不好下

科技處長
2025-07-04 23:08:36
三星三折疊,蘋果拼輕薄:2025 下半年旗艦機前瞻

三星三折疊,蘋果拼輕薄:2025 下半年旗艦機前瞻

愛范兒
2025-07-04 11:16:17
啥原因導致婆婆地位越來越低?網友:根本原因是養了個不孝順兒子

啥原因導致婆婆地位越來越低?網友:根本原因是養了個不孝順兒子

娛樂圈人物大賞
2025-06-15 00:15:07
買車為啥別買白色?交警:教你一句選色口訣,跟著買,不會錯

買車為啥別買白色?交警:教你一句選色口訣,跟著買,不會錯

全金貓眼
2025-07-02 20:26:02
俄烏戰爭:盧宇光列傳

俄烏戰爭:盧宇光列傳

憑闌聽史
2025-07-02 17:28:51
官方:韓國國腳、原天津權健外援權敬原加盟K聯賽安養隊

官方:韓國國腳、原天津權健外援權敬原加盟K聯賽安養隊

懂球帝
2025-07-04 10:07:07
76歲何慶魁梅開三度,被親兒子捅刀:他玩不動了,每月1萬夠花!

76歲何慶魁梅開三度,被親兒子捅刀:他玩不動了,每月1萬夠花!

火之文
2025-07-04 18:06:19
大連人注意,還有雨!今天起,出門多穿紅色衣服…

大連人注意,還有雨!今天起,出門多穿紅色衣服…

魯中晨報
2025-07-04 15:47:09
短劇男主出道前后對比,誰是天然帥哥誰是濾鏡美男,差距一目了然

短劇男主出道前后對比,誰是天然帥哥誰是濾鏡美男,差距一目了然

不似少年游
2025-07-02 08:20:37
前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對轟!

前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對轟!

阿龍聊軍事
2025-06-07 20:04:46
日本最著名的便利店,拍過的片子100T硬盤都裝不下

日本最著名的便利店,拍過的片子100T硬盤都裝不下

beebee
2025-07-02 11:11:35
中國U16男足1:1戰平日本,浮嶋敏證明自己帥惟浩上限郜林

中國U16男足1:1戰平日本,浮嶋敏證明自己帥惟浩上限郜林

李廣專業體育評論
2025-07-04 21:32:20
國務院任免國家工作人員:免去費東斌的國家鐵路局局長職務

國務院任免國家工作人員:免去費東斌的國家鐵路局局長職務

界面新聞
2025-07-03 16:47:53
探花視頻是怎么拍出來的?

探花視頻是怎么拍出來的?

吃瓜黨二號頭目
2025-06-18 10:54:04
森林是不是越多越好?3.06億年前的地球,早就交了一次昂貴的學費

森林是不是越多越好?3.06億年前的地球,早就交了一次昂貴的學費

半解智士
2025-06-20 19:12:01
發現一個奇怪的現象:辭職或失業后不上班的人,工資沒了,但時間久了卻再也不想回去上班了。為什么呢?

發現一個奇怪的現象:辭職或失業后不上班的人,工資沒了,但時間久了卻再也不想回去上班了。為什么呢?

互聯網思維
2025-06-21 23:33:51
寧可臺灣不長草,也要解放臺灣島!

寧可臺灣不長草,也要解放臺灣島!

華山穹劍
2025-07-04 21:26:36
“只有將亮度調亮,才能看懂的梗!”哈哈哈哈哈,細節決定成敗

“只有將亮度調亮,才能看懂的梗!”哈哈哈哈哈,細節決定成敗

滄海一書客
2025-02-15 10:40:42
伊朗國葬現場,黑衣人突現,美歐大驚失色:這不可能!

伊朗國葬現場,黑衣人突現,美歐大驚失色:這不可能!

林子說事
2025-07-04 04:57:05
中國女籃迎戰澳大利亞:家門口的熱身之戰

中國女籃迎戰澳大利亞:家門口的熱身之戰

環球體壇啄木鳥
2025-07-04 11:37:11
2025-07-05 03:16:49
人工智能研究 incentive-icons
人工智能研究
分享深度學習、CV、NLP
276文章數 130關注度
往期回顧 全部

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

體育要聞

體壇最爽打工人:37歲被裁,工資領到72歲

娛樂要聞

李宇春身上的標簽哪個才是真的?

財經要聞

茅臺從3300跌到1700 泡沫破了酒才真香

科技要聞

被雷軍"震驚"后,何小鵬"藏起"G7的戰報

汽車要聞

重生之拿回銷量 領克10 EM-P搶鮮實拍

態度原創

數碼
房產
教育
本地
公開課

數碼要聞

TCL實業盧春水:彩電是一個朝陽行業,我們正在蓬勃發展

房產要聞

重磅發布!海南樓市2025上半年Top10榜單出爐!

教育要聞

留學與國內升學:魚和熊掌真的不可兼得嗎?

本地新聞

建筑地標如何成為城市人才匯聚的 “強磁場”?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 海兴县| 娄烦县| 慈利县| 孙吴县| 德惠市| 屏东县| 玛曲县| 武川县| 屏边| 开远市| 明星| 莱州市| 连州市| 团风县| 册亨县| 高尔夫| 元氏县| 昌图县| 安国市| 黄骅市| 台北市| 大兴区| 白城市| 博乐市| 南溪县| 沙田区| 成安县| 固镇县| 泰和县| 乌拉特后旗| 荣昌县| 阳朔县| 亳州市| 怀柔区| 英山县| 江阴市| 庐江县| 九寨沟县| 全南县| 绥棱县| 巩义市|