99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

百度、騰訊、阿里大模型面試,一面到三面

0
分享至

來源:機器學習社區


百度

部門與崗位:百度TPG - 文心一言團隊- 大模型算法崗

一面

  1. 自我介紹和項目介紹

  2. 介紹一下了解的大模型有哪些,這些模型在結構上有什么差異

  3. 說一下大模型常用的位置編碼有哪些,各有什么優缺點

  4. 介紹一下大模型的預訓練后訓練以及推理是怎么做的,并且詳細問了 RLHF 的做法,包括 PPO 算法的原理,以及 DPO 和 PPO 的區別

  5. 大模型的超長上下文是怎么做的,比如說 KIMI

  6. 大模型智能體是怎么工作的,有哪些組件

  7. 場景題:如何訓練一個大模型,可以做到精確的提取摘要

  8. 代碼:股票的四個題

  1. 買賣股票的最佳時機

  1. 買賣股票的最佳時機 II

  1. 買賣股票的最佳時機 III

  1. 買賣股票的最佳時機 IV

整體來說一面偏基礎,問的問題也主要是一些大模型的八股問題,沒有太多發散性的問題,難度不大。但是考察的還是挺全面的,整個面試一個半小時多

二面

  1. 自我介紹

  2. 因為之前是做 CV 的,所以面試官問了 CV 和 NLP 的區別和聯系,在 Transformer 的大背景下,CV、NLP,包括語音等,能否實現大一統

  3. 訓練大模型的時候數據怎么清洗,怎么處理,怎么配比,怎樣操作能更容易使模型達到更好的性能

  4. 什么是大模型的幻覺,如何減輕幻覺問題

  5. 大模型的復讀問題是怎么產生的,業內一般有什么解決辦法

  6. 大模型的工具調用怎么實現

  7. Agent 有哪幾部分構成,了解哪些具體的實現方法

  8. 開放題:之前訓練大模型的時候遇到過什么困難,你是怎么解決的

  9. 代碼:實現一個 Tokenizer,只能用 PyTorch 基礎語法

二面相比于一面更加看重綜合素質,喜歡考察分析問題解決問題的能力,對于一些細節知識點的考察并不多。二面也面試了一個多小時,面試官還是挺專業的。

三面

  1. 首先過項目,但是問的特別細致,尤其是一個 Agent 的項目,從背景,到動機,再到做法,最后的結果,都問的非常細,大概有半個小時的時間

  2. 開放題:你覺得當前大模型還存在怎樣的問題,有什么解決辦法嗎

  3. 開放題:讓你自己設計一個 Agent,會怎么做,為什么這樣做

  4. 找工作比較在意的點是什么,除了薪資還有什么

  5. 對文心一言這個產品了解嗎,有哪些優點和值得改進的點

  6. 如果給你發 Offer,你到這個團隊能做出什么貢獻

三面整體來說更加綜合,不止有一些技術問題,還有職業規劃這些問題,更加考察整體的能力。面試官應該是這個團隊的大老板,看問題更加系統和全面,整體面下來還是比較有壓力的。

總結

整體下來感覺面試官都是非常專業的,面試深度和廣度都很可以,三場面試層層遞進。面試官人也不錯,如果比較滿意的話也愿意多花時間來聊,而不是嚴格的卡一個小時這種完任務式的面試。

騰訊

背景:本弱雞 211 本碩,nlp,無論文有實習(老板沒資源且放養),本科有 acm 經歷(1 銅),面試 pcg 日常實習。

一面

Q1:了解什么機器學習算法,講一下原理?

當時只記得實體識別用到了隱馬爾可夫模型,講了講怎么怎么定義觀測狀態和隱藏狀態、前向傳播、解碼和應用場景。

Q2:講一下 Bert 的結構和怎么訓練的,怎么用 bert 做下游任務?

八股,雙向 transformer encoder 結構,預訓練任務包括 MLM 和 NSP,詳細講了講。下游任務做過文本分類、關系提取等,用 cls 做預測;也可以做摘要生成等任務。

Q3:有沒有了解過 LLM,有自己調過嗎,了解 RLHF 過程嗎?

自己訓練過 llama3 和 glm(8、9B),跑過 sft 和 dpo,有看過一些技術報告。當時用 deepspeed 跑的,然后講了講 RLHF 三個過程,最后 PPO 四個模型的作用。

Q4:有了解強化學習嗎?能不能詳細說說 PPO 是什么?

只通過 RLHF 了解過一點,好像跟面試官想要的答案不一致,跳過。

Q5:怎么擴展大模型的最大輸入長度?

改變 transformer 結構(GQA,MQA,flash attention等),旋轉位置編碼 RoPE 等(只看過論文,自己用的很少,就想到啥說啥)

Q6:有了解過模型訓練方法嗎?

沒用過(感覺要涼)

Q7:有了解過文生圖嗎?

有了解過一些項目,diffusion 和 clip 原理,之前有自己跑過 unet+diffusion+vae 做文生圖任務,講了下為什么這么做。

Q8:手撕快排

當天晚上收到了參加二面的郵件,小激動。

二面

二面沒有手撕代碼,問了問項目:

  • 講一下微調大模型是怎么做的,數據集怎么構建,數據怎么處理

  • 看項目中用了 RAG,講一下設計流程

  • 其中文本 chunk 怎么做的,為什么這么做

  • 中間有沒有遇到什么困難,怎么提高召回,如果文本輸入大模型后效果不好怎么辦

  • 怎么提高大模型的外推性

  • 有了解過文生圖任務嗎(怎么又問這個)

然后草草結束,一天后流程結束(掛了,繼續努力)

阿里

部門與崗位:淘天集團 - 搜推智能產品事業部 - 多模態大模型

一面

  1. 首先是自我介紹和過項目,面試官還一起探討項目用到的方法,可行性之類的

  2. 介紹一下 CLIP

  3. 了解 LoRA 嗎,LoRA 微調的原理是什么

  4. 了解哪些多模態大模型,簡要介紹幾個

  5. BLIP 的三個損失函數分別是什么,數據是怎樣清洗的

  6. BLIP2 相對于 BLIP 有哪些改進,BLIP3 又有哪些改進

  7. Qwen-VL 的三個訓練流程分別是什么,有什么作用

  8. 視覺編碼器和 LLM 連接時,使用 BLIP2 中 Q-Former 那種復雜的 Adaptor 好還是 LLaVA 中簡單的 MLP 好,說說各自的優缺點

  9. 代碼:實現多頭自注意力

一面比較常規,幾乎都是八股問題,我覺得只要了解常見的多模態大模型都問題不大,主要還是要理解各個模型設計的動機是什么,這也是面試最喜歡考察的

二面

  1. 自我介紹和過項目,簡要問了項目中使用某些方法的動機,以及是否會導致其他的問題

  2. 了解 Transformer 嗎,編碼器和解碼器的注意力有什么區別,在計算注意力中時除以 \sqrt{d_k} 的原因是什么

  3. 后來有哪些比較經典的基于 Transformer 的語言模型,Qwen 相比于原始 Transformer 有哪些結構上的改動,Qwen2 又有哪些改進

  4. 了解 RLHF 嗎,DPO 和 PPO 有什么區別,Loss 是什么樣的,各自的優缺點是什么

  5. 介紹一下 CLIP,還了解什么其他的對比學習方法

  6. 開放題:了解哪些多模態大模型,目前多模態大模型最大的問題是什么

  7. 代碼:1143. 最長公共子序列

二面其實也偏常規,幾乎也都是八股問題,但是也考察了一些對模型的理解以及知識面的廣度,整體來說比一面的難度大一些

三面

  1. 自我介紹,然后詳細過了一下項目

  2. 了解哪些大模型和多模態大模型,然后就聊了大模型這一路是怎么發展過來的,Transformer、BERT、GPT、LLaMA、Qwen 這些,以及當時的 o1 推理模型

  3. 平常有嘗試過訓練過大模型嗎,規模小一點的也沒關系

  4. 聊天,包括職業規劃等等

三面比較輕松,面試官說知識點前面兩面都考察過了,三面就輕松一些,大概40來分鐘吧

總結

整體來說面試體驗比較好,問的問題都不難,面試官也都不錯,遇到一些卡殼的地方也會進行引導討論,面試氛圍很輕松。三面應該是加面的大老板面,從交流可以看出來對整個大模型這塊的理解還是很深刻的,收獲不小。

百度

部門與崗位:百度TPG - 文心一言團隊- 大模型算法崗

一面

  1. 自我介紹和項目介紹

  2. 介紹一下了解的大模型有哪些,這些模型在結構上有什么差異

  3. 說一下大模型常用的位置編碼有哪些,各有什么優缺點

  4. 介紹一下大模型的預訓練后訓練以及推理是怎么做的,并且詳細問了 RLHF 的做法,包括 PPO 算法的原理,以及 DPO 和 PPO 的區別

  5. 大模型的超長上下文是怎么做的,比如說 KIMI

  6. 大模型智能體是怎么工作的,有哪些組件

  7. 場景題:如何訓練一個大模型,可以做到精確的提取摘要

  8. 代碼:股票的四個題

  1. 買賣股票的最佳時機

  1. 買賣股票的最佳時機 II

  1. 買賣股票的最佳時機 III

  1. 買賣股票的最佳時機 IV

整體來說一面偏基礎,問的問題也主要是一些大模型的八股問題,沒有太多發散性的問題,難度不大。但是考察的還是挺全面的,整個面試一個半小時多

二面

  1. 自我介紹

  2. 因為之前是做 CV 的,所以面試官問了 CV 和 NLP 的區別和聯系,在 Transformer 的大背景下,CV、NLP,包括語音等,能否實現大一統

  3. 訓練大模型的時候數據怎么清洗,怎么處理,怎么配比,怎樣操作能更容易使模型達到更好的性能

  4. 什么是大模型的幻覺,如何減輕幻覺問題

  5. 大模型的復讀問題是怎么產生的,業內一般有什么解決辦法

  6. 大模型的工具調用怎么實現

  7. Agent 有哪幾部分構成,了解哪些具體的實現方法

  8. 開放題:之前訓練大模型的時候遇到過什么困難,你是怎么解決的

  9. 代碼:實現一個 Tokenizer,只能用 PyTorch 基礎語法

二面相比于一面更加看重綜合素質,喜歡考察分析問題解決問題的能力,對于一些細節知識點的考察并不多。二面也面試了一個多小時,面試官還是挺專業的。

三面

  1. 首先過項目,但是問的特別細致,尤其是一個 Agent 的項目,從背景,到動機,再到做法,最后的結果,都問的非常細,大概有半個小時的時間

  2. 開放題:你覺得當前大模型還存在怎樣的問題,有什么解決辦法嗎

  3. 開放題:讓你自己設計一個 Agent,會怎么做,為什么這樣做

  4. 找工作比較在意的點是什么,除了薪資還有什么

  5. 對文心一言這個產品了解嗎,有哪些優點和值得改進的點

  6. 如果給你發 Offer,你到這個團隊能做出什么貢獻

三面整體來說更加綜合,不止有一些技術問題,還有職業規劃這些問題,更加考察整體的能力。面試官應該是這個團隊的大老板,看問題更加系統和全面,整體面下來還是比較有壓力的。

總結

整體下來感覺面試官都是非常專業的,面試深度和廣度都很可以,三場面試層層遞進。面試官人也不錯,如果比較滿意的話也愿意多花時間來聊,而不是嚴格的卡一個小時這種完任務式的面試。

最后推薦一個我正在學習的AI Agent智能體實戰課


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
五一熱門旅游城市排名:北京209億墊底,河南371億第二,第一是誰

五一熱門旅游城市排名:北京209億墊底,河南371億第二,第一是誰

跳跳歷史
2025-05-08 14:19:54
阿里前CEO火了!今天,一把賺10億元

阿里前CEO火了!今天,一把賺10億元

中國基金報
2025-05-08 19:37:46
柯文哲事件真相浮出水面,或迎來釋放,北檢露出馬腳,黃國昌亮了

柯文哲事件真相浮出水面,或迎來釋放,北檢露出馬腳,黃國昌亮了

阿纂看事
2025-05-08 22:14:27
黑煙!教宗選舉第一輪投票,無人勝出!

黑煙!教宗選舉第一輪投票,無人勝出!

意訊
2025-05-08 03:22:17
各取所需!美媒曬4方交易方案:湖人獲加福德獨行俠拿下歐文替身

各取所需!美媒曬4方交易方案:湖人獲加福德獨行俠拿下歐文替身

鍋子籃球
2025-05-08 21:47:52
特斯拉副總裁陶琳:超60家中國供應商已進入特斯拉全球采購體系!國內消費者可以用全球最低價格買到Model 3/Y

特斯拉副總裁陶琳:超60家中國供應商已進入特斯拉全球采購體系!國內消費者可以用全球最低價格買到Model 3/Y

和訊網
2025-05-07 09:59:11
永輝“胖東來模式”上海第四家來了!5月9日開業,設立外貿產品專區

永輝“胖東來模式”上海第四家來了!5月9日開業,設立外貿產品專區

隨申Hi
2025-05-08 19:07:02
一年連關三家!上海門店宣布閉店,全部清空,曾紅極一時

一年連關三家!上海門店宣布閉店,全部清空,曾紅極一時

21世紀經濟報道
2025-05-08 20:42:21
胖東來發布和田玉、翡翠退貨聲明:不扣手續費等任何費用

胖東來發布和田玉、翡翠退貨聲明:不扣手續費等任何費用

中新經緯
2025-05-08 18:10:25
阿斯報:羅德里戈可能今夏離開皇馬,曼城和利物浦對其有意

阿斯報:羅德里戈可能今夏離開皇馬,曼城和利物浦對其有意

懂球帝
2025-05-08 23:07:39
DeepSeek認為各年齡段的合理存款,看看你達標了沒有?

DeepSeek認為各年齡段的合理存款,看看你達標了沒有?

小人物看盡人間百態
2025-03-10 14:44:04
謝婷婷在加拿大舉辦迎嬰派對,挺大肚子拍照仍優雅,現場擺滿禮物

謝婷婷在加拿大舉辦迎嬰派對,挺大肚子拍照仍優雅,現場擺滿禮物

觀察鑒娛
2025-05-08 09:10:03
中國國防部:奉勸有關國家不要引狼入室、甘當棋子

中國國防部:奉勸有關國家不要引狼入室、甘當棋子

環球網資訊
2025-05-08 20:24:05
恭喜庫里!科爾官宣決定!系列賽有人托底,西決復出,沖第五冠

恭喜庫里!科爾官宣決定!系列賽有人托底,西決復出,沖第五冠

阿泰希特
2025-05-08 14:38:02
青島市紀委監委通報:滕寶弟,主動投案

青島市紀委監委通報:滕寶弟,主動投案

魯中晨報
2025-05-08 18:32:09
梵蒂岡選教皇的大烏龍,最后得靠化學家解決

梵蒂岡選教皇的大烏龍,最后得靠化學家解決

果殼
2025-05-08 14:06:46
何超蓮不再隱瞞,首談為何與竇驍結婚2年不要孩子,原因太過現實

何超蓮不再隱瞞,首談為何與竇驍結婚2年不要孩子,原因太過現實

溫讀史
2025-04-08 18:28:34
一覺醒來,都沉默了!美國財長這次見中國,終于不繞彎子了

一覺醒來,都沉默了!美國財長這次見中國,終于不繞彎子了

別人都叫我阿腈
2025-05-07 06:06:11
泡泡瑪特股份被創始股東高位清倉

泡泡瑪特股份被創始股東高位清倉

大象新聞
2025-05-08 12:18:28
雷軍再揮 “價格戰”,39 元剃須刀,網友我以前買的都是智商稅!

雷軍再揮 “價格戰”,39 元剃須刀,網友我以前買的都是智商稅!

小柱解說游戲
2025-05-08 06:43:48
2025-05-08 23:44:49
機器學習與Python社區 incentive-icons
機器學習與Python社區
機器學習算法與Python
2949文章數 11008關注度
往期回顧 全部

科技要聞

理想L煥新版來了,輔助駕駛芯片全系升級

頭條要聞

美財長:特朗普考慮豁免部分商品最高145%關稅

頭條要聞

美財長:特朗普考慮豁免部分商品最高145%關稅

體育要聞

面對一群天賦怪,阿森納只能接受失敗

娛樂要聞

劉畊宏老婆補刀 清場風波口碑翻車!

財經要聞

57政策解讀:力度空前的系統性穩增長舉措

汽車要聞

昨天李想點評了AI 今天我讓AI點評了理想

態度原創

家居
旅游
時尚
教育
藝術

家居要聞

侘寂美學 樸素而有生機

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

學會這5個萬能公式,好看一整個夏天

教育要聞

數學競賽題,這道題確實很巧妙啊

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 米脂县| 泽州县| 乡宁县| 改则县| 普宁市| 秦安县| 西充县| 大悟县| 龙泉市| 灵武市| 手游| 嘉荫县| 崇阳县| 左贡县| 翼城县| 健康| 开化县| 宣化县| 惠来县| 无为县| 安陆市| 益阳市| 陆川县| 射洪县| 平塘县| 汶川县| 陆丰市| 连州市| 开原市| 陈巴尔虎旗| 监利县| 虞城县| 定南县| 彭泽县| 桐乡市| 葫芦岛市| 临猗县| 和平区| 二连浩特市| 青海省| 焉耆|