99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

智譜大模型算法崗面經(jīng)!

0
分享至

來源:AIGC小白入門記

最近參加了智譜大模型算法崗位的面試,收獲頗豐,特地來分享一下這次的面試經(jīng)歷,希望能給正在求職的小伙伴們提供一些參考。

一、面試流程

面試整體分為三個(gè)部分:手撕代碼、項(xiàng)目介紹以及專業(yè)知識(shí)問答(八股)。

(一)手撕代碼

面試官首先讓我手撕一個(gè) tokenizer,tokenizer 是自然語言處理中用于將文本拆分成一個(gè)個(gè)標(biāo)記(token)的工具。我從最簡(jiǎn)單的字符級(jí)別 tokenizer 開始講起,然后逐步擴(kuò)展到基于詞典的分詞方法,最后還提到了一些基于深度學(xué)習(xí)的預(yù)訓(xùn)練分詞模型,如 BERT 的 WordPiece 算法。面試官對(duì)細(xì)節(jié)把握得很嚴(yán),讓我詳細(xì)解釋了如何處理一些特殊字符、未知詞匯等問題;

還讓我用偽代碼簡(jiǎn)單描述了 RAG(Retrieval-Augmented Generation)模型的基本流程。RAG 是一種結(jié)合了檢索和生成的模型,先從一個(gè)大規(guī)模的文檔集合中檢索出與輸入文本相關(guān)的文檔片段,然后再基于這些片段生成目標(biāo)文本。我用偽代碼展示了檢索部分和生成部分的交互過程,面試官對(duì)這個(gè)部分的邏輯和實(shí)現(xiàn)細(xì)節(jié)很感興趣,問了我一些優(yōu)化思路。

(二)項(xiàng)目介紹

項(xiàng)目介紹部分是面試的重點(diǎn)之一,面試官讓我詳細(xì)講解我之前參與的一個(gè)項(xiàng)目。

  1. 項(xiàng)目具體解決問題:我介紹的項(xiàng)目是一個(gè)智能問答系統(tǒng),主要解決的是用戶在海量數(shù)據(jù)中快速獲取準(zhǔn)確信息的問題。例如,用戶可以通過自然語言提問,系統(tǒng)能夠理解問題并從數(shù)據(jù)庫中檢索出相關(guān)的答案。

  2. 每個(gè)模塊如何實(shí)現(xiàn):這個(gè)項(xiàng)目分為多個(gè)模塊,包括自然語言理解(NLU)、知識(shí)庫管理、問答匹配和答案生成等模塊。在 NLU 模塊,我詳細(xì)講解了如何使用深度學(xué)習(xí)模型(如 LSTM)來提取問題的語義特征;在知識(shí)庫管理模塊,我介紹了如何構(gòu)建和維護(hù)一個(gè)結(jié)構(gòu)化的知識(shí)庫,以支持高效的檢索;在問答匹配模塊,我講述了如何通過計(jì)算問題和知識(shí)庫中條目的相似度來找到最相關(guān)的答案;在答案生成模塊,我提到了使用模板生成和基于生成模型(如 GPT)生成兩種策略。

  3. NL2SQL 在處理多表查詢的時(shí)候采取啥策略:這個(gè)項(xiàng)目中用到了 NL2SQL(自然語言到結(jié)構(gòu)化查詢語言)技術(shù),用于將用戶的自然語言問題轉(zhuǎn)換為 SQL 查詢語句。在處理多表查詢時(shí),我采用了基于語義解析的方法,首先解析出問題中涉及的實(shí)體、關(guān)系和屬性,然后根據(jù)這些信息構(gòu)建出多表連接的 SQL 查詢。例如,對(duì)于一個(gè)涉及兩個(gè)表(如“學(xué)生表”和“課程表”)的查詢問題,我會(huì)先解析出學(xué)生和課程之間的關(guān)系(如“選課”關(guān)系),然后生成相應(yīng)的 JOIN 語句來連接這兩個(gè)表。

  4. k8s 和 docker 在項(xiàng)目中的作用:在項(xiàng)目的部署階段,我們使用了 Docker 來容器化每個(gè)模塊,這樣可以保證每個(gè)模塊的運(yùn)行環(huán)境一致,避免了“在我的機(jī)器上可以運(yùn)行”的問題。而 Kubernetes(k8s)則用于管理這些容器,實(shí)現(xiàn)自動(dòng)擴(kuò)縮容、負(fù)載均衡等功能。例如,當(dāng)問答系統(tǒng)的訪問量突然增加時(shí),k8s 可以自動(dòng)啟動(dòng)更多的容器實(shí)例來應(yīng)對(duì)高流量,保證系統(tǒng)的穩(wěn)定運(yùn)行。

(三)專業(yè)知識(shí)問答(八股)

這部分主要考察我對(duì)一些常見算法、模型和框架的理解。

  1. 對(duì) PPO、DPO、GRPO 計(jì)算邏輯的理解:PPO(Proximal Policy Optimization)是一種強(qiáng)化學(xué)習(xí)算法,通過截?cái)喔怕时葋硐拗撇呗愿碌姆龋瑥亩WC更新的穩(wěn)定性。DPO(Deep Policy Optimization)是 PPO 的一種改進(jìn)版本,引入了深度學(xué)習(xí)的思想,可以更好地處理復(fù)雜的策略函數(shù)。GRPO(Generalized Reinforcement Policy Optimization)則是一種更通用的框架,可以涵蓋多種強(qiáng)化學(xué)習(xí)算法。我詳細(xì)解釋了它們的計(jì)算邏輯,包括如何計(jì)算目標(biāo)函數(shù)、如何更新策略等。

  2. 對(duì) KL 散度的三種估計(jì)的理解:KL 散度(Kullback–Leibler Divergence)是衡量?jī)蓚€(gè)概率分布差異的指標(biāo)。常見的估計(jì)方法有直接計(jì)算法、蒙特卡洛估計(jì)法和變分估計(jì)法。直接計(jì)算法需要知道兩個(gè)分布的解析形式,蒙特卡洛估計(jì)法通過采樣來近似計(jì)算 KL 散度,而變分估計(jì)法則通過引入一個(gè)變分分布來降低計(jì)算復(fù)雜度。我對(duì)比了這三種方法的優(yōu)缺點(diǎn),例如直接計(jì)算法精度高但適用范圍有限,蒙特卡洛估計(jì)法簡(jiǎn)單但可能需要大量樣本,變分估計(jì)法可以用于復(fù)雜的分布但可能存在偏差。

  3. LORA 和 p-tuning v2 的區(qū)別,怎么初始化:LORA(Low-Rank Adaptation)是一種參數(shù)高效的微調(diào)方法,通過在預(yù)訓(xùn)練模型的每一層插入低秩矩陣來實(shí)現(xiàn)微調(diào)。p-tuning v2 是一種基于提示的學(xué)習(xí)方法,通過在輸入中添加提示來引導(dǎo)模型生成期望的輸出。它們的主要區(qū)別在于 LORA 是直接修改模型的參數(shù),而 p-tuning v2 是通過改變輸入的形式來影響模型的輸出。在初始化方面,LORA 的低秩矩陣通常初始化為小的隨機(jī)值,而 p-tuning v2 的提示可以通過一些啟發(fā)式方法來設(shè)計(jì),例如根據(jù)任務(wù)的語義來選擇合適的提示詞。

  4. DeepSeek R1 訓(xùn)練全流程,MLA 具體怎么做的:DeepSeek R1 是一個(gè)大規(guī)模的預(yù)訓(xùn)練模型,其訓(xùn)練全流程包括數(shù)據(jù)預(yù)處理、模型初始化、訓(xùn)練迭代和模型評(píng)估等步驟。在數(shù)據(jù)預(yù)處理階段,需要對(duì)海量的文本數(shù)據(jù)進(jìn)行清洗、分詞和編碼等操作;模型初始化時(shí),會(huì)隨機(jī)初始化模型的參數(shù);在訓(xùn)練迭代過程中,使用大規(guī)模的計(jì)算資源進(jìn)行分布式訓(xùn)練,通過反向傳播更新模型參數(shù);最后通過一些指標(biāo)(如困惑度、準(zhǔn)確率等)來評(píng)估模型的性能。MLA(Multi-Label Attention)是 DeepSeek R1 中用于處理多標(biāo)簽分類任務(wù)的一種機(jī)制,它通過引入多個(gè)注意力頭來分別關(guān)注不同的標(biāo)簽信息,從而提高多標(biāo)簽分類的性能。

  5. 梯度爆炸和消失怎么處理的:梯度爆炸和消失是深度學(xué)習(xí)訓(xùn)練過程中常見的問題。對(duì)于梯度爆炸,可以采用梯度裁剪的方法,將梯度限制在一個(gè)合理的范圍內(nèi);對(duì)于梯度消失,可以通過使用合適的激活函數(shù)(如 ReLU 及其變體)、初始化方法(如 Xavier 初始化)和網(wǎng)絡(luò)結(jié)構(gòu)(如殘差網(wǎng)絡(luò))來緩解。我詳細(xì)解釋了這些方法的原理和應(yīng)用場(chǎng)景。

  6. torch 中 register parameter 和 buffer 的區(qū)別:在 PyTorch 中,register_parameter用于注冊(cè)模型的參數(shù),這些參數(shù)會(huì)被自動(dòng)加入到模型的參數(shù)列表中,會(huì)在訓(xùn)練過程中被優(yōu)化器更新。而register_buffer用于注冊(cè)一些不需要更新的張量,例如模型的輸入數(shù)據(jù)、中間變量等,這些張量不會(huì)被優(yōu)化器更新,但會(huì)在模型的前向傳播過程中被使用。我通過一個(gè)簡(jiǎn)單的例子來說明它們的區(qū)別。

  7. torch 如何實(shí)現(xiàn)不記錄梯度:在 PyTorch 中,可以通過設(shè)置torch.no_grad()上下文管理器來實(shí)現(xiàn)不記錄梯度。在torch.no_grad()的作用范圍內(nèi),所有的操作都不會(huì)記錄梯度,這在推理階段或者一些不需要計(jì)算梯度的場(chǎng)景中非常有用。例如,在使用預(yù)訓(xùn)練模型進(jìn)行推理時(shí),可以使用torch.no_grad()來提高計(jì)算效率。

  8. torch squeeze 和 unsqueeze 干嘛的torch.squeezetorch.unsqueeze是 PyTorch 中用于操作張量維度的函數(shù)。torch.squeeze用于去除張量中大小為 1 的維度,例如將一個(gè)形狀為[1, 3, 1, 4]的張量壓縮為[3, 4];而torch.unsqueeze則用于在張量的指定位置插入一個(gè)大小為 1 的維度,例如將一個(gè)形狀為[3, 4]的張量擴(kuò)展為[1, 3, 4]。這兩個(gè)函數(shù)在處理張量的維度時(shí)非常方便,尤其是在進(jìn)行張量拼接、廣播等操作時(shí)。

  9. python 設(shè)計(jì)刪除流程的時(shí)候,若涉及可變和不可變對(duì)象該如何 debug:在 Python 中,可變對(duì)象(如列表、字典等)和不可變對(duì)象(如整數(shù)、字符串等)在刪除操作時(shí)的行為有所不同。對(duì)于可變對(duì)象,直接修改對(duì)象的內(nèi)容會(huì)影響所有引用該對(duì)象的變量;而對(duì)于不可變對(duì)象,刪除操作只是讓變量不再指向該對(duì)象,不會(huì)影響其他變量。在設(shè)計(jì)刪除流程時(shí),需要注意這些區(qū)別,避免出現(xiàn)意外的錯(cuò)誤。調(diào)試時(shí)可以通過打印變量的引用地址(使用id()函數(shù))來檢查變量是否指向同一個(gè)對(duì)象,從而確定刪除操作是否按預(yù)期執(zhí)行。

  10. 多機(jī)多卡和單機(jī)多卡的實(shí)現(xiàn)上有什么不同:多機(jī)多卡和單機(jī)多卡都是用于加速深度學(xué)習(xí)模型訓(xùn)練的分布式計(jì)算方式。單機(jī)多卡主要通過

春天的美妙時(shí)光

LEARN FROM LEI FENG


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
商務(wù)部:7月5日起,對(duì)原產(chǎn)于歐盟的進(jìn)口相關(guān)白蘭地征收反傾銷稅

商務(wù)部:7月5日起,對(duì)原產(chǎn)于歐盟的進(jìn)口相關(guān)白蘭地征收反傾銷稅

界面新聞
2025-07-04 15:03:00
華為大模型疑似造假,被扒是用阿里大模型“升級(jí)改造”的

華為大模型疑似造假,被扒是用阿里大模型“升級(jí)改造”的

回旋鏢
2025-07-04 15:46:30
火車砸窗小伙處理結(jié)果出來了,上鐵道歉,七扇窗戶被砸損失超2萬

火車砸窗小伙處理結(jié)果出來了,上鐵道歉,七扇窗戶被砸損失超2萬

辣條小劇場(chǎng)
2025-07-04 13:19:38
大瓜!李天一豪賭輸千萬,夢(mèng)鴿被限制出境,84歲李雙江被坑慘了?

大瓜!李天一豪賭輸千萬,夢(mèng)鴿被限制出境,84歲李雙江被坑慘了?

壹月情感
2025-07-01 21:52:02
數(shù)百名伊朗婦女獻(xiàn)出孩子捍衛(wèi)頭巾法

數(shù)百名伊朗婦女獻(xiàn)出孩子捍衛(wèi)頭巾法

通往遠(yuǎn)方的路
2025-07-03 08:50:11
壞消息傳來,要嚴(yán)查退休人員,到底咋回事,“4類人”可能逃不掉

壞消息傳來,要嚴(yán)查退休人員,到底咋回事,“4類人”可能逃不掉

詩詞中國(guó)
2025-07-04 15:16:46
越南全票通過《國(guó)籍法》修正案!承認(rèn)雙重國(guó)籍,釋放強(qiáng)大信號(hào)

越南全票通過《國(guó)籍法》修正案!承認(rèn)雙重國(guó)籍,釋放強(qiáng)大信號(hào)

緬甸中文網(wǎng)
2025-07-03 19:22:06
東方港灣董事長(zhǎng)但斌:2025年大概率會(huì)像處于互聯(lián)網(wǎng)時(shí)代的1998年!估計(jì)2025年納指很有可能最終上漲20%

東方港灣董事長(zhǎng)但斌:2025年大概率會(huì)像處于互聯(lián)網(wǎng)時(shí)代的1998年!估計(jì)2025年納指很有可能最終上漲20%

和訊網(wǎng)
2025-07-04 09:49:18
王學(xué)成:1983年駕殲5戰(zhàn)機(jī)叛逃臺(tái)灣,鄧麗君親自迎接,結(jié)局如何?

王學(xué)成:1983年駕殲5戰(zhàn)機(jī)叛逃臺(tái)灣,鄧麗君親自迎接,結(jié)局如何?

百年歷史老號(hào)
2024-05-16 14:38:19
Shein價(jià)格欺詐法國(guó)用戶,被罰4717萬美元

Shein價(jià)格欺詐法國(guó)用戶,被罰4717萬美元

藍(lán)洞新消費(fèi)
2025-07-04 09:26:01
又一個(gè)鄧文迪!90后東北女孩拿下80歲全球第二富豪,她怎么上位的

又一個(gè)鄧文迪!90后東北女孩拿下80歲全球第二富豪,她怎么上位的

果娛
2025-06-05 12:53:31
50米退讓,換來步步緊逼?導(dǎo)致司機(jī)情緒失控,轎車被頂進(jìn)工地!

50米退讓,換來步步緊逼?導(dǎo)致司機(jī)情緒失控,轎車被頂進(jìn)工地!

妙知
2025-07-03 22:18:35
郭正亮:澳洲稀土公司60萬澳元挖走整個(gè)科研團(tuán)隊(duì),搞定了鏑的提煉

郭正亮:澳洲稀土公司60萬澳元挖走整個(gè)科研團(tuán)隊(duì),搞定了鏑的提煉

說說史事
2025-07-04 11:49:18
中國(guó)外交官已全部離開立陶宛,立總理對(duì)華遞交建議書,想重建關(guān)系

中國(guó)外交官已全部離開立陶宛,立總理對(duì)華遞交建議書,想重建關(guān)系

袁周院長(zhǎng)
2025-07-03 10:54:19
上千萬人失去醫(yī)保、清潔能源迎末日,特朗普“大而美”法案讓誰受傷?

上千萬人失去醫(yī)保、清潔能源迎末日,特朗普“大而美”法案讓誰受傷?

第一財(cái)經(jīng)資訊
2025-07-04 18:50:12
幼兒鉛中毒!十余名跨省住院

幼兒鉛中毒!十余名跨省住院

中國(guó)新聞周刊
2025-07-04 13:18:48
蘇超最讓人擔(dān)心的一幕還是發(fā)生了……

蘇超最讓人擔(dān)心的一幕還是發(fā)生了……

功夫財(cái)經(jīng)
2025-07-04 08:22:56
官方:尼科·威廉姆斯與畢爾巴鄂續(xù)約至2035年,解約金至少上浮50%

官方:尼科·威廉姆斯與畢爾巴鄂續(xù)約至2035年,解約金至少上浮50%

雷速體育
2025-07-04 16:56:16
67歲著名演員家中猝逝,死因曝光,晚年凄涼兒子自殺與妻子反目

67歲著名演員家中猝逝,死因曝光,晚年凄涼兒子自殺與妻子反目

開開森森
2025-07-04 08:40:29
海參崴本該在1995年歸還中國(guó),斯大林親筆簽名同意,后來為何黃了?

海參崴本該在1995年歸還中國(guó),斯大林親筆簽名同意,后來為何黃了?

霹靂炮
2025-07-02 21:36:59
2025-07-04 20:03:00
人工智能研究 incentive-icons
人工智能研究
分享深度學(xué)習(xí)、CV、NLP
276文章數(shù) 130關(guān)注度
往期回顧 全部

頭條要聞

甘肅天水回應(yīng)幼兒園違規(guī)使用添加劑:我們現(xiàn)在也很焦急

頭條要聞

甘肅天水回應(yīng)幼兒園違規(guī)使用添加劑:我們現(xiàn)在也很焦急

體育要聞

體壇最爽打工人:37歲被裁,工資領(lǐng)到72歲

娛樂要聞

李宇春身上的標(biāo)簽?zāi)膫€(gè)才是真的?

財(cái)經(jīng)要聞

茅臺(tái)從3300跌到1700 泡沫破了酒才真香

科技要聞

被雷軍"震驚"后,何小鵬"藏起"G7的戰(zhàn)報(bào)

汽車要聞

純電續(xù)航180km/或30萬級(jí) 方程豹鈦7四季度上市

態(tài)度原創(chuàng)

時(shí)尚
游戲
健康
藝術(shù)
公開課

中年女人夏天別瞎穿,這三招讓你減齡不扮嫩,收獲滿滿的夸贊

《失落之魂》評(píng)級(jí)為青少年T級(jí)!僅有暴力和酒精

呼吸科專家破解呼吸道九大謠言!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 九龙县| 和龙市| 黄石市| 灵川县| 定南县| 宝鸡市| 阿勒泰市| 渝中区| 新民市| 儋州市| 留坝县| 通榆县| 二连浩特市| 隆子县| 大方县| 新和县| 洱源县| 清苑县| 玛曲县| 绥阳县| 衡山县| 璧山县| 丰城市| 海盐县| 辽阳市| 恭城| 永平县| 辰溪县| 民权县| 磐安县| 柳林县| 白银市| 惠州市| 龙山县| 宁武县| 米林县| 昌邑市| 兴隆县| 南城县| 黔西| 华安县|