網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

夸克健康大模型通過副主任醫(yī)師考試，12門學(xué)科超合格線

2025-05-27 16:08:03　來源: 環(huán)球網(wǎng)資訊

北京舉報(bào)

分享至

來源：中國(guó)經(jīng)濟(jì)網(wǎng)

AI在醫(yī)療領(lǐng)域獲重大進(jìn)展。5月27日，夸克健康大模型在12門國(guó)家副主任醫(yī)師職稱考試中成績(jī)超過合格線，成為國(guó)內(nèi)首個(gè)成功跨越這一門檻的大模型。這意味大模型在嚴(yán)肅醫(yī)療場(chǎng)景中邁出了從“知識(shí)記憶”向“臨床推理”躍遷的關(guān)鍵一步。

此前，國(guó)內(nèi)大模型多停留在臨床執(zhí)業(yè)醫(yī)師資格考試階段，只能拿到初級(jí)職稱。夸克則實(shí)現(xiàn)了從初級(jí)到副高級(jí)職稱的兩級(jí)跳。夸克健康大模型以通義千問為基礎(chǔ)，通過海量的高質(zhì)量數(shù)據(jù)構(gòu)建和多階段后訓(xùn)練策略實(shí)現(xiàn)了此次突破。

全新的大模型能力已經(jīng)可以直接通過夸克搜索調(diào)用。用戶在使用中會(huì)發(fā)現(xiàn)，對(duì)于嚴(yán)肅醫(yī)療問題夸克會(huì)通過先分析后搜索，動(dòng)態(tài)檢索書籍、指南、藥品說明書、醫(yī)典論文等。這種高搜商的策略顯著的提升了復(fù)雜病例的準(zhǔn)確率。

此次副主任醫(yī)師職稱考試評(píng)測(cè)覆蓋了12個(gè)常用學(xué)科，包括：全科醫(yī)學(xué)、普通內(nèi)科學(xué)、普通外科學(xué)、婦產(chǎn)科學(xué)、小兒內(nèi)科學(xué)、腫瘤內(nèi)科學(xué)、口腔醫(yī)學(xué)、耳鼻咽喉科學(xué)、眼科學(xué)、皮膚與性病學(xué)、精神病學(xué)、麻醉學(xué)。在上述學(xué)科領(lǐng)域，夸克健康大模型均超過合格線，并在全科醫(yī)學(xué)、腫瘤內(nèi)科學(xué)、皮膚與性病學(xué)、精神病學(xué) 4 個(gè)學(xué)科達(dá)到主任醫(yī)師及格線。

在初級(jí)與中級(jí)職稱考試中，更小尺寸的夸克健康大模型相比滿血版基礎(chǔ)模型最高領(lǐng)先7分和10分左右。進(jìn)入難度顯著提高、強(qiáng)調(diào)臨床綜合運(yùn)用的副高職稱考試時(shí)，夸克最高領(lǐng)先幅度擴(kuò)大至 30分，在長(zhǎng)鏈推理、診療路徑規(guī)劃上有顯著提升。這項(xiàng)研究驗(yàn)證了垂直模型在性能提升上具備巨大潛力。

對(duì)題型維度的深入剖析顯示，多選題與病例分析題是所有模型誤判率最高的兩類。個(gè)別通用基礎(chǔ)模型在多選題上的正確率均不足 60%，而夸克借助“醫(yī)療長(zhǎng)思考”機(jī)制達(dá)到 71%。在病例分析題中，夸克通過檢索增強(qiáng)與分步推理組合策略，將正確率提升至 53%。

夸克健康算法工程師徐健表示，“機(jī)器通過考試并不意味著可以替代醫(yī)生，但它展示了在輔助診療決策、循證檢索與患者溝通方面的巨大潛力。我們將不斷強(qiáng)化模型能力，幫助醫(yī)生和患者提升診療效率，為用戶在居家場(chǎng)景下提供更多健康管理能力”。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

夸克健康大模型通過副主任醫(yī)師考試，12門學(xué)科超合格線