AI在醫療領域獲重大進展。5月27日,夸克健康大模型在12門國家副主任醫師職稱考試中成績超過合格線,成為國內首個成功跨越這一門檻的大模型。這意味大模型在嚴肅醫療場景中邁出了從“知識記憶”向“臨床推理”躍遷的關鍵一步。
此前,國內大模型多停留在臨床執業醫師資格考試階段,只能拿到初級職稱。夸克則實現了從初級到副高級職稱的兩級跳。夸克健康大模型以通義千問為基礎,通過海量的高質量數據構建和多階段后訓練策略實現了此次突破。
全新的大模型能力已經可以直接通過夸克搜索調用。用戶在使用中會發現,對于嚴肅醫療問題夸克會通過先分析后搜索,動態檢索書籍、指南、藥品說明書、醫典論文等。這種高搜商的策略顯著的提升了復雜病例的準確率。
此次副主任醫師職稱考試評測覆蓋了12個常用學科,包括:全科醫學、普通內科學、普通外科學、婦產科學、小兒內科學、腫瘤內科學、口腔醫學、耳鼻咽喉科學、眼科學、皮膚與性病學、精神病學、麻醉學。在上述學科領域,夸克健康大模型均超過合格線,并在全科醫學、腫瘤內科學、皮膚與性病學、精神病學 4 個學科達到主任醫師及格線。
在初級與中級職稱考試中,更小尺寸的夸克健康大模型相比滿血版基礎模型最高領先7分和10分左右。進入難度顯著提高、強調臨床綜合運用的副高職稱考試時,夸克最高領先幅度擴大至 30分,在長鏈推理、診療路徑規劃上有顯著提升。這項研究驗證了垂直模型在性能提升上具備巨大潛力。
對題型維度的深入剖析顯示,多選題與病例分析題是所有模型誤判率最高的兩類。個別通用基礎模型在多選題上的正確率均不足 60%,而夸克借助“醫療長思考”機制達到 71%。在病例分析題中,夸克通過檢索增強與分步推理組合策略,將正確率提升至 53%。
夸克健康算法工程師徐健表示,“機器通過考試并不意味著可以替代醫生,但它展示了在輔助診療決策、循證檢索與患者溝通方面的巨大潛力。我們將不斷強化模型能力,幫助醫生和患者提升診療效率,為用戶在居家場景下提供更多健康管理能力”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.