網易首頁 > 網易號 > 正文申請入駐

行業上限被拔高！夸克官宣：首個通過主任醫師評測的大模型來了

2025-07-24 15:45:38　來源: 雷科技

廣東舉報

分享至

7月23日，夸克健康大模型成功通過中國12門核心學科的主任醫師筆試評測，成為國內首個完成這一挑戰的大模型。這是繼5月通過副主任醫師職稱考試后，夸克健康大模型的又一次能力躍升。目前，“主任級AI醫生”能力已經全面集成在夸克的AI搜索里，查詢健康問題的時候，選擇深度搜索就可以調用。

之所以是垂類大模型，原因很簡單。一方面，垂類大模型相比通用大模型有更強的單一場景專業性，根據夸克公布的數據，在醫療場景下的性能比較，夸克健康大模型的答題正確率，全面超越了通用大模型DeepSeek。這并不是說通用大模型性能不行，只是“術業有專攻”，針對單一場景的垂類大模型，明顯會更適合。

另一方面，對于專業領域，AI大模型要面對的是各種各樣的問題，這意味著單一的數據庫回答并不可靠，尤其是醫學領域。舉個例子，每一位病人都是感冒，但不同的人會有不同的癥狀表現，癥狀的輕重也各有不同，甚至還有一定的并發癥和過敏等因素伴隨，醫生就需要根據病人的癥狀描述“對癥下藥”。

因此，垂類大模型不僅要“知識豐富”，更要“會思考”，夸克健康大模型以通義千問為基礎，走出了一條面向垂直場景的工程化路線。夸克算法負責人表示：“我們不是在訓練AI回答醫學問題，而是在訓練它學會醫學思維?！?strong>換句話說，醫學垂類大模型不能是AI“閉門造車”，更多的還是和真實醫生一同共創。

（圖片來自夸克）

而夸克健康大模型的核心突破之一，就是“慢思考”能力。這項能力融合了鏈式推理和多階段臨床演繹路徑建模，驅動模型在面對復雜醫療問題時，能夠分階段、層層深入地推導出最終回答。

所謂的“醫學思維”并非單方面的知識庫或者推理能力，夸克健康大模型的思考，是基于高質量訓練數據的。為此，夸克構建了“雙數據產線+雙獎勵機制”的工程體系，將醫學數據劃分為“可驗證”和“不可驗證”兩類，分別對應診斷類任務和健康建議類任務。另外，在訓練方法上，夸克引入了“過程獎勵模型”和“結果獎勵模型”，確保推導過程和最終結果的合理性和準確性。

為了避免AI大模型為了高分而做題的應試行為，夸克健康大模型還設計了多階段強化學習流程，通過真實醫生標注、提問——思考——回答整組數據驅動強化學習，讓夸克健康大模型成為了“不讀死書”，擁有真正醫學思維的AI大模型。

得益于在醫學領域的專業性，夸克健康大模型得到了不少專業醫師的認可，比如安貞醫院心臟外科主任醫師謝進生表示，夸克在一些問題上回答的專業度比專業醫生更強。同時夸克AI搜索吸引了一大批醫學生和醫生群體，目前平臺在全國醫學生中月活用戶已突破200萬，覆蓋率過半，這就是夸克健康大模型在醫學領域專業性的證明。

這次夸克健康大模型證明了自己更高的能力上限，但這不是AI大模型的終點。醫學大模型除了要在專業領域上不斷精進，從應用層面去看，更應該讓更多普通用戶享受到“人均專業醫師”的專業咨詢。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.