來源丨21新健康(Healthnews21)原創作品
作者/唐唯珂
編輯/季媛媛
DeepSeek的橫空出世繼續攪動醫療AI的發展。
節后復工以來,醫渡科技、藥易購、恒瑞醫藥、鷹瞳科技,華大基因,金域醫學等國內一流醫療公司都表示正在引入DeepSeek,準備將其應用于數據挖掘、智能供應鏈、精準醫療等多項領域。
2月10日,腦機接口概念股異動,創新醫療直線拉升漲停,愛朋醫療、三博腦科、南京熊貓漲超5%,樂普醫療、誠益通、中科信息等跟漲。
華南某行業內科研人士向21世紀經濟報道記者表示,“我們可以直接利用DeepSeek強大的推理能力來完成我們原來想做做不到,或者原來基座大模型也能做支持,但是做不到它這么專業的事情。我們接入DeepSeek的模型之后,從這幾天試用的情況來看,效果還是非常好的。”
憑借算法效率與低成本優勢,DeepSeek正推動大模型廠商進入“競合交織”的新階段。
在醫療應用端垂類賽道上,不少企業發現了這條長坡厚雪的賽道中蘊藏的巨大機遇,紛紛下場、積極布局。但優質數據的獲取和標準化仍然是相關企業在做細分賽道時正在努力攻克的難題。
相關業內人士告訴21世紀經濟報道記者:“對于醫療人工智能的具體應用具有一定的獨特性,只有‘喂’了數據,再結合它算法的優勢,才能得到一個個性化的答案。‘喂’給它的源數據質量越高,那推理結果就越好。‘喂’的源數據質量差,那推理結果也就一般般,這是行業的特殊性,也就要求相關應用企業需要不斷突破數據難題。”
鷹瞳科技相關負責人也向21世紀經濟報道記者表示,只有向模型輸入(即‘喂’)高質量的數據,并結合其算法的優勢,才能得到一個更加個性化的答案。輸入數據的源質量越高,推理的結果也就越優越。
基座模型洗牌
DeepSeek V3、GPT-4o等都屬于基座模型。它們是經過海量通用數據訓練的大規模預訓練模型,具備廣泛的語言理解、生成和推理能力,通用性很強,可泛化到多種任務中。但在醫療、法律、金融等專業場景中,基座模型往往顯得缺乏垂直領域的深度,無法符合專業場景中的高精度、高合規性需求。
對解決這一問題,細分應用領域通常會基于基座模型進行微調、優化,或結合領域數據重新訓練,二次開發成符合要求的垂類模型。如果說基座模型提供“廣度”,那垂類模型就是提供“深度”。
在實際的應用場景中,二者屬于是分層協作而非對立的關系。基座模型是“地基”,提供通用能力和知識儲備;垂類模型是“建筑”,在基座上針對場景需求精細化構建。二者的結合既能避免重復訓練、降低開發成本,又能滿足專業化需求,是AI落地的核心路徑之一。
DeepSeek的驚艷亮相對于同樣做基座模型的廠商可以說是造成了不小的沖擊,如做混元大模型的騰訊、做盤古大模型的華為等。
前阿里巴巴研究主管、現任以色列AI編碼初創公司Qodo聯合創始人兼CEO伊塔瑪·弗里德曼(Itamar Friedman)表示:“減少甚至跳過人類反饋是一個重大突破。這意味著你幾乎可以完全在無人工干預的情況下訓練模型。”這能極大提升模型推理能力和效率。
金域醫學副總裁、數字化管理中心總經理李映華告訴21世紀經濟報道記者,對同行的挑戰主要來自于DeepSeek的三個特點:“第一,DeepSeek做了大量底層算法的優化,它可以不需要那么強的算力,也能做出一個性能很強的模型出來。這將打破原有大算力的技術壁壘,引領新的技術范式。”DeepSeek的推理模型R1在基座模型V3的基礎上,大規模使用了全自動的強化學習,取代了對過往需要大量人工反饋的監督微調和RLHF的依賴程度大幅降低。
“第二,Deepseek公司專注提升基礎模型能力,不去追求短期商業利益最大化,并采取了較為徹底的開源策略,可以預期將很快形成以DeepSeek基座模型為核心的新生態。有了DeepSeek為代表的強推理模型的賦能,可實現垂類模型和行業智能體應用能力的整體升級,加快千行百業跨入智能時代。第三,它是一個開源開得最徹底的,我的基座模型該怎么訓的,應用商怎么落地成的垂類模型,做出一個更好的應用仍需要各個原有大模型的廠商和垂類應用不停完善。這也意味著對原來傳統的那些做大模型基層模型的商業模式形成挑戰。”李映華說。
據了解,選擇開源的基座模型作為“地基”,企業未來優化自己的垂直模型時,選擇的空間會更大。如果和閉源模型綁定,一旦這個閉源模型的進步速度跟不上整個行業的速度,企業的垂類模型發展也會受限。
盡管給友商造成了壓力,加劇了行業競爭,但這也不代表其他廠商失去了持續突破的空間。
許多企業的垂類模型也是開放式的架構,面對市場上的眾多產品,這些垂類模型可以根據自己的需求“博采眾家之長”,把各方組合到一起,根據不同的場景去調用不同的模型。
李映華向21世紀經濟報道記者解釋,“以醫學檢驗來為例,我們把域見醫言企業大模型和小域醫智能體接入DeepSeek推理大模型,進一步優化原有Agent智能體技術體系框架,構成一體化程度更高、分析能力更強、任務分解更準的智能體服務。拿醫學來舉例子,可能這個模型在這個呼吸端口里面做得好,那個模型是這個血液病的一個專家團隊。我通過我的智能體的應用,去分解哪些任務到底交給哪個模型做是最合適的。”
李映華進一步指出,面對醫療和醫檢領域的復雜性與多樣性,單一模型難以解決所有問題。眾多領先企業已在醫療領域積累了豐富的專業知識、語料庫、數據資源以及模型構建能力。這意味著,即使他們的客戶基礎模型以DeepSeek為核心,這些企業的綜合實力依然能夠得到有效整合。
“對我們而言,無論是華為還是騰訊在醫檢行業的知識儲備和能力,我們都有能力將之融合進我們的垂直領域模型中,進而轉化為終端用戶能夠切實體會到的服務價值。我們的目標是在垂直領域模型上構建一個智能應用實體。這一實體的構建依賴于多方面的資源,并非一個獨立的模型就能解決所有問題。”李映華認為,因無論是騰訊的強項,還是華為的特長,我們都有能力將其納入我們的垂直模型之中。同時,一些先行企業在醫療領域已經積累了自身獨特的知識體系、語料、數據及技能,即便他們的客戶基礎模型以DeepSeek為主,但依然需要依靠它們在專業領域內構建的知識和能力。
核心資源仍是數據
由于大模型逐漸在AI世界占據主導,作為“燃料”,數據已經成了各方醫療AI競爭的關鍵,甚至有人稱其為醫療人工智能的“護城河”。
行業內人士告訴21世紀經濟報道記者:“醫療數據是各類數據中最難獲取的,但它又是醫療AI發展的核心資源。”受現有管理體制機制影響,不同監管部門之間的共享渠道也不暢通,大量有價值的健康數據無法有效利用。同時,國內數據的標準化程度較低,不同醫療機構之間的數據格式和結構各異,需要醫生群體不斷在前期做相應的前置投入診斷訓練。
這些因素導致醫療AI項目往往需要大量資金投入,且短期內難以看到明顯的經濟效益。許多企業和投資人在嘗試進入這一領域后,因無法承受高昂的成本和漫長的回報周期而選擇退出。“這也是過往大家說醫療AI燒錢又沒用的原因,很多投資人都沒有耐心去培育。”行業內人士說。
盡管面臨諸多困難,但醫療AI在應用端廣闊的想象空間,依然吸引著國內外企業去積極競爭醫療數據資源。谷歌曾試圖以高價收購Cerner公司存儲的2.5億份健康記錄,但最終被亞馬遜截獲。對于谷歌而言,推動這項交易遠不止為了盈利,它更希望借此進一步收集、分析和匯總數百萬美國人的健康數據。
據悉,谷歌多次被曝在患者與醫生不知情的情況下訪問可識別個人身份的健康數據。谷歌等科技巨頭為了收集醫療數據的各種行為,也引發了各界對個人隱私的擔憂。
華為、騰訊、阿里等國內巨頭也在積極通過多種途徑獲取醫療數據。如騰訊通過廣泛與華銀健康、東華軟件、微醫等企業和機構合作,基于其數據資源,推動行業大模型落地,開發相關醫療AI產品。
值得注意的是,我國擁有龐大的醫療數據資源。國家衛健委發布的衛生年鑒顯示,2023年,全國衛生機構總診療人次達到96億人,由此產生的醫療數據預計早已超過百億條。業界認為,如此龐大的數據儲備規模,已經堪稱是國家重要的基礎性戰略資源了。這也意味著,國內的醫療AI企業有著充足的、可供“喂養”大模型的數據“養料”。
憑借著豐厚的數據資源和高效的模型訓練,我國企業在醫療AI的領域也具備和國際巨頭同臺競技的能力。
醫療AI可以說是一條“長坡厚雪”的賽道,雖然路途遙遠且充滿挑戰,但一旦未來突破瓶頸,應用端成功落地和推廣后,相關企業很可能取得巨大回報,全球醫療健康水平更是有望邁上新臺階。想要實現這些美好的愿望,數據的不斷深化采集和處理是重中之重。
(實習生孫偉對本文亦有貢獻)
圖片/21圖庫
排版/許秋蓮
【版權聲明】本文所有內容著作權歸屬21世紀經濟報道,未經許可,不得轉載、摘編或以其他形式使用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.