核心提要:
1. 據(jù)報道,ChatGPT近期挑戰(zhàn)了極其艱難的美國執(zhí)業(yè)醫(yī)生資格考試(USMLE),在沒有人類協(xié)助下各部分均取得了及格或接近及格的成績,這反映出人工智能在臨床方面達到成熟地步。研究結果顯示,大型語言工具有潛力輔助醫(yī)學教育甚至臨床判斷。
2. 為了解ChatGPT在看病時的準確性,鳳凰網(wǎng)《腫瘤情報局》測試了6個腫瘤問題。對于常識性的問題,例如癌癥患者的誤區(qū)、飲食禁忌、感染新冠病毒后怎么辦等,ChatGPT的回答中規(guī)中矩,但沒有壓力。對于例如HER2陽性乳腺癌的治療方案等涉及患者具體病情的提問,ChatGPT的回答就比較混亂。專業(yè)問題還得靠專業(yè)醫(yī)生,ChatGPT革的是一般科普文章的命,無法取代醫(yī)生的角色。
3. 從USMLE成績來看,ChatGPT也僅是勉強及格。ChatGPT基于真實世界的數(shù)據(jù)進行深度學習,如果數(shù)據(jù)不夠或錯誤數(shù)據(jù)太多,那么它就不靠譜。目前在世的人幾乎不可能等到人工智能(AI)主導的疾病診治時代的來臨,仍需醫(yī)生把關負責。
4. 和ChatGPT使用的AI自然語言一樣,醫(yī)學數(shù)據(jù)的分析也可用自然語言整理患者病歷,從而更好在真實數(shù)據(jù)中找到規(guī)律。技術的發(fā)展能大大提高醫(yī)生診斷的速度和準確性,AI并不是要取代醫(yī)生,而是要解放醫(yī)生。ChatGPT能給患者進行簡單科普,醫(yī)生則可以集中精力解決最重要的問題。
能看病、寫論文,還考上了美國執(zhí)業(yè)醫(yī)生,
ChatGPT能代替醫(yī)生給患者看病嗎?ChatGPT竟然能通過美國執(zhí)業(yè)醫(yī)師的資格考試!日前,ChatGPT挑戰(zhàn)了被視為極其艱難的美國執(zhí)業(yè)醫(yī)生資格考試(USMLE)。該考試分為3部分,結果ChatGPT在這3部分考試中的分數(shù)都達到及格或接近及格,而且是在沒有任何人類協(xié)助下達成的。這反映出人工智能在臨床方面達到的成熟地步。
有關研究在2月10日出版的《科學公共圖書館·數(shù)字健康(PLOS Digital Health)》期刊上發(fā)表。在未經(jīng)過專門訓練或加強學習的情況下,ChatGPT對350道考試題進行了回答,經(jīng)評審人員閱卷打分,ChatGPT回答的準確性有60%,基本可以通過考試[1]。用來測試ChatGPT的考題,既有根據(jù)信息給患者做出診斷的開放式問題,也有諸如判斷病因之類的選擇題,但是排除了基于圖像的考試題。
▎圖/2023年2月發(fā)表在PLOS Digit Health上的論文《ChatGPT在USMLE的表現(xiàn):使用大型語言模型的AI輔助醫(yī)學教育的潛力》評估了 ChatGPT 在美國執(zhí)業(yè)醫(yī)生資格考試中的表現(xiàn),并發(fā)現(xiàn)ChatGPT在其解釋中表現(xiàn)出高度的一致性和洞察力。研究最后認為,大型語言模型可能具有協(xié)助醫(yī)學教育以及潛在臨床決策的潛力。
雖然現(xiàn)實中,通過執(zhí)業(yè)資格考試的醫(yī)科生還要經(jīng)過實習、培訓、臨床考試等過程才能獲得行醫(yī)資格,但研究結果顯示出,大型語言工具有潛力輔助醫(yī)學教育甚至臨床判斷。對此,有人認為ChatGPT將對國外醫(yī)療領域開始產(chǎn)生巨大沖擊!甚至有“硅谷投資人”認為,這個沖擊將降低病患的醫(yī)療成本,但是普通醫(yī)院的營收在ChatGPT成熟之后會遭遇斷崖式下降,導致醫(yī)療領域崗位流失,數(shù)以百萬計的優(yōu)秀醫(yī)生將需要學習新的技能再就業(yè)。這個革命性的ChatGPT,真的能革掉醫(yī)生的命?!
▎圖/ChatGPT是一個由OpenAI調(diào)教的人工智能應用,它的名字來源于它的兩個主要功能:聊天和GPT,即Generative Pretrained Transformer(“生成式預訓練轉換器”)。根據(jù)ChatGPT自己的解釋,ChatGPT是一種自然語言處理技術,先通過深度學習來理解人類的語言,再通過生成語言來實現(xiàn)人機對話。為了深度學習,ChatGPT需要使用大量的語言數(shù)據(jù)進行訓練,以便對各種語言問題作出回答。因為應用廣泛,中小學生開始用它來寫作業(yè),大學生、研究生用它來寫論文,甚至程序員也開始用它來寫代碼。
ChatGPT在看病時的準確性如何?
為了解ChatGPT治療癌癥的能力,我們測試了6個問題問題1: 癌癥患者最大的誤區(qū)是什么?請用專業(yè)的方式回答,并給出實例。ChatGPT回答:癌癥患者有很多誤區(qū),但其中最大的一個誤區(qū)是過分依賴偏方。許多癌癥患者認為僅通過使用傳統(tǒng)的中藥、信仰或其他偏方方法就可以治愈癌癥,這種想法是錯誤的。例如,有些癌癥患者拒絕接受標準的放療或化療,而只選擇傳統(tǒng)的中藥方法,這可能導致疾病進展和生存期的嚴重下降。因此,在確診癌癥后,建議患者咨詢專業(yè)的醫(yī)生,并在醫(yī)生的指導下選擇合適的治療方案。一種合適的治療方案可能包括手術、放療、化療等標準方法,以及適當?shù)闹兴幆煼ā?strong>點評:ChatGPT的這個回答,至少可以打90分。它不但指出了一個癌癥患者確實會陷入的重大誤區(qū),最為關鍵的是,它提到了“建議患者咨詢專業(yè)的醫(yī)生”。
▎圖/AI已應用在麻醉與CT影像讀片等領域。
問題2: 癌癥患者不能吃什么?
但是,這些食物并不適用于所有癌癥患者,因此應該根據(jù)個人情況和醫(yī)生的建議進行調(diào)整。
點評:ChatGPT的這個回答,也可以至少打90分。ChatGPT提到的這些食物,如果長期、過量食用,可能會帶來健康風險,有些食物甚至已經(jīng)被世界衛(wèi)生組織定義為“可能致癌的因素”,癌癥患者自然應該特別注意。同時,ChatGPT的回答也中規(guī)中矩,不但沒有搞一些奇怪的噱頭來恐嚇大眾、吸引眼球,也提到“應該根據(jù)個人情況和醫(yī)生的建議進行調(diào)整”。
問題3: 癌癥患者感染新冠怎么辦?
ChatGPT回答:如果癌癥患者感染了新冠病毒,應立即尋求醫(yī)療幫助。對于癌癥患者,新冠病毒感染可能帶來更多的健康風險,因此需要特別關注。以下是一些建議:1. 立即就醫(yī):癌癥患者感染新冠病毒后應立即就醫(yī),以確保及時診斷和治療。2. 通信:與醫(yī)生保持密切的聯(lián)系,并告訴醫(yī)生關于癌癥治療的情況,以確保可以得到最佳的醫(yī)療幫助。3. 注意營養(yǎng):保持良好的營養(yǎng)狀態(tài)可以幫助提高免疫力,減少感染的風險。4. 遵循醫(yī)生的建議:遵循醫(yī)生的建議,如停藥、減少外出等,以確保安全。5. 注意衛(wèi)生:注意個人衛(wèi)生,例如勤洗手、避免接觸疫情人群等。
癌癥患者感染新冠病毒后的治療方案可能因個體情況而異,建議在醫(yī)生的指導下接受治療。
點評:ChatGPT的回答也中規(guī)中矩,雖然有的建議比較含糊,如“停藥”,但是因為提到“遵循醫(yī)生的建議”,也就無可非議了。
問題4: 癌癥患者可以吃巧克力嗎?
ChatGPT回答:是的,癌癥患者可以吃巧克力,但是需要適量。巧克力是一種富含營養(yǎng)的食物,對于許多人來說是一種美味的零食。然而,巧克力也是高糖和高脂肪的食物,如果攝入過多,可能對健康產(chǎn)生不良影響。
因此,癌癥患者在食用巧克力時應注意以下幾點:
1. 適量食用:巧克力可以作為一種美味的零食,但是應該適量食用。
2. 選擇高品質(zhì)的巧克力:選擇含有高品質(zhì)可可的巧克力,以獲得更多的營養(yǎng)。
3. 避免過多的糖和脂肪:避免食用含有過多糖和脂肪的巧克力,以保護健康。
4. 考慮個人情況:在食用巧克力前,應該考慮個人情況,例如體重、飲食習慣等,以確保適當?shù)臄z入。
綜上所述,癌癥患者可以吃巧克力,但是需要適量,并選擇高品質(zhì)的巧克力。同時,在食用巧克力前應該考慮個人情況,以確保健康。點評:ChatGPT沒有過分夸大巧克力的危害,也提醒了適量。回答這個問題,ChatGPT不需要“醫(yī)生的建議”來加持。筆者提問了“癌癥患者可以吃糖嗎”,ChatGPT的答案基本相似,這里不再累述。
問題5: 癌癥患者不能吃什么水果?ChatGPT回答:一般來說,癌癥患者不存在不能吃什么水果的限制。相反,多吃水果可以幫助癌癥患者保持健康,提供營養(yǎng)。不過,一些癌癥患者可能因為特殊情況(例如食道癌)而不能食用某些水果,此時應該在醫(yī)生的指導下進行飲食。除此之外,癌癥患者也可以考慮消化不良的情況,例如選擇易消化的水果,避免對胃腸道造成過多負擔。綜上所述,癌癥患者可以多吃水果,以保持健康,但在特殊情況下應該在醫(yī)生的指導下進行飲食。點評:從這些問答可以看出,對于常識性的問題,ChatGPT毫無壓力。那如果針對患者的具體病情提問,ChatGPT還能夠提供滿意的回答嗎?問題6: 我有一個朋友被查出來是HER2陽性乳腺癌,有什么治療方案可以推薦給她嗎?
ChatGPT回答:HER2陽性乳腺癌是一種特殊類型的乳腺癌,其特征在于HER2基因的異常表達。為了治療這種癌癥,醫(yī)生通常會采用多種方法,以確保最佳的治療效果。以下是一些可能的治療方案:1. 藥物治療:HER2陽性乳腺癌通常對藥物治療非常敏感,醫(yī)生可能會推薦使用HER2抑制劑,如Trastuzumab(Herceptin),以降低癌細胞的生長。2. 化療:在外科手術和/或放療后,化療可以幫助消除剩余的癌細胞,以減少復發(fā)的風險。3. 輔助治療:為了提高療效,醫(yī)生可能還會推薦其他輔助治療,例如放療,以減少癌癥的生長。4. 個體化治療:每個患者的情況都不同,因此醫(yī)生可能會采用個體化的治療方案,以確保最佳的結果。
這僅僅是一些治療方案的例子,最終的治療方案將根據(jù)患者的情況(包括疾病的嚴重程度,年齡等)進行評估和決策。因此,最好的方法是向醫(yī)生咨詢,以確定最佳的治療方案。
點評:HER2陽性,可以是基因的擴增,也可以是蛋白的過表達,ChatGPT的解釋雖然比較簡單,不過也可以接受。但是,談及治療方案時,ChatGPT的回答就比較混亂了,并沒有根據(jù)患者的病理期來提供治療建議。實際上,如果是早期的乳腺癌患者,能手術的應該首先進行手術(包括術前可能采取的新輔助化療),而并不是簡簡單單進行化療。而且作為術后的輔助治療,對于HER2陽性的患者來說,應該采用的是聯(lián)合了化療的HER2靶向治療。雖然回答不令人滿意,但是因為ChatGPT提到“最好的方法是向醫(yī)生咨詢,以確定最佳的治療方案”,回答也可以打一個及格分。
ChatGPT幫你找回常識,可以革掉一般科普的命,但專業(yè)醫(yī)生還是不可少從測試可以看出來,雖然對于一般的問題,ChatGPT可以回答得滴水不漏,但是對于比較專業(yè)的問題,還是得靠醫(yī)生來提供準確的回答。所以,如果說ChatGPT能革命,革的也是一般科普文章的命,無法取代醫(yī)生的角色。其實從通過美國執(zhí)業(yè)醫(yī)師資格考試的成績來看,ChatGPT也僅是勉強及格,而且即便美國的醫(yī)學生通過了資格考試,還是需要進行住院實習,積累實際診療經(jīng)驗。一般的患者,對實習醫(yī)生都不太放心,怎么可能放心讓ChatGPT來開方子呢?再說,如果沒有醫(yī)生把關,ChatGPT給的建議出了問題,找誰來負責呢?
▎圖/ChatGPT對前列腺癌的看法
所以,只能是把ChatGPT當作一個可用的工具,幫助獲得一些必要的輔助信息。由于患者與醫(yī)生交流的時間特別有限,如果患者或家人能夠提前做好功課,可以更有效地與醫(yī)生溝通。在目前信息泛濫的狀態(tài)下,面對互聯(lián)網(wǎng)上的各種說法,普通人可能會被迷惑,無所適從,相比之下,ChatGPT能夠做比較好的導航,得到一個相對比較合理的說法。在此基礎上,再通過與專業(yè)醫(yī)生的高效溝通,普通人能夠得到最大的利益。既然是一個工具,就需要知道在什么時候、什么場景下使用才是最佳的。ChatGPT是基于真實世界的數(shù)據(jù)進行深度學習,如果數(shù)據(jù)不夠、或者說錯誤的數(shù)據(jù)太多,那么ChatGPT說出來的就不靠譜。從目前大家的測試來看,ChatGPT對古詩詞的深度學習不夠,對于人類的情感也還沒有找到一個較好的方法,所以想跟ChatGPT聊一聊表達人類情感的古詩詞,基本是雞同鴨講。AI在病理診斷、藥物研發(fā)方面都有很大的運用前景,對醫(yī)學的幫助到底有多大?ChatGPT使用的人工智能(AI)是自然語言處理,所以適用于聊天。在醫(yī)學數(shù)據(jù)的分析中,也需要使用到自然語言處理,可以對患者的病歷進行整理,從而更好地從真實世界的數(shù)據(jù)中找到規(guī)律。醫(yī)學數(shù)據(jù)還有很大一部分是影像學數(shù)據(jù),醫(yī)生依據(jù)于這類數(shù)據(jù)的診斷,多少會有一些主觀意識,也就是容易發(fā)生誤判。在這個方面,人工智能有較大的優(yōu)勢,不但對圖像的識別更敏感,而且可以通過深度學習,發(fā)現(xiàn)人眼不能觀察到的相關性。比如說,對于鼻咽癌,目前通常是根據(jù)病理期來判斷患者的疾病進展風險。廣州中山大學醫(yī)院的一項研究表明,通過大數(shù)據(jù)對核磁共振圖像 (MRI)數(shù)據(jù)的深度學習所建立的模型,能夠更好地預測鼻咽癌患者疾病進展的風險。當然,如果將二者結合,準確性提高得更多[2]。2020年,一項英國的研究結果表明,在對AI算法改進之后,使用AI進行疾病診斷的能力得到了大幅提高,準確性優(yōu)于大多數(shù)參加研究的醫(yī)生(75%)[3]。在藥物研發(fā)方面,AI也發(fā)揮著越來越多的作用。比如AlphaFold根據(jù)一個蛋白的序列,就可以比較準確地預測其三維結構。AlphaFold能做到這一步,也是基于對目前蛋白結構的深度學習。在小分子藥物研發(fā)方面,AI深度學習能加快藥物的篩選速度,AI算法也能對先導化合物的成藥性和可開發(fā)性進行評估,選擇更優(yōu)、更容易成功的項目推進。由于機器一直在深度學習,AI技術一直在進步,因此很多人認為,假以時日,AI一定會取代醫(yī)生,成為疾病診斷、治療的主角。但這屬于過于樂觀的期望!即便有AI主導的疾病診斷、治療時代,目前在世的人幾乎都不可能等到這個時代的來臨。不過,因為AI技術的進步,醫(yī)生做出診斷的速度和準確性可以大大提高。301醫(yī)院基于AI深度學習,開發(fā)了一個胃部病理輔助診斷系統(tǒng),靈敏度接近100%,特異性達到80.6%。2022年的研究結果表明,在使用這個人工智能輔助系統(tǒng)之后,病理醫(yī)生診斷胃癌的靈敏度顯著提高,成功率從82.75%提高到了90.63%,同時查看病理切片的時間也顯著下降,花在每張片子上的時間,從26.37秒下降到22.68秒[4]。目前的癌癥治療進入了靶向治療、免疫治療時代,對病理切片進行免疫組化染色檢查的要求也增加了,病理醫(yī)生的任務越來越繁重。
作為一個工具,AI不但提高了醫(yī)生診斷的準確性,而且還讓醫(yī)生的診斷速度提高了,在較短的時間內(nèi)獲得更準確的診斷!從這個角度看,AI并不是要取代醫(yī)生,而是要解放醫(yī)生。作為智能聊天的工具,ChatGPT也可以把醫(yī)生解放出來,可以使用ChatGPT來給患者進行簡單的科普,不需要把寶貴的時間花在解釋最簡單的問題上,集中精力解決最重要的問題。但是,ChatGPT也留給了我們一個重要的問題:AI可以深度學習,一直在進步;一般的吃瓜群眾,能真正從與ChatGPT的聊天中學到點什么,能獲得進步嗎?還是僅僅將ChatGPT當作一個聊天、娛樂的工具?
1. Kung, T.H., et al., Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models. PLOS Digital Health, 2023. 2(2): p. e0000198.
2. Jing, B., et al., Deep learning for risk prediction in patients with nasopharyngeal carcinoma using multi-parametric MRIs. Computer Methods and Programs in Biomedicine, 2020. 197: p. 105684.
3. Richens, J.G., C.n.M. Lee, and S. Johri, Improving the accuracy of medical diagnosis with causal machine learning. Nature Communications, 2020. 11(1): p. 3923.
4. Ba, W., et al., Assessment of deep learning assistance for the pathological diagnosis of gastric cancer. Modern Pathology, 2022. 35(9): p. 1262-1268.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.