ChatGPT通過美國醫(yī)師考核！能代替醫(yī)生看病嗎？我們做個有趣測試

2023-02-14 19:21:23　來源: 林呆右

江蘇舉報

分享至

核心提要：

1. 據(jù)報道，ChatGPT近期挑戰(zhàn)了極其艱難的美國執(zhí)業(yè)醫(yī)生資格考試（USMLE），在沒有人類協(xié)助下各部分均取得了及格或接近及格的成績，這反映出人工智能在臨床方面達到成熟地步。研究結果顯示，大型語言工具有潛力輔助醫(yī)學教育甚至臨床判斷。

2. 為了解ChatGPT在看病時的準確性，鳳凰網(wǎng)《腫瘤情報局》測試了6個腫瘤問題。對于常識性的問題，例如癌癥患者的誤區(qū)、飲食禁忌、感染新冠病毒后怎么辦等，ChatGPT的回答中規(guī)中矩，但沒有壓力。對于例如HER2陽性乳腺癌的治療方案等涉及患者具體病情的提問，ChatGPT的回答就比較混亂。專業(yè)問題還得靠專業(yè)醫(yī)生，ChatGPT革的是一般科普文章的命，無法取代醫(yī)生的角色。

3. 從USMLE成績來看，ChatGPT也僅是勉強及格。ChatGPT基于真實世界的數(shù)據(jù)進行深度學習，如果數(shù)據(jù)不夠或錯誤數(shù)據(jù)太多，那么它就不靠譜。目前在世的人幾乎不可能等到人工智能（AI）主導的疾病診治時代的來臨，仍需醫(yī)生把關負責。

4. 和ChatGPT使用的AI自然語言一樣，醫(yī)學數(shù)據(jù)的分析也可用自然語言整理患者病歷，從而更好在真實數(shù)據(jù)中找到規(guī)律。技術的發(fā)展能大大提高醫(yī)生診斷的速度和準確性，AI并不是要取代醫(yī)生，而是要解放醫(yī)生。ChatGPT能給患者進行簡單科普，醫(yī)生則可以集中精力解決最重要的問題。

能看病、寫論文，還考上了美國執(zhí)業(yè)醫(yī)生，

ChatGPT能代替醫(yī)生給患者看病嗎？ChatGPT竟然能通過美國執(zhí)業(yè)醫(yī)師的資格考試！日前，ChatGPT挑戰(zhàn)了被視為極其艱難的美國執(zhí)業(yè)醫(yī)生資格考試（USMLE）。該考試分為3部分，結果ChatGPT在這3部分考試中的分數(shù)都達到及格或接近及格，而且是在沒有任何人類協(xié)助下達成的。這反映出人工智能在臨床方面達到的成熟地步。

有關研究在2月10日出版的《科學公共圖書館·數(shù)字健康（PLOS Digital Health）》期刊上發(fā)表。在未經(jīng)過專門訓練或加強學習的情況下，ChatGPT對350道考試題進行了回答，經(jīng)評審人員閱卷打分，ChatGPT回答的準確性有60%，基本可以通過考試[1]。用來測試ChatGPT的考題，既有根據(jù)信息給患者做出診斷的開放式問題，也有諸如判斷病因之類的選擇題，但是排除了基于圖像的考試題。

▎圖/2023年2月發(fā)表在PLOS Digit Health上的論文《ChatGPT在USMLE的表現(xiàn)：使用大型語言模型的AI輔助醫(yī)學教育的潛力》評估了 ChatGPT 在美國執(zhí)業(yè)醫(yī)生資格考試中的表現(xiàn)，并發(fā)現(xiàn)ChatGPT在其解釋中表現(xiàn)出高度的一致性和洞察力。研究最后認為，大型語言模型可能具有協(xié)助醫(yī)學教育以及潛在臨床決策的潛力。

雖然現(xiàn)實中，通過執(zhí)業(yè)資格考試的醫(yī)科生還要經(jīng)過實習、培訓、臨床考試等過程才能獲得行醫(yī)資格，但研究結果顯示出，大型語言工具有潛力輔助醫(yī)學教育甚至臨床判斷。對此，有人認為ChatGPT將對國外醫(yī)療領域開始產(chǎn)生巨大沖擊！甚至有“硅谷投資人”認為，這個沖擊將降低病患的醫(yī)療成本，但是普通醫(yī)院的營收在ChatGPT成熟之后會遭遇斷崖式下降，導致醫(yī)療領域崗位流失，數(shù)以百萬計的優(yōu)秀醫(yī)生將需要學習新的技能再就業(yè)。這個革命性的ChatGPT，真的能革掉醫(yī)生的命？！

▎圖/ChatGPT是一個由OpenAI調(diào)教的人工智能應用，它的名字來源于它的兩個主要功能：聊天和GPT，即Generative Pretrained Transformer（“生成式預訓練轉換器”）。根據(jù)ChatGPT自己的解釋，ChatGPT是一種自然語言處理技術，先通過深度學習來理解人類的語言，再通過生成語言來實現(xiàn)人機對話。為了深度學習，ChatGPT需要使用大量的語言數(shù)據(jù)進行訓練，以便對各種語言問題作出回答。因為應用廣泛，中小學生開始用它來寫作業(yè)，大學生、研究生用它來寫論文，甚至程序員也開始用它來寫代碼。

ChatGPT在看病時的準確性如何？
為了解ChatGPT治療癌癥的能力，我們測試了6個問題問題1: 癌癥患者最大的誤區(qū)是什么？請用專業(yè)的方式回答，并給出實例。ChatGPT回答：癌癥患者有很多誤區(qū)，但其中最大的一個誤區(qū)是過分依賴偏方。許多癌癥患者認為僅通過使用傳統(tǒng)的中藥、信仰或其他偏方方法就可以治愈癌癥，這種想法是錯誤的。例如，有些癌癥患者拒絕接受標準的放療或化療，而只選擇傳統(tǒng)的中藥方法，這可能導致疾病進展和生存期的嚴重下降。因此，在確診癌癥后，建議患者咨詢專業(yè)的醫(yī)生，并在醫(yī)生的指導下選擇合適的治療方案。一種合適的治療方案可能包括手術、放療、化療等標準方法，以及適當?shù)闹兴幆煼ā?strong>點評：ChatGPT的這個回答，至少可以打90分。它不但指出了一個癌癥患者確實會陷入的重大誤區(qū)，最為關鍵的是，它提到了“建議患者咨詢專業(yè)的醫(yī)生”。

▎圖/AI已應用在麻醉與CT影像讀片等領域。

問題2: 癌癥患者不能吃什么？ChatGPT回答：對于癌癥患者，不同的治療方法可能導致不同的營養(yǎng)需求和飲食限制。在具體的情況下，建議癌癥患者向專業(yè)的醫(yī)生咨詢，以確保選擇合適的飲食方式。一般來說，癌癥患者可能需要避免以下食物：1. 腌制食品：例如熏肉、火腿等，因為這些食物可能含有致癌物質(zhì)。2. 高脂肪食品：例如油炸食品、高脂肪肉類等，因為這些食物可能增加癌癥的風險。3. 高糖食品：例如糖果、蛋糕等，因為這些食物可能增加癌癥的風險。4. 高鹽食品：例如腌制食品、醬油等，因為這些食物可能增加癌癥的風險。

但是，這些食物并不適用于所有癌癥患者，因此應該根據(jù)個人情況和醫(yī)生的建議進行調(diào)整。

點評：ChatGPT的這個回答，也可以至少打90分。ChatGPT提到的這些食物，如果長期、過量食用，可能會帶來健康風險，有些食物甚至已經(jīng)被世界衛(wèi)生組織定義為“可能致癌的因素”，癌癥患者自然應該特別注意。同時，ChatGPT的回答也中規(guī)中矩，不但沒有搞一些奇怪的噱頭來恐嚇大眾、吸引眼球，也提到“應該根據(jù)個人情況和醫(yī)生的建議進行調(diào)整”。

問題3: 癌癥患者感染新冠怎么辦？

ChatGPT回答：如果癌癥患者感染了新冠病毒，應立即尋求醫(yī)療幫助。對于癌癥患者，新冠病毒感染可能帶來更多的健康風險，因此需要特別關注。以下是一些建議：1. 立即就醫(yī)：癌癥患者感染新冠病毒后應立即就醫(yī)，以確保及時診斷和治療。2. 通信：與醫(yī)生保持密切的聯(lián)系，并告訴醫(yī)生關于癌癥治療的情況，以確保可以得到最佳的醫(yī)療幫助。3. 注意營養(yǎng)：保持良好的營養(yǎng)狀態(tài)可以幫助提高免疫力，減少感染的風險。4. 遵循醫(yī)生的建議：遵循醫(yī)生的建議，如停藥、減少外出等，以確保安全。5. 注意衛(wèi)生：注意個人衛(wèi)生，例如勤洗手、避免接觸疫情人群等。

癌癥患者感染新冠病毒后的治療方案可能因個體情況而異，建議在醫(yī)生的指導下接受治療。

點評：ChatGPT的回答也中規(guī)中矩，雖然有的建議比較含糊，如“停藥”，但是因為提到“遵循醫(yī)生的建議”，也就無可非議了。

問題4: 癌癥患者可以吃巧克力嗎？

ChatGPT回答：是的，癌癥患者可以吃巧克力，但是需要適量。巧克力是一種富含營養(yǎng)的食物，對于許多人來說是一種美味的零食。然而，巧克力也是高糖和高脂肪的食物，如果攝入過多，可能對健康產(chǎn)生不良影響。

因此，癌癥患者在食用巧克力時應注意以下幾點：

1. 適量食用：巧克力可以作為一種美味的零食，但是應該適量食用。

2. 選擇高品質(zhì)的巧克力：選擇含有高品質(zhì)可可的巧克力，以獲得更多的營養(yǎng)。

3. 避免過多的糖和脂肪：避免食用含有過多糖和脂肪的巧克力，以保護健康。

4. 考慮個人情況：在食用巧克力前，應該考慮個人情況，例如體重、飲食習慣等，以確保適當?shù)臄z入。

綜上所述，癌癥患者可以吃巧克力，但是需要適量，并選擇高品質(zhì)的巧克力。同時，在食用巧克力前應該考慮個人情況，以確保健康。點評：ChatGPT沒有過分夸大巧克力的危害，也提醒了適量。回答這個問題，ChatGPT不需要“醫(yī)生的建議”來加持。筆者提問了“癌癥患者可以吃糖嗎”，ChatGPT的答案基本相似，這里不再累述。

問題5: 癌癥患者不能吃什么水果？ChatGPT回答：一般來說，癌癥患者不存在不能吃什么水果的限制。相反，多吃水果可以幫助癌癥患者保持健康，提供營養(yǎng)。不過，一些癌癥患者可能因為特殊情況（例如食道癌）而不能食用某些水果，此時應該在醫(yī)生的指導下進行飲食。除此之外，癌癥患者也可以考慮消化不良的情況，例如選擇易消化的水果，避免對胃腸道造成過多負擔。綜上所述，癌癥患者可以多吃水果，以保持健康，但在特殊情況下應該在醫(yī)生的指導下進行飲食。點評：從這些問答可以看出，對于常識性的問題，ChatGPT毫無壓力。那如果針對患者的具體病情提問，ChatGPT還能夠提供滿意的回答嗎？問題6: 我有一個朋友被查出來是HER2陽性乳腺癌，有什么治療方案可以推薦給她嗎？ChatGPT回答：HER2陽性乳腺癌是一種特殊類型的乳腺癌，其特征在于HER2基因的異常表達。為了治療這種癌癥，醫(yī)生通常會采用多種方法，以確保最佳的治療效果。以下是一些可能的治療方案：1. 藥物治療：HER2陽性乳腺癌通常對藥物治療非常敏感，醫(yī)生可能會推薦使用HER2抑制劑，如Trastuzumab（Herceptin），以降低癌細胞的生長。2. 化療：在外科手術和/或放療后，化療可以幫助消除剩余的癌細胞，以減少復發(fā)的風險。3. 輔助治療：為了提高療效，醫(yī)生可能還會推薦其他輔助治療，例如放療，以減少癌癥的生長。4. 個體化治療：每個患者的情況都不同，因此醫(yī)生可能會采用個體化的治療方案，以確保最佳的結果。

這僅僅是一些治療方案的例子，最終的治療方案將根據(jù)患者的情況（包括疾病的嚴重程度，年齡等）進行評估和決策。因此，最好的方法是向醫(yī)生咨詢，以確定最佳的治療方案。

點評：HER2陽性，可以是基因的擴增，也可以是蛋白的過表達，ChatGPT的解釋雖然比較簡單，不過也可以接受。但是，談及治療方案時，ChatGPT的回答就比較混亂了，并沒有根據(jù)患者的病理期來提供治療建議。實際上，如果是早期的乳腺癌患者，能手術的應該首先進行手術（包括術前可能采取的新輔助化療），而并不是簡簡單單進行化療。而且作為術后的輔助治療，對于HER2陽性的患者來說，應該采用的是聯(lián)合了化療的HER2靶向治療。雖然回答不令人滿意，但是因為ChatGPT提到“最好的方法是向醫(yī)生咨詢，以確定最佳的治療方案”，回答也可以打一個及格分。

ChatGPT幫你找回常識，可以革掉一般科普的命，但專業(yè)醫(yī)生還是不可少從測試可以看出來，雖然對于一般的問題，ChatGPT可以回答得滴水不漏，但是對于比較專業(yè)的問題，還是得靠醫(yī)生來提供準確的回答。所以，如果說ChatGPT能革命，革的也是一般科普文章的命，無法取代醫(yī)生的角色。其實從通過美國執(zhí)業(yè)醫(yī)師資格考試的成績來看，ChatGPT也僅是勉強及格，而且即便美國的醫(yī)學生通過了資格考試，還是需要進行住院實習，積累實際診療經(jīng)驗。一般的患者，對實習醫(yī)生都不太放心，怎么可能放心讓ChatGPT來開方子呢？再說，如果沒有醫(yī)生把關，ChatGPT給的建議出了問題，找誰來負責呢？

▎圖/ChatGPT對前列腺癌的看法

所以，只能是把ChatGPT當作一個可用的工具，幫助獲得一些必要的輔助信息。由于患者與醫(yī)生交流的時間特別有限，如果患者或家人能夠提前做好功課，可以更有效地與醫(yī)生溝通。在目前信息泛濫的狀態(tài)下，面對互聯(lián)網(wǎng)上的各種說法，普通人可能會被迷惑，無所適從，相比之下，ChatGPT能夠做比較好的導航，得到一個相對比較合理的說法。在此基礎上，再通過與專業(yè)醫(yī)生的高效溝通，普通人能夠得到最大的利益。既然是一個工具，就需要知道在什么時候、什么場景下使用才是最佳的。ChatGPT是基于真實世界的數(shù)據(jù)進行深度學習，如果數(shù)據(jù)不夠、或者說錯誤的數(shù)據(jù)太多，那么ChatGPT說出來的就不靠譜。從目前大家的測試來看，ChatGPT對古詩詞的深度學習不夠，對于人類的情感也還沒有找到一個較好的方法，所以想跟ChatGPT聊一聊表達人類情感的古詩詞，基本是雞同鴨講。

AI在病理診斷、藥物研發(fā)方面都有很大的運用前景，對醫(yī)學的幫助到底有多大？ChatGPT使用的人工智能（AI）是自然語言處理，所以適用于聊天。在醫(yī)學數(shù)據(jù)的分析中，也需要使用到自然語言處理，可以對患者的病歷進行整理，從而更好地從真實世界的數(shù)據(jù)中找到規(guī)律。醫(yī)學數(shù)據(jù)還有很大一部分是影像學數(shù)據(jù)，醫(yī)生依據(jù)于這類數(shù)據(jù)的診斷，多少會有一些主觀意識，也就是容易發(fā)生誤判。在這個方面，人工智能有較大的優(yōu)勢，不但對圖像的識別更敏感，而且可以通過深度學習，發(fā)現(xiàn)人眼不能觀察到的相關性。比如說，對于鼻咽癌，目前通常是根據(jù)病理期來判斷患者的疾病進展風險。廣州中山大學醫(yī)院的一項研究表明，通過大數(shù)據(jù)對核磁共振圖像 (MRI)數(shù)據(jù)的深度學習所建立的模型，能夠更好地預測鼻咽癌患者疾病進展的風險。當然，如果將二者結合，準確性提高得更多[2]。2020年，一項英國的研究結果表明，在對AI算法改進之后，使用AI進行疾病診斷的能力得到了大幅提高，準確性優(yōu)于大多數(shù)參加研究的醫(yī)生（75%）[3]。在藥物研發(fā)方面，AI也發(fā)揮著越來越多的作用。比如AlphaFold根據(jù)一個蛋白的序列，就可以比較準確地預測其三維結構。AlphaFold能做到這一步，也是基于對目前蛋白結構的深度學習。在小分子藥物研發(fā)方面，AI深度學習能加快藥物的篩選速度，AI算法也能對先導化合物的成藥性和可開發(fā)性進行評估，選擇更優(yōu)、更容易成功的項目推進。由于機器一直在深度學習，AI技術一直在進步，因此很多人認為，假以時日，AI一定會取代醫(yī)生，成為疾病診斷、治療的主角。但這屬于過于樂觀的期望！即便有AI主導的疾病診斷、治療時代，目前在世的人幾乎都不可能等到這個時代的來臨。不過，因為AI技術的進步，醫(yī)生做出診斷的速度和準確性可以大大提高。301醫(yī)院基于AI深度學習，開發(fā)了一個胃部病理輔助診斷系統(tǒng)，靈敏度接近100%，特異性達到80.6%。2022年的研究結果表明，在使用這個人工智能輔助系統(tǒng)之后，病理醫(yī)生診斷胃癌的靈敏度顯著提高，成功率從82.75%提高到了90.63%，同時查看病理切片的時間也顯著下降，花在每張片子上的時間，從26.37秒下降到22.68秒[4]。目前的癌癥治療進入了靶向治療、免疫治療時代，對病理切片進行免疫組化染色檢查的要求也增加了，病理醫(yī)生的任務越來越繁重。

作為一個工具，AI不但提高了醫(yī)生診斷的準確性，而且還讓醫(yī)生的診斷速度提高了，在較短的時間內(nèi)獲得更準確的診斷！從這個角度看，AI并不是要取代醫(yī)生，而是要解放醫(yī)生。作為智能聊天的工具，ChatGPT也可以把醫(yī)生解放出來，可以使用ChatGPT來給患者進行簡單的科普，不需要把寶貴的時間花在解釋最簡單的問題上，集中精力解決最重要的問題。但是，ChatGPT也留給了我們一個重要的問題：AI可以深度學習，一直在進步；一般的吃瓜群眾，能真正從與ChatGPT的聊天中學到點什么，能獲得進步嗎？還是僅僅將ChatGPT當作一個聊天、娛樂的工具？

1. Kung, T.H., et al., Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models. PLOS Digital Health, 2023. 2(2): p. e0000198.

2. Jing, B., et al., Deep learning for risk prediction in patients with nasopharyngeal carcinoma using multi-parametric MRIs. Computer Methods and Programs in Biomedicine, 2020. 197: p. 105684.

3. Richens, J.G., C.n.M. Lee, and S. Johri, Improving the accuracy of medical diagnosis with causal machine learning. Nature Communications, 2020. 11(1): p. 3923.

4. Ba, W., et al., Assessment of deep learning assistance for the pathological diagnosis of gastric cancer. Modern Pathology, 2022. 35(9): p. 1262-1268.

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.