國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測結(jié)果正式揭曉!6月30日,醫(yī)聯(lián)于成都舉行了國內(nèi)首次AI醫(yī)生與真人醫(yī)生一致性評測,并進行了全天候?qū)崟r直播?,F(xiàn)場有120多位真實患者及10位來自四川大學(xué)華西醫(yī)院的主治醫(yī)師共同參與了這場評測研究。最終,經(jīng)過來自北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專家教授針對評測形成的91份有效病例進行審核,并且針對AI醫(yī)生的問診準確性、診斷準確性、治療建議準確性、輔助檢查方案準確性、數(shù)據(jù)分析準確性、提供可解釋信息、自然語言問診與交互這7個評價維度的打分之后,最終,真人醫(yī)生綜合得分為 7.5分,AI 醫(yī)生綜合得分為 7.2分。AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達到了96%。
(最終評審結(jié)果)
國內(nèi)首次AI 醫(yī)生一致性評測 評審專家稱“超出預(yù)期”
(相關(guān)資料圖)
在歷經(jīng)8個小時的問診過程中,MedGPT?與來自四川大學(xué)華西醫(yī)院的心內(nèi)科、消化內(nèi)科、呼吸內(nèi)科、內(nèi)分泌科、腎臟內(nèi)科、骨科、泌尿外科的10位主治及以上醫(yī)師共同對100余名患者進行問診,經(jīng)過專家評審團,從準確性、客觀數(shù)據(jù)分析、可信度、人機交互性展開。最終,經(jīng)過長達3個小時的對比分析及判斷,綜合專家團所有評審的判定及評分,AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達到了96%。
(評審流程)
為了保證評測的合理性和科學(xué)性,此次測試的問診環(huán)節(jié)進行了特殊的設(shè)計:患者進入診室后,將與醫(yī)助溝通自身病情,醫(yī)助通過線上文字輸入的方式將患者主訴傳達給真人醫(yī)生與AI醫(yī)生并協(xié)助醫(yī)患完成多輪溝通,在收集足夠的決策因子后,真人醫(yī)生與?AI?醫(yī)生為患者開具檢查單或診斷,患者直接在成都高新海爾森醫(yī)院完成檢查;在獲得檢查結(jié)果后,患者進行復(fù)診,并由AI醫(yī)生及真人醫(yī)生提供臨床診斷及治療方案。通過以上流程,可以在條件基本一致的情況下,讓真人醫(yī)生與AI醫(yī)生進行互不干涉的獨立診斷。
在當(dāng)晚的評審環(huán)節(jié),現(xiàn)場專家對于AI醫(yī)生的表現(xiàn)給予高度肯定,在場評審團專家普遍認為,MedGPT而是通過多輪詢問收集足夠信息,以確保醫(yī)療準確性為前提推進問診流程,所以出現(xiàn)誤診、漏診的概率就比較小。令人驚喜的一點是,不同于??漆t(yī)生,MedGPT診斷出了不屬于就診科室的疾病,給出其他具備可能性的判斷,這在常規(guī)的??茊栐\中是很難做到的。專家評審團認為,它的知識覆蓋面是超過一些經(jīng)驗并不是很充足的真人醫(yī)生的。
北大人民醫(yī)院主任醫(yī)師薛峰在評審過程中發(fā)現(xiàn)了一個“驚喜”:MedGPT 根據(jù)患者腳底板疼痛診斷出有患者有可能出現(xiàn)神經(jīng)壓迫,真人醫(yī)生卻沒有想到這一點。薛峰認為,MedGPT應(yīng)該是一個非常有發(fā)展前景的一項技術(shù),在病人遇到一些癥狀,有困擾的時候,跟他去聊一聊,讓它給一個初步的診斷,還是非常有幫助的,具備非常好的前景。
中日友好醫(yī)院心內(nèi)科主任醫(yī)師任景怡表示:我覺得最好的一點,當(dāng)診斷尚不明確時,MedGPT并不會輕易給出結(jié)論,而是要堅持要通過繼續(xù)問診或檢查收集更多信息。盡管 MedGPT 還存在一些問題,但邁出了重要的一步,這是里程碑式的結(jié)果。?
云化能力結(jié)合?AI?醫(yī)生“手段”更加豐富
值得一提的是,MedGPT不僅在一致性上達到了一定水準,還可以提供疾病治療環(huán)節(jié)中的其他“手段”,例如此次診斷過程中的“云檢驗”:在完成初步問診后,MedGPT會給患者開具必要的醫(yī)學(xué)檢查項目,以進一步明確病情。患者則可以通過醫(yī)聯(lián)云檢驗等多模態(tài)能力進行檢查?;谟行栐\以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進行準確的疾病診斷,并為患者設(shè)計后續(xù)疾病治療方案。對于真人醫(yī)生來說,開具檢驗并根據(jù)結(jié)果對病情進行判斷是疾病診斷過程中的常規(guī)操作,但對于AI?醫(yī)生來說,這是一則突破。
在此次問診現(xiàn)場,MedGPT就為患者開具了多種檢驗檢測,患者在憑借單據(jù)直接在成都高新海爾森醫(yī)院完成相關(guān)檢測。醫(yī)聯(lián)MedGPT項目負責(zé)人王磊表示:MedGPT?開單檢查只是多模態(tài)能力的其中一環(huán),MedGPT?后續(xù)將配合醫(yī)聯(lián)多種云化能力,覆蓋預(yù)防、診斷、治療、康復(fù)的疾病管理全流程,讓患者輕松接觸到優(yōu)質(zhì)醫(yī)療資源。未來,MedGPT?會擁有更大的想象空間。
事實上,醫(yī)聯(lián)在今年5月已經(jīng)公布了?MedGPT多種醫(yī)學(xué)檢驗檢測模態(tài)能力。除了配合云化能力進行檢驗檢測外,MedGPT會在患者收到藥品后主動為患者進行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病診療動作。醫(yī)聯(lián)MedGPT plugin?應(yīng)用平臺整合超過?1000+醫(yī)療多模態(tài)能力,整合多樣化的醫(yī)療多模態(tài)能力,豐富和完善全流程智能化診療體驗。
一次階段性探索?一次?AI?應(yīng)用發(fā)展的推進
現(xiàn)階段,醫(yī)療行業(yè)還存在著資源分配不均,邊緣地區(qū)患者難以接觸到優(yōu)質(zhì)醫(yī)療資源等痛點,而AI醫(yī)療可以有效補充醫(yī)療資源,助力全民健康生活水平的提升,有利于補全基層診療服務(wù)短板,強化公共衛(wèi)生服務(wù)效率,幫助解決優(yōu)質(zhì)醫(yī)療資源相對匱乏和基層醫(yī)療服務(wù)能力不足的結(jié)構(gòu)性難題。
(評測現(xiàn)場)
此次測試是國內(nèi)首次公開的、規(guī)?;?、基于真實患者的AI醫(yī)生與真人醫(yī)生的一致性研究評測,也是對于AI?醫(yī)療的一次階段性探索。經(jīng)過此次評測,以?MedGPT為首的?AI?醫(yī)療已經(jīng)現(xiàn)階段進入到了真實患者測試階段,這也意味著通用型人工智能技術(shù)的研究與應(yīng)用發(fā)展水平得到了進一步推進。王磊表示:“此次測評,本質(zhì)是為了持續(xù)驗證與提升AI模型的醫(yī)學(xué)有效性。醫(yī)聯(lián)希望通過?MedGPT?在疾病管理全流程上的能力,讓智能化的醫(yī)療手段幫助更多患者,令各地醫(yī)療資源的不均等逐漸消弭?!?/p>
推動AI在醫(yī)療行業(yè)的研究與應(yīng)用,以嚴肅醫(yī)療為根本,讓優(yōu)勢的醫(yī)療資源與技術(shù)惠及更多人,是醫(yī)聯(lián)不斷向前的動力。醫(yī)聯(lián)也將在AI醫(yī)療領(lǐng)域持續(xù)耕耘,加速?AI?在醫(yī)療行業(yè)內(nèi)的落地應(yīng)用,力爭貫徹讓全人類健康壽命延長一年的使命。(柯巖)