
5月15日,中文醫(yī)療大模型權(quán)威評測平臺MedBench公布最新自測榜單結(jié)果,云知聲基于山海大模型打造的醫(yī)療行業(yè)專用大模型(UniGPT-Med-U1)以綜合得分93.1的成績強勢衛(wèi)冕冠軍之位。尤為矚目的是,在醫(yī)學語言理解與醫(yī)學安全倫理雙項評測中,UniGPT-Med-U1分別斬獲122.3分與104.9分的佳績,雙雙榮登榜首,成為參評的眾多醫(yī)療大模型中的卓越典范。

“醫(yī)學語言理解”評測得分

“醫(yī)學安全倫理”評測得分
MedBench是由上海人工智能實驗室、上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合多家機構(gòu)打造的中文醫(yī)療大模型權(quán)威評測平臺。作為全球AI醫(yī)療領域的重要參照標準之一,MedBench以其科學嚴謹?shù)脑u測體系,為全球超過387個醫(yī)療大模型提供了提供客觀科學的性能評估。評測維度涵蓋醫(yī)學知識問答、醫(yī)學語言生成、復雜醫(yī)學推理、醫(yī)學語言理解、醫(yī)療安全和倫理5大關鍵維度。
多步深度推理,讓診療決策有“根”可循
云知聲UniGPT-Med-U1的優(yōu)異表現(xiàn),源于其先進的技術架構(gòu)與創(chuàng)新技術。該模型基于山海大模型架構(gòu)完成系統(tǒng)性升級,依托云知聲在醫(yī)療行業(yè)深耕多年積累的海量診療數(shù)據(jù),進行增量式強化訓練。采用的多步深度推理架構(gòu),將知識圖譜檢索與邏輯鏈驗證相結(jié)合,嚴格遵循循證醫(yī)學框架,建立起可信的知識溯源機制。通過雙重校驗的推理范式,該模型在診斷準確性、臨床邏輯完備性和決策過程可解釋性等關鍵指標上實現(xiàn)了突破性提升,為醫(yī)療決策提供了更可靠、精準的支持,讓診療決策有“根”可循。

在技術創(chuàng)新方面,云知聲研發(fā)的引導式數(shù)據(jù)生成技術和可控驗證深度推理技術,為UniGPT-Med-U1賦予了獨特優(yōu)勢。
針對傳統(tǒng)GRPO強化學習訓練數(shù)據(jù)篩選效率低的問題,引導式數(shù)據(jù)生成技術采用動態(tài)答案預置機制,在生成階段引導模型輸出多樣化醫(yī)學回答,確保訓練數(shù)據(jù)具備天然多樣性。這不僅大幅縮短數(shù)據(jù)篩選耗時,還增強了模型對錯誤答案的鑒別能力,顯著降低臨床決策支持任務中的誤診風險。
而可控驗證深度推理技術,則有效解決了現(xiàn)有大語言模型在醫(yī)療推理中的痛點。該技術采用“推理-反思-再推理”循環(huán)架構(gòu),并結(jié)合可驗證推理獎勵和可驗證反思獎勵機制,使模型在生成診斷建議時具備嚴格的自檢能力,實現(xiàn)精準反思與可靠決策,避免出現(xiàn)邏輯漏洞和冗余信息。
技術落地賦能,推動醫(yī)療行業(yè)智慧化發(fā)展
從技術研發(fā)到場景應用,云知聲基于醫(yī)療行業(yè)專用大模型、智能語音識別、自然語言理解、臨床知識圖譜等人工智能技術,構(gòu)建了豐富的產(chǎn)品和解決方案體系,覆蓋醫(yī)政醫(yī)管、臨床診療、醫(yī)保管理、患者服務等多個業(yè)務領域,服務對象包括衛(wèi)健委、醫(yī)保局、醫(yī)院管理者、醫(yī)護人員、患者等多類用戶,全面賦能醫(yī)療智能化建設。
其中,基于醫(yī)療行業(yè)專用大模型推出的門診病歷生成、智能病歷質(zhì)控、DRG/DIP醫(yī)保支付管理等系統(tǒng),已在全國幾十家醫(yī)院成功落地應用。

門診病歷生成系統(tǒng)能夠?qū)崟r捕捉醫(yī)患之間的對話內(nèi)容,智能提取關鍵問診信息,并自動生成結(jié)構(gòu)化病歷。醫(yī)生僅需進行簡單審核,即可完成病歷書寫工作。目前該系統(tǒng)已在北京友誼醫(yī)院順義院區(qū)廣泛應用,單份病歷采納率高達98%,大幅降低了醫(yī)生文書負擔;智能病歷質(zhì)控系統(tǒng)能夠精準理解病歷內(nèi)容,并智能識別其中的書寫錯誤與缺陷。系統(tǒng)對影像描述、專業(yè)術語進行細致分析,并對檢查結(jié)果、檢查結(jié)論以及檢查依據(jù)進行深度解讀,從而實現(xiàn)高效、精準的病歷質(zhì)控;DRG/DIP醫(yī)保支付管理系統(tǒng)以智能提醒和數(shù)據(jù)分析兩種方式,從診療過程中、醫(yī)保結(jié)算前到醫(yī)保結(jié)算后,為醫(yī)生、質(zhì)控員、編碼員和醫(yī)保處提供全流程、全方位的醫(yī)保支付管理服務。該系統(tǒng)成功助力中國人保財險完成核賠風控AI醫(yī)療審核系統(tǒng)的全國性部署。
持續(xù)創(chuàng)新,引領AI醫(yī)療新未來
憑借領先的技術架構(gòu)與扎實的場景落地能力,云知聲醫(yī)療行業(yè)專用大模型在AI醫(yī)療賽道的專業(yè)技能比拼中屢獲佳績。在MedQA、CCKS醫(yī)學大模型評測、Medbench醫(yī)學大模型評測、全國醫(yī)保大賽等專業(yè)競賽中,始終保持大模型醫(yī)學能力全球領先的地位,充分展現(xiàn)了其在技術創(chuàng)新和實踐應用方面的卓越實力。
此次再次登頂MedBench榜單,不僅是對云知聲技術實力的再次證明,更是對其在AI醫(yī)療領域持續(xù)創(chuàng)新的肯定。未來,云知聲將繼續(xù)深化專業(yè)技術,進一步提升UniGPT-Med-U1的性能和應用水平,攜手更多醫(yī)療機構(gòu)、科研單位,共同探索AI醫(yī)療的更多應用場景。為提升醫(yī)療服務質(zhì)量和效率,改善患者就醫(yī)體驗,促進醫(yī)療行業(yè)智慧化、可持續(xù)發(fā)展貢獻更多力量。
