GenAI 医学预测能力基准评分榜

为了提供在临床学习和研究中使用GenAI的可靠证据,我们正在系统地评价顶级大语言模型,包括开源的,用于各种疾病的关键医疗任务,如诊断预测。下面的基准评分榜是ELHS 基准系统的研究进展,随着大语言模型的发展将不断更新。

DxB: 诊断预测基准
Dataset Diseases OpenAI ChatGPT-4 Google Gemini-1.5 Baidu Ernie-4 Date
神经内科疾病 63 93.22% 92.14% 90.56% 20240509
肿瘤 112 85.98% 86.22% 89.88% 20240404
More ...

ScB: 症状检查基准
Dataset Diseases OpenAI ChatGPT-4 Google Gemini-1.0 Baidu Ernie-4 Date
MCSC覆盖疾病 181 84.81% 74.59% 78.73% 20240404
More ...



大模型智能医学助手平台 alpha v1.1.6 使命:在医疗健康邻域普及生成式人工智能,以帮助实现国际健康公平 © 2023-2024 公平健康系统研究所(ELHS Institute). All rights reserved.
elhsi.org
声明:本网站的内容和工具只为学习和研究提供信息,不提供医疗服务建议或诊断