验证开源大语言模型预测医疗任务

验证和选择能胜任您要改进的特定医疗任务的开源大模型至关重要,因为其预测准确率在不同疾病之间可能会显著不同。为了帮助医生为高影响力的疾病选择合适的大模型,我们一直在对顶级开源大模型进行验证,包括Llama-3.1-70B、Llama-3.1-8B、Llama3-70B、Llama3-8B和Gemma2-9B。

下表列出了一些经过验证的诊断预测任务,在这些任务中,最好的开源大模型已实现了超过90%的准确率。每个疾病任务还有几个患者病案示例,示例链接将打开AIChat,您可以从大模型下拉单中选择任何开源大模型进行测试,并与最佳商业模型进行比较。


医疗任务 患者病案示例
Predicting Alzheimer's disease 案例-1   案例-2   案例-3   Example-1   Example-2   Example-3  
Predicting Parkinson's disease 案例-1   案例-2   案例-3   Example-1   Example-2   Example-3  
Predicting stroke 案例-1   案例-2   案例-3   Example-1   Example-2   Example-3  



生成式智能医学助手(ELHS GenAI Copilot) alpha v1.1.1 使命:通过普及医学生成式人工智能,帮助实现健康公平 © 2023-2024 公平健康系统研究所(ELHS Institute). All rights reserved.
elhsi.org
声明:本网站的内容和工具只为学习和研究提供信息,不提供医疗服务建议或诊断