验证开源大模型

验证开源大语言模型预测医疗任务

验证和选择能胜任您要改进的特定医疗任务的开源大模型至关重要，因为其预测准确率在不同疾病之间可能会显著不同。为了帮助医生为高影响力的疾病选择合适的大模型，我们一直在对顶级开源大模型进行验证，包括Llama-3.1-70B、Llama-3.1-8B、Llama3-70B、Llama3-8B和Gemma2-9B。

下表列出了一些经过验证的诊断预测任务，在这些任务中，最好的开源大模型已实现了超过90%的准确率。每个疾病任务还有几个患者病案示例，示例链接将打开AIChat，您可以从大模型下拉单中选择任何开源大模型进行测试，并与最佳商业模型进行比较。

医疗任务	患者病案示例
Predicting Alzheimer's disease	案例-1 案例-2 案例-3 Example-1 Example-2 Example-3
Predicting Parkinson's disease	案例-1 案例-2 案例-3 Example-1 Example-2 Example-3
Predicting stroke	案例-1 案例-2 案例-3 Example-1 Example-2 Example-3

声明：本网站的内容和工具只为学习和研究提供信息，不提供医疗服务建议或诊断