验证和选择能胜任您要改进的特定医疗任务的开源大模型至关重要,因为其预测准确率在不同疾病之间可能会显著不同。为了帮助医生为高影响力的疾病选择合适的大模型,我们一直在对顶级开源大模型进行验证,包括Llama-3.1-70B、Llama-3.1-8B、Llama3-70B、Llama3-8B和Gemma2-9B。
下表列出了一些经过验证的诊断预测任务,在这些任务中,最好的开源大模型已实现了超过90%的准确率。每个疾病任务还有几个患者病案示例,示例链接将打开AIChat,您可以从大模型下拉单中选择任何开源大模型进行测试,并与最佳商业模型进行比较。
医疗任务 | 患者病案示例 |
---|---|
Predicting Alzheimer's disease | 案例-1 案例-2 案例-3 Example-1 Example-2 Example-3 |
Predicting Parkinson's disease | 案例-1 案例-2 案例-3 Example-1 Example-2 Example-3 |
Predicting stroke | 案例-1 案例-2 案例-3 Example-1 Example-2 Example-3 |