AI导航
资源站导航
blog
引导页
后期资源站
AI创作
CGtimo AI api
卡密商城
公告归档
blog
引导页
后期资源站
AI创作
CGtimo AI api
卡密商城
公告归档
AI模型评测
共 12 篇网址
排序
发布
更新
浏览
点赞
StableVicuna
页面未直接介绍lmarena ai功能技术等信息。
1,422
96
AI模型评测
AI训练模型
# ai arena
# AI assistant comparison
# ai chat
H2O EvalGPT
H2O Eval Studio是一款用于评估检索增强生成和大语言模型应用的模块化工作室。
1,920
89
AI模型评测
# AI模型评测
OpenCompass
OpenCompass司南评测榜单是为大语言模型和多模态模型打造的评测平台。
1,921
78
AI模型评测
# AI模型评测
AGI-Eval
AGI-Eval评测社区是专注于通用人工智能评估的平台。
2,456
59
AI模型评测
# AI模型评测
CMMLU
CMMLU是用于测量中文大规模多任务语言理解能力的工具。
3,182
58
AI模型评测
# AI模型评测
SuperCLUE
SuperCLUE是针对中文可用通用大模型的测评基准,是CLUE在通用人工智能时代的进一步发展。
2,984
40
AI模型评测
# AI模型评测
MMLU
MML基准(多任务语言理解)主要用于评估语言模型在多任务语言理解方面的性能。
2,233
38
AI模型评测
# AI模型评测
PubMedQA
PubMedQA是一个用于生物医学研究问答的数据集。
931
35
AI模型评测
# AI模型评测
HELM
HELM是一个用于评估语言模型的全面框架,作为实时基准提高语言模型评估的透明度。
1,385
20
AI模型评测
# AI模型评测
MMBench
MMBench是一个用于多模态大型模型(LMMs)评估的平台。
809
20
AI模型评测
# AI模型评测
FlagEval
从页面信息推测,FlagEval可能是一款应用程序。
2,429
13
AI模型评测
# AI模型评测
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件。
2,489
4
AI模型评测
# AI模型评测
没有了
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章