AI导航
资源站导航
引导页
博客
CGtimo后期资源站
CGtimo AI创作
CGtimo AI api
CGtimo卡密商城
引导页
博客
CGtimo后期资源站
CGtimo AI创作
CGtimo AI api
CGtimo卡密商城
AI模型评测
共 12 篇网址
排序
发布
更新
浏览
点赞
StableVicuna
页面未直接介绍lmarena ai功能技术等信息。
2,657
96
AI模型评测
AI训练模型
# ai arena
# AI assistant comparison
# ai chat
CMMLU
CMMLU是用于测量中文大规模多任务语言理解能力的工具。
3,988
58
AI模型评测
# AI模型评测
HELM
HELM是一个用于评估语言模型的全面框架,作为实时基准提高语言模型评估的透明度。
2,737
20
AI模型评测
# AI模型评测
MMLU
MML基准(多任务语言理解)主要用于评估语言模型在多任务语言理解方面的性能。
3,741
38
AI模型评测
# AI模型评测
FlagEval
从页面信息推测,FlagEval可能是一款应用程序。
4,067
13
AI模型评测
# AI模型评测
OpenCompass
OpenCompass司南评测榜单是为大语言模型和多模态模型打造的评测平台。
2,948
78
AI模型评测
# AI模型评测
AGI-Eval
AGI-Eval评测社区是专注于通用人工智能评估的平台。
3,886
59
AI模型评测
# AI模型评测
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件。
3,581
4
AI模型评测
# AI模型评测
PubMedQA
PubMedQA是一个用于生物医学研究问答的数据集。
2,127
35
AI模型评测
# AI模型评测
MMBench
MMBench是一个用于多模态大型模型(LMMs)评估的平台。
2,096
20
AI模型评测
# AI模型评测
SuperCLUE
SuperCLUE是针对中文可用通用大模型的测评基准,是CLUE在通用人工智能时代的进一步发展。
4,154
40
AI模型评测
# AI模型评测
H2O EvalGPT
H2O Eval Studio是一款用于评估检索增强生成和大语言模型应用的模块化工作室。
3,051
89
AI模型评测
# AI模型评测
没有了
CGtimo导航
— 后期相关网址导航站点
加入收藏夹
按
Ctrl+D
可收藏本网页,方便快速打开使用。
设为首页
浏览器
设置页面
>
启动时
选项下
打开特定网页或一组网页
。
7.3
K
收录网址
770
运行天数
27.1
M
访问人数
12
收录文章
热门文章
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
标签云