CGtimo导航
AI导航资源站导航
  • blog
  • 引导页
  • 后期资源站
  • AI创作
  • CGtimo AI api
  • 卡密商城
  • 公告归档
    • blog
    • 引导页
    • 后期资源站
    • AI创作
    • CGtimo AI api
    • 卡密商城
    • 公告归档

    AI模型评测

    共 12 篇网址
    排序
    发布更新浏览点赞
    StableVicuna

    StableVicuna

    页面未直接介绍lmarena ai功能技术等信息。
    1,42296
    AI模型评测AI训练模型# ai arena# AI assistant comparison# ai chat
    CMMLU

    CMMLU

    CMMLU是用于测量中文大规模多任务语言理解能力的工具。
    3,18258
    AI模型评测# AI模型评测
    HELM

    HELM

    HELM是一个用于评估语言模型的全面框架,作为实时基准提高语言模型评估的透明度。
    1,38520
    AI模型评测# AI模型评测
    MMLU

    MMLU

    MML基准(多任务语言理解)主要用于评估语言模型在多任务语言理解方面的性能。
    2,23338
    AI模型评测# AI模型评测
    FlagEval

    FlagEval

    从页面信息推测,FlagEval可能是一款应用程序。
    2,42913
    AI模型评测# AI模型评测
    OpenCompass

    OpenCompass

    OpenCompass司南评测榜单是为大语言模型和多模态模型打造的评测平台。
    1,86978
    AI模型评测# AI模型评测
    AGI-Eval

    AGI-Eval

    AGI-Eval评测社区是专注于通用人工智能评估的平台。
    2,45659
    AI模型评测# AI模型评测
    C-Eval

    C-Eval

    C-Eval是一个适用于大语言模型的多层次多学科中文评估套件。
    2,4114
    AI模型评测# AI模型评测
    PubMedQA

    PubMedQA

    PubMedQA是一个用于生物医学研究问答的数据集。
    93135
    AI模型评测# AI模型评测
    MMBench

    MMBench

    MMBench是一个用于多模态大型模型(LMMs)评估的平台。
    80920
    AI模型评测# AI模型评测
    SuperCLUE

    SuperCLUE

    SuperCLUE是针对中文可用通用大模型的测评基准,是CLUE在通用人工智能时代的进一步发展。
    2,98440
    AI模型评测# AI模型评测
    H2O EvalGPT

    H2O EvalGPT

    H2O Eval Studio是一款用于评估检索增强生成和大语言模型应用的模块化工作室。
    1,92089
    AI模型评测# AI模型评测
    没有了

    标签云

    CGtimo导航
    CGtimo导航一个实用的后期办公导航网站,致力于分享优质的网站及软件资源,帮助大家提高办公生活效率。欢迎收藏分享!
    • 排行榜
    站长微信CGtimo导航
    站长微信
    资源站服务号CGtimo导航
    资源站服务号
    免费后期资源公众号CGtimo导航
    免费后期资源公众号
    Copyright © 2025 CGtimo导航 鲁ICP备2022008692号-2 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章