三千导航
  • 首页
  • 垂直分类
    • AI工具导航
    • 设计导航
    • 自媒体导航
    • 有趣酷站
    • 学习导航
  • 关于三千
  • 其他
    • 网站提交
    • 广告合作
  • 排行榜
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI模型评测

      共 13 篇网址
      UED团队常用工具常用推荐界面灵感社区资讯设计师导航网页灵感发现产品网盘云储学习影视大全综合平台AI导航生活服务影视休闲下载工具软件工具搜索工具美女图库动漫资源办公工具有趣酷站便民查询热点指数文案编辑变现渠道运营推广公告帮助学习导航
      AI对话聊天AI写作工具AI图像工具AI视频工具AI办公工具AI设计工具AI编程工具AI搜索引擎AI音频工具AI热门工具AI训练模型AI开发平台AI语言翻译AI法律助手AI内容检测AI提示指令AI模型评测AI学习网站
      排序
      发布更新浏览点赞
      Chatbot Arena

      Chatbot Arena

      以众包方式进行匿名随机对战的LLM基准平台
      015.4K32
      AI模型评测# AI模型评测
      Open LLM Leaderboard

      Open LLM Leaderboard

      HuggingFace推出的开源大模型排行榜单
      011.6K16
      AI模型评测# AI模型评测
      SuperCLUE

      SuperCLUE

      中文通用大模型综合性测评基准
      08K80
      AI模型评测# AI模型评测
      FlagEval

      FlagEval

      智源研究院推出的FlagEval(天秤)大模型评测平台
      07.9K48
      AI模型评测# AI模型评测
      CMMLU

      CMMLU

      一个综合性的大模型中文评估基准
      07.8K72
      AI模型评测# AI模型评测
      MMBench

      MMBench

      全方位的多模态大模型能力评测体系
      07.7K56
      AI模型评测# AI模型评测
      H2O EvalGPT

      H2O EvalGPT

      H2O.ai推出的基于Elo评级方法的大模型评估系统
      07.6K48
      AI模型评测# AI模型评测
      PubMedQA

      PubMedQA

      生物医学研究问答数据集和模型得分排行榜
      07.6K48
      AI模型评测# AI模型评测
      OpenCompass

      OpenCompass

      上海人工智能实验室推出的大模型开放评测体系
      07.6K48
      AI模型评测# AI模型评测
      HELM

      HELM

      斯坦福大学推出的大模型评测体系
      07.4K8
      AI模型评测# AI模型评测
      C-Eval

      C-Eval

      一个全面的中文基础模型评估套件
      07.4K56
      AI模型评测# AI模型评测
      MMLU

      MMLU

      大规模多任务语言理解基准
      07.3K32
      AI模型评测# AI模型评测
      LLMEval3

      LLMEval3

      由复旦大学NLP实验室推出的大模型评测基准
      07.3K72
      AI模型评测# AI模型评测
      没有了
      三千导航
      三千导航(3knav.com)是一个实用全面高质量的网址导航网站,是国内首屈一指的导航分类平台,收录国内外各类型网站供网友检索,三千导航致力于为广大用户推荐各行各业优秀网站,国内外网站大全尽在三千导航。

      友链申请三千科技三千全端云

      扫码加微信三千导航
      扫码加微信
      关注微信公众号三千导航
      关注微信公众号
      Copyright © 2025 三千导航 赣ICP备17017363号-5  赣公网安备36100002000214 
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍