FlagEval

AI模型评测 2023-12-14

FlagEval（天秤）由智源研究院将联合多个高校团队打造，是一种采用“能力—任务—指标”三维评测框架的大模型评测平台，旨在提供全面、细致的评测结果。该平台已提供了 30 多种能力、5 种任务和 4 大类指标，共 600 多个维度的全面评测，任务维度包括 22 个主客观评测数据集和 84433 道题目。

AI模型评测

©️版权声明：本网站活动转载来源网络，转载目的仅用于网络信息分享，请用户注意自行甄别虚假信息，谨防受骗！用户参与活动需在活动方活动规则之内，活动中不得涉及违法行为且与本文无关，用户任何违法行为均与本站无关。活动中涉及的活动规则、活动奖励及最终解释权归主办方所有。如有侵权，请迅速联系我们删除。

相关文章

MMLU

2023-12-14

100

Open LLM Leaderboard

2023-12-14

23

C-Eval

2023-12-14

100

SuperCLUE

2023-12-14

58

OpenCompass

2023-12-14

20

CMMLU

2023-12-14

56

最新文章

什么值得买

2026-06-19

16

慢慢买

2026-06-19

10

线报酷

2026-06-19

8

超级线报

2026-06-19

2

聚合线报

2026-06-19

1

爱米副业导航是省钱和副业资源社区，收录了数百个不同类型的省钱和副业资源，每日更新和添加最新省钱羊毛线报和赚米信息及测评！ Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

爱米副业导航关于我们免责声明

Copyright © 爱米副业导航粤ICP备12345678号

川公网安备 123456789号