FlagEval

AI模型评测 2023-12-14

FlagEval(天秤)由智源研究院将联合多个高校团队打造,是一种采用“能力—任务—指标”三维评测框架的大模型评测平台,旨在提供全面、细致的评测结果。该平台已提供了 30 多种能力、5 种任务和 4 大类指标,共 600 多个维度的全面评测,任务维度包括 22 个主客观评测数据集和 84433 道题目。

©️版权声明:本网站活动转载来源网络,转载目的仅用于网络信息分享,请用户注意自行甄别虚假信息,谨防受骗! 用户参与活动需在活动方活动规则之内,活动中不得涉及违法行为且与本文无关,用户任何违法行为均与本站无关。 活动中涉及的活动规则、活动奖励及最终解释权归主办方所有。 如有侵权,请迅速联系我们删除。

相关文章