AGI-Eval 是由上海交通大学、同济大学、华东师范大学以及 DataWhale 等高校和机构联合发布的大模型评测社区。它旨在打造一个公正、可信、科学且全面的评测生态,专注于评估基础模型在人类认知和问题解决任务中的通用能力。通过一系列标准化的评测方案,AGI-Eval 能够衡量 AI 模型在人类认知能力方面的表现,从而揭示其在现实生活中的适用性和有效性。 AGI-Eval 以“评测助力,让 AI 成为人类更好的伙伴”为使命,通过科学的方法和前沿技术,对通用人工智能在语言理解、知识运用、逻辑推理、创新思维等多个维度的表现进行深入剖析和量化衡量。

网站域名:agi-eval.cn 更新日期:2025-03-23 网站简称:AGI-Eval 网站分类:AI 开源模型 人气指数:17