LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科,共计约20W道标准生成式问答题目。
©️ 版权声明:本站所有AI工具索引及介绍内容版权归AInav所有。未经许可,任何个人或组织不得转载、采集或建立镜像。本站部分工具介绍来源于官方公开资料,旨在促进人工智能技术的普及与应用,如有侵权请联系删除。