GAIA

共 2 篇文章

排序

发布更新浏览点赞

【开源 LLM 基准测试】全新大语言模型基准测试论文：GAIA 与 GPQA 概览

【开源 LLM 基准测试】全新大语言模型基准测试论文：GAIA 与 GPQA 概览

探索两篇刚出炉的重磅 LLM 基准测试论文： GAIA：这是一项全方位的人工智能助手评测（顺便一提，视频作者与其他杰出人士合著） GPQA：一个高级别的谷歌可证明问答评测（作者团队同样令人敬佩）当两...

AI 技术文章 AI 视频教程 # GAIA # GPQA # LLM

2年前

01,0960

GAIA: 一个严苛的智能体基准

GAIA: 一个严苛的智能体基准

简要概括经过一些实验，我们对 Transformers 智能体构建智能体系统的性能印象深刻，因此我们想看看它有多好！我们使用一个用库构建的代码智能体在 GAIA 基准上进行测试，这可以说是最困难...

AI 技术文章 # Agent # GAIA # 智能体

2年前

03090