AI 艺术工具通讯创刊号 🎉 AI 领域的发展速度令人惊叹,回想一年前我们还在为生成正确手指数量的人像而苦苦挣扎的场景,恍如隔世 😂。 过去两年对开源模型和艺术创作工具而言具有里程碑意义。创意表达的 AI 工具从未像现...AI 技术周刊AI 技术文章# AI Weekly# AI 艺术# AI 艺术工具通讯11个月前01380
让 LLM 来评判 | 奖励模型相关内容奖励模型相关内容 这是 让 LLM 来评判 系列文章的第五篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么...AI 技术文章# LLM12个月前01250
让 LLM 来评判 | 评估你的评估结果评估你的评估结果 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 在生...AI 技术文章# LLM12个月前01200
让 LLM 来评判 | 选择 LLM 评估模型基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模...AI 技术文章# LLM# 评估模型1年前01970
让 LLM 来评判 | 基础概念基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模...AI 技术文章# LLM1年前01920
自动评估基准 | 一些评估测试集一些评估测试集 这是 自动评估基准 系列文章的第三篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 如果你感兴趣的任务已经得到充分研究,很可能评估数据集已经存在了。 ...AI 技术文章# 自动评估1年前02230
基于开放模型的推理时计算缩放过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴...AI 技术文章1年前02030
自动评估基准 | 技巧与提示技巧与提示 这是 自动评估基准 系列文章的第四篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 数据污染管理 通常我们会假设在互联网上公开可用的数据集是存在数据污染问...AI 技术文章# 自动评估1年前01720
自动评估基准 | 设计你的自动评估任务设计你的自动评估任务 这是 自动评估基准 系列文章的第二篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 选择数据集 做评估时,你可以选择现有的数据集 (参考 一些评...AI 技术文章# 自动评估1年前01900
自动评估基准 | 基础概念基础概念 这是 自动评估基准 系列文章的第一篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 注:本文内容与我写的 通用评估博客 存在部分重叠 什么是自动评估基准? ...AI 技术文章# 自动评估1年前01770