让 LLM 来评判 | 设计你自己的评估 prompt设计你自己的评估 prompt 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技...AI 技术文章# LLM# prompt11个月前01370
人工评估 | 基础概念基础概念 这是 人工评估 系列文章的第一篇《基础概念》,全系列包括: 基础概念 人工标注员 技巧与提示 什么是人工评估? 人工评估是指让人类评价模型输出回答的好坏。 本文讨论的都是后验评估,即模型已经...AI 技术文章# prompt# 人工评估# 数据集1年前02020