大模型评估排障指南 | 关于可复现性这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发...AI 技术文章# LLM# 大模型7个月前0290
大模型评估排障指南 | 关于 LaTeX 公式解析这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 解析 LaTeX 很难。这个问题在评估输出为 $\LaTeX$ 的模型时经常会...AI 技术文章# LaTex公式# LLM# 大模型7个月前0390
让 LLM 来评判 | 技巧与提示这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏...AI 技术文章# LLM8个月前0880
让 LLM 来评判 | 设计你自己的评估 prompt设计你自己的评估 prompt 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技...AI 技术文章# LLM# prompt10个月前01370
让 LLM 来评判 | 奖励模型相关内容奖励模型相关内容 这是 让 LLM 来评判 系列文章的第五篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么...AI 技术文章# LLM10个月前01250
让 LLM 来评判 | 评估你的评估结果评估你的评估结果 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 在生...AI 技术文章# LLM10个月前01200
让 LLM 来评判 | 选择 LLM 评估模型基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模...AI 技术文章# LLM# 评估模型11个月前01840
让 LLM 来评判 | 基础概念基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模...AI 技术文章# LLM11个月前01920
通用辅助生成: 使用任意辅助模型加速解码太长不看版: 许多 LLM (如 gemma-2-9b 、 Mixtral-8x22B-Instruct-v0.1 等) 苦于缺乏对应小模型,而无法适用 辅助生成 方案。本文,我们将介绍由英特尔研究院...AI 技术文章# LLM1年前01830
对 LLM 工具使用进行统一我们为 LLM 确立了一个跨模型的 统一工具调用 API。有了它,你就可以在不同的模型上使用相同的代码,在 Mistral、Cohere、NousResearch 或 Llama 等模型间自由切换,而...AI 技术文章# LLM1年前02610