自动评估基准 | 基础概念

自动评估基准 | 基础概念

基础概念 这是 自动评估基准 系列文章的第一篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 注:本文内容与我写的 通用评估博客 存在部分重叠 什么是自动评估基准? ...
12个月前
01770
介绍 GGUF-my-LoRA

介绍 GGUF-my-LoRA

随着 llama.cpp 对 LoRA 支持的重构,现在可以将任意 PEFT LoRA 适配器转换为 GGUF,并与 GGUF 基础模型一起加载运行。 为简化流程,我们新增了一个名为 GGUF-my...
1年前
01750
自动评估基准 | 技巧与提示

自动评估基准 | 技巧与提示

技巧与提示 这是 自动评估基准 系列文章的第四篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 数据污染管理 通常我们会假设在互联网上公开可用的数据集是存在数据污染问...
12个月前
01720
人工评估 | 人工标注员

人工评估 | 人工标注员

人工标注员 这是 人工评估 系列文章的第二篇《人工标注员》,全系列包括: 基础概念 人工标注员 技巧与提示 推荐阅读 这篇综述 的第三章,介绍了许多数据标注质量管理的实践经验。如果你追求的是生产级的质...
1年前
01520
设计位置编码

设计位置编码

Gall 定律 \ 一个有效的复杂系统通常是从一个有效的简单系统演化而来的 \ —— John Gall 本文将带你一步步探究 Transformer 模型中先进的位置编码技术。我们将通过迭代改进编码...
1年前
01440