大模型评估排障指南 | 关于可复现性这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发...AI 技术文章# LLM# 大模型7个月前0290
大模型评估排障指南 | 关于 LaTeX 公式解析这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 解析 LaTeX 很难。这个问题在评估输出为 $\LaTeX$ 的模型时经常会...AI 技术文章# LaTex公式# LLM# 大模型7个月前0380
大模型评估排障指南 | 关于推理这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 模型运行非常慢怎么办? 调整 batch size 如果你想要评估结果完全可复...AI 技术文章# 大模型8个月前0560
使用 PyTorch 完全分片数据并行技术加速大模型训练本文,我们将了解如何基于 PyTorch 最新的 完全分片数据并行 (Fully Sharded Data Parallel,FSDP) 功能用 Accelerate 库来训练大模型。 动机 🤗 随着...AI 技术文章# Accelerate# Accelerate 库# FSDP2年前03730