优化故事- BLOOM 模型推理经过“九九八十一难”,大模型终于炼成。下一步就是架设服务,准备开门营业了。真这么简单?恐怕未必!行百里者半九十,推理优化又是新的雄关漫道。如何进行延迟优化?如何进行成本优化 (别忘了 OpenAI 8...AI 技术文章# BLOOM3年前04140
使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理本文展示了如何使用 1760 亿 (176B) 参数的 BLOOM 模型 生成文本时如何获得超快的词吞吐 (per token throughput)。 因为在使用 bf16 (bfloat16) 权...AI 技术文章# Accelerate# BLOOM# DeepSpeed2年前04270
千亿参数开源大模型 BLOOM 背后的技术假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,“一朝看尽长安花”似乎近在眼前 …… 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM 的训练或许对你有帮助...AI 技术文章# BLOOM# LLM3年前04060