基于英特尔® Gaudi® 2 AI 加速器的文本生成流水线随着生成式人工智能 (Generative AI,GenAI) 革命的全面推进,使用 Llama 2 等开源 transformer 模型生成文本已成为新风尚。人工智能爱好者及开发人员正在寻求利用此类...AI 技术文章# DeepSpeed# Gaudi# GenAI2年前03730
英特尔 Gaudi 加速辅助生成随着模型规模的增长,生成式人工智能的实现需要大量的推理资源。这不仅增加了每次生成的成本,而且还增加了用于满足此类请求的功耗。因此,文本生成的推理优化对于降低延迟、基础设施成本以及功耗都至关重要,其可以...AI 技术文章# Gaudi# 辅助生成2年前02380