开源大语言模型作为 LangChain 智能体概要 开源大型语言模型 (LLMs) 现已达到一种性能水平,使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中 超过了 GPT-3.5,并且通过微调,其性能可以轻易的得...AI 技术文章# LangChain# LLM# 大语言模型2年前04080
使用 🤗 Optimum Intel 在英特尔至强上加速 StarCoder: Q8/Q4 及投机解码引言 近来,随着 BigCode 的 StarCoder 以及 Meta AI 的 Code Llama 等诸多先进模型的发布,代码生成模型变得炙手可热。同时,业界也涌现出了大量的致力于优化大语言模型...AI 技术文章# Intel# Optimum# Q8/Q42年前03400
LLaMA 2 – 你所需要的一切资源摘录 关于 LLaMA 2 的全部资源,如何去测试、训练并部署它。 LLaMA 2 是一个由 Meta 开发的大型语言模型,是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging...AI 技术文章# Llama 22年前03520
扩展说明: 指令微调 Llama 2这篇博客是一篇来自 Meta AI,关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集,有了它,我们则可以使用自己的指令来微调 Llama 2 基础模型。 目标是构建一个能够基于输入内容...AI 技术文章# Llama22年前03830
句子嵌入: 交叉编码和重排序这个系列目的是揭开嵌入的神秘面纱,并展示如何在你的项目中使用它们。第一篇博客 介绍了如何使用和扩展开源嵌入模型,选择现有的模型,当前的评价方法,以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解...AI 技术文章# Bi-encoder# Cross Encoder# LLM2年前04210
全世界 LoRA 训练脚本,联合起来!来自社区的 SD-XL Dreambooth LoRA 微调最佳实践指南 太长不看版 我们把 Replicate 在 SDXL Cog 训练器中使用的枢轴微调 (Pivotal Tuning) 技术与...AI 技术文章# LoRA# SDXL# Stable Diffusion XL2年前04620
使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理本文展示了如何使用 1760 亿 (176B) 参数的 BLOOM 模型 生成文本时如何获得超快的词吞吐 (per token throughput)。 因为在使用 bf16 (bfloat16) 权...AI 技术文章# Accelerate# BLOOM# DeepSpeed2年前04270
使用 ChatGPT 启发游戏创意:基于 AI 5 天创建一个农场游戏,第 2 天欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用各种 AI 工具,在 5 天内创建一个功能完备的农场游戏。到本系列结束时,你将了解到如何将多种 AI 工具整合到游戏开发流程中。本系列文章将向你展...AI 技术文章# Game2年前04240
AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 A...AI 技术文章# 3D# Game2年前04560
使用 Informer 进行多元概率时间序列预测介绍 几个月前,我们介绍了 Time Series Transformer,它是 Vanilla Transformer (Vaswani et al., 2017) 应用于预测的模型,并展示了单变量...AI 技术文章# Informer# Longformer# transformer2年前05310