AI 技术文章 | 第14页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

AI 教程 AI 新闻资讯 AI 技术周刊 AI 活动竞赛 AI 模型排行榜

AI 绘画教程 AI 技术文章 AI 视频教程

排序

发布更新浏览点赞

开源大语言模型作为 LangChain 智能体

概要开源大型语言模型 (LLMs) 现已达到一种性能水平，使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中超过了 GPT-3.5，并且通过微调，其性能可以轻易的得...

2年前

04080

使用 🤗 Optimum Intel 在英特尔至强上加速 StarCoder: Q8/Q4 及投机解码

引言近来，随着 BigCode 的 StarCoder 以及 Meta AI 的 Code Llama 等诸多先进模型的发布，代码生成模型变得炙手可热。同时，业界也涌现出了大量的致力于优化大语言模型...

AI 技术文章 # Intel # Optimum # Q8/Q4

2年前

03400

LLaMA 2 – 你所需要的一切资源

摘录关于 LLaMA 2 的全部资源，如何去测试、训练并部署它。 LLaMA 2 是一个由 Meta 开发的大型语言模型，是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging...

AI 技术文章 # Llama 2

2年前

03520

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自 Meta AI，关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调 Llama 2 基础模型。目标是构建一个能够基于输入内容...

AI 技术文章 # Llama2

2年前

03830

句子嵌入: 交叉编码和重排序

这个系列目的是揭开嵌入的神秘面纱，并展示如何在你的项目中使用它们。第一篇博客介绍了如何使用和扩展开源嵌入模型，选择现有的模型，当前的评价方法，以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解...

AI 技术文章 # Bi-encoder # Cross Encoder # LLM

2年前

04210

全世界 LoRA 训练脚本，联合起来!

来自社区的 SD-XL Dreambooth LoRA 微调最佳实践指南太长不看版我们把 Replicate 在 SDXL Cog 训练器中使用的枢轴微调 (Pivotal Tuning) 技术与...

AI 技术文章 # LoRA # SDXL # Stable Diffusion XL

2年前

04620

使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理

本文展示了如何使用 1760 亿 (176B) 参数的 BLOOM 模型生成文本时如何获得超快的词吞吐 (per token throughput)。因为在使用 bf16 (bfloat16) 权...

AI 技术文章 # Accelerate # BLOOM # DeepSpeed

2年前

04270

使用 ChatGPT 启发游戏创意：基于 AI 5 天创建一个农场游戏，第 2 天

欢迎使用 AI 进行游戏开发! 在本系列中，我们将使用各种 AI 工具，在 5 天内创建一个功能完备的农场游戏。到本系列结束时，你将了解到如何将多种 AI 工具整合到游戏开发流程中。本系列文章将向你展...

AI 技术文章 # Game

2年前

04240

AI 制作 3D 素材｜基于 AI 5 天创建一个农场游戏，第 3 天

欢迎使用 AI 进行游戏开发！在本系列中，我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时，您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 A...

AI 技术文章 # 3D # Game

2年前

04560

使用 Informer 进行多元概率时间序列预测

介绍几个月前，我们介绍了 Time Series Transformer，它是 Vanilla Transformer (Vaswani et al., 2017) 应用于预测的模型，并展示了单变量...

AI 技术文章 # Informer # Longformer # transformer

2年前

05310

加载更多