全世界 LoRA 训练脚本,联合起来!来自社区的 SD-XL Dreambooth LoRA 微调最佳实践指南 太长不看版 我们把 Replicate 在 SDXL Cog 训练器中使用的枢轴微调 (Pivotal Tuning) 技术与...AI 技术文章# LoRA# SDXL# Stable Diffusion XL2年前04620
使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理本文展示了如何使用 1760 亿 (176B) 参数的 BLOOM 模型 生成文本时如何获得超快的词吞吐 (per token throughput)。 因为在使用 bf16 (bfloat16) 权...AI 技术文章# Accelerate# BLOOM# DeepSpeed2年前04270
使用 ChatGPT 启发游戏创意:基于 AI 5 天创建一个农场游戏,第 2 天欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用各种 AI 工具,在 5 天内创建一个功能完备的农场游戏。到本系列结束时,你将了解到如何将多种 AI 工具整合到游戏开发流程中。本系列文章将向你展...AI 技术文章# Game2年前04240
AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 A...AI 技术文章# 3D# Game2年前04560
使用 Informer 进行多元概率时间序列预测介绍 几个月前,我们介绍了 Time Series Transformer,它是 Vanilla Transformer (Vaswani et al., 2017) 应用于预测的模型,并展示了单变量...AI 技术文章# Informer# Longformer# transformer2年前05310
辅助生成: 低延迟文本生成的新方向大型语言模型如今风靡一时,许多公司投入大量资源来扩展它们规模并解锁新功能。然而,作为注意力持续时间不断缩短的人类,我们并不喜欢大模型缓慢的响应时间。由于延迟对于良好的用户体验至关重要,人们通常使用较小...AI 技术文章# TXT2年前04340
使用 LoRA 进行 Stable Diffusion 的高效参数微调LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术,主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大...AI 技术文章# LoRA# Stable Diffusion2年前04740
基于 Hugging Face Datasets 和 Transformers 的图像相似性搜索通过本文,你将学习使用 🤗 Transformers 构建图像相似性搜索系统。找出查询图像和潜在候选图像之间的相似性是信息检索系统的一个重要用例,例如反向图像搜索 (即找出查询图像的原图)。此类系统试...AI 技术文章# Datasets# Transformers2年前04210
StarCoder: 最先进的代码大模型关于 BigCode BigCode 是由 Hugging Face 和 ServiceNow 共同领导的开放式科学合作项目,该项目致力于开发负责任的代码大模型。 StarCoder 简介 StarC...AI 技术文章# LLM2年前04050
从 GPT2 到 Stable Diffusion:Elixir 社区迎来了 Hugging Face上周,Elixir 社区向大家宣布,Elixir 语言社区新增从 GPT2 到 Stable Diffusion 的一系列神经网络模型。这些模型得以实现归功于 刚刚发布的 Bumblebee 库。Bu...AI 技术文章# Elixir# GPT2# Stable Diffusion2年前04210