使用 🧨 Diffusers 实现 ControlNet 高速推理自从 Stable Diffusion 风靡全球以来,人们一直在寻求如何更好地控制生成过程的方法。ControlNet 提供了一个简单的迁移学习方法,能够允许用户在很大程度上自定义生成过程。通过 Co...AI 技术文章# ControlNet# Diffusers2年前04700
全世界 LoRA 训练脚本,联合起来!来自社区的 SD-XL Dreambooth LoRA 微调最佳实践指南 太长不看版 我们把 Replicate 在 SDXL Cog 训练器中使用的枢轴微调 (Pivotal Tuning) 技术与...AI 技术文章# LoRA# SDXL# Stable Diffusion XL2年前04620
AI 制作 3D 素材|基于 AI 5 天创建一个农场游戏,第 3 天欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 A...AI 技术文章# 3D# Game2年前04560
通用图像分割任务: 使用 Mask2Former 和 OneFormer本文介绍两个领先的图像分割神经网络模型: Mask2Former 和 OneFormer。相关模型已经在 🤗 Transformers 提供。🤗 Transformers 是一个开源库,提供了很多便捷...AI 技术文章# Mask2Former# OneFormer3年前04540
使用 Transformers 进行图分类在之前的 博文 中,我们探讨了图机器学习的一些理论知识。这一篇我们将探索如何使用 Transformers 库进行图分类。(你也可以从 此处 下载演示 notebook,跟着一起做!) 目前,Tran...AI 技术文章# Transformers3年前04520
使用 BLIP-2 零样本“图生文”本文将介绍来自 Salesforce 研究院的 BLIP-2 模型,它支持一整套最先进的视觉语言模型,且已集成入 🤗 Transformers。 我们将向你展示如何将其用于图像字幕生成、有提示图像字幕...AI 技术文章# BLIP-2# BOS# LAVIS2年前04510
Quanto: PyTorch 量化工具包量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活,以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减...AI 技术文章# PyTorch# PyTorch 量化工具包# Quanto2年前04490
如何在 Unity 游戏中集成 AI 语音识别?简介 语音识别是一项将语音转换为文本的技术,想象一下它如何在游戏中发挥作用?发出命令操纵控制面板或者游戏角色、直接与 NPC 对话、提升交互性等等,都有可能。本文将介绍如何使用 Hugging Fac...AI 技术文章# Unity# 语音识别2年前04490
AudioLDM 2,加速⚡️!AudioLDM 2 由刘濠赫等人在 AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining 一...AI 技术文章# AudioLDM 2# CLAP# Diffusers2年前04480
如何生成文本: 通过 Transformers 用不同的解码方法生成文本简介 近年来,随着以 OpenAI GPT2 模型 为代表的基于数百万网页数据训练的大型 Transformer 语言模型的兴起,开放域语言生成领域吸引了越来越多的关注。开放域中的条件语言生成效果令人...AI 技术文章# Transformers3年前04480