AI 教程 | 第5页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

AI 教程 AI 新闻资讯 AI 技术周刊 AI 活动竞赛 AI 模型排行榜

AI 绘画教程 AI 技术文章 AI 视频教程

排序

发布更新浏览点赞

在 Transformers 中使用约束波束搜索引导文本生成

引言本文假设读者已经熟悉文本生成领域波束搜索相关的背景知识，具体可参见博文如何生成文本: 通过 Transformers 用不同的解码方法生成文本。与普通的波束搜索不同，约束波束搜索允许我们控...

AI 技术文章 # Transformers

3年前

04470

使用 LCM LoRA 4 步完成 SDXL 推理

LCM 模型通过将原始模型蒸馏为另一个需要更少步数 (4 到 8 步，而不是原来的 25 到 50 步) 的版本以减少用 Stable Diffusion (或 SDXL) 生成图像所需的步数。蒸馏...

AI 技术文章 # LCM # LoRA # SDXL

2年前

04420

在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs

我们很高兴正式发布 trl 与 peft 的集成，使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调！在这篇文章中，我们解释了为什么这是现有微调方法的有竞争力的替代方案。请注意， ...

AI 技术文章 # LLM # RLHF

3年前

04420

为大语言模型建立红队对抗

在巨量文本数据下训练的大语言模型非常擅长生成现实文本。但是，这些模型通常会显现出一些不良行为像泄露个人信息 (比如社会保险号) 和生成错误信息，偏置，仇恨或有毒内容。举个例子，众所周知，GPT3 的早...

AI 技术文章 # LLM

3年前

04400

基于 AI 进行游戏开发：5 天！创建一个农场游戏！第 1 部分

欢迎使用 AI 进行游戏开发！在本系列中，我们将使用各种 AI 工具，在 5 天内创建一个功能完备的农场游戏。到本系列结束时，你将了解到如何将多种 AI 工具整合到游戏开发流程中。本系列文章将向你展...

AI 技术文章 # Game

3年前

04400

使用 🤗 Transformers 进行概率时间序列预测

介绍时间序列预测是一个重要的科学和商业问题，因此最近通过使用基于深度学习而不是经典方法的模型也涌现出诸多创新。ARIMA 等经典方法与新颖的深度学习方法之间的一个重要区别如下。概率预测通常，经...

AI 技术文章 # Transformers

3年前

04400

AI ⚔️ 大战 AI ⚔️ ，一个深度强化学习多智能体竞赛系统

小伙伴们快看过来！这是一款全新打造的 ⚔️ AI vs. AI ⚔️——深度强化学习多智能体竞赛系统。这个工具托管在 Space 上，允许我们创建多智能体竞赛。它包含三个元素: 一个带匹配算法的 S...

AI 技术文章 # Game

3年前

04390

CPU 推理 | 使用英特尔 Sapphire Rapids 加速 PyTorch Transformers

在最近的一篇文章中，我们介绍了代号为 Sapphire Rapids 的第四代英特尔至强 CPU 及其新的先进矩阵扩展 (AMX) 指令集。通过使用 Amazon EC2 上的 Sapphire ...

AI 技术文章 # PyTorch # Sapphire Rapids # Transformers

3年前

04370

在 NVIDIA DGX Cloud 上使用 H100 GPU 轻松训练模型

今天，我们正式宣布推出 DGX 云端训练 (Train on DGX Cloud) 服务，这是 Hugging Face Hub 上针对企业 Hub 组织的全新服务。通过在 DGX 云端训练，你可以...

AI 技术文章 # DGX Cloud # H100 GPU # NVIDIA

2年前

04350

辅助生成: 低延迟文本生成的新方向

大型语言模型如今风靡一时，许多公司投入大量资源来扩展它们规模并解锁新功能。然而，作为注意力持续时间不断缩短的人类，我们并不喜欢大模型缓慢的响应时间。由于延迟对于良好的用户体验至关重要，人们通常使用较小...

AI 技术文章 # TXT

2年前

04340

加载更多