在 Transformers 中使用对比搜索生成可媲美人类水平的文本 🤗1. 引言 自然语言生成 (即文本生成) 是自然语言处理 (NLP) 的核心任务之一。本文将介绍神经网络文本生成领域当前最先进的解码方法 对比搜索 (Contrastive Search)。提出该方法...AI 技术文章# Transformers3年前04100
授权调用: 介绍 Transformers 智能体 2.0简要概述 我们推出了 Transformers 智能体 2.0! ⇒ 🎁 在现有智能体类型的基础上,我们新增了两种能够 根据历史观察解决复杂任务的智能体。 ⇒ 💡 我们致力于让代码 清晰、模块化,并确...AI 技术文章# Transformers# 智能体2年前04090
在 Transformers 中使用对比搜索生成可媲美人类水平的文本🤗1. 引言 自然语言生成 (即文本生成) 是自然语言处理 (NLP) 的核心任务之一。本文将介绍神经网络文本生成领域当前最先进的解码方法 对比搜索 (Contrastive Search)。提出该方法...AI 技术文章# Transformers3年前04090
更难、更好、更快、更强:LLM Leaderboard v2 现已发布摘要 评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点,当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务:论文或营销发布中的得分缺...AI 技术文章# Leaderboard# LLM1年前04080
开源大语言模型作为 LangChain 智能体概要 开源大型语言模型 (LLMs) 现已达到一种性能水平,使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中 超过了 GPT-3.5,并且通过微调,其性能可以轻易的得...AI 技术文章# LangChain# LLM# 大语言模型2年前04080
小红书 x Hugging Face 邀请你一起晒「创意新春照」不藏了,近期全网爆火的AI 写真项目 InstantID,正是来自小红书社区技术创作发布团队。 为了迎接龙年春节的到来,我们的InstantID全新推出「Spring Festival」新春风格!并与...AI 技术文章# HuggingFace# InstantID# 小红书2年前04070
随机 Transformer在这篇博客中,我们将通过一个端到端的示例来讲解 Transformer 模型中的数学原理。我们的目标是对模型的工作原理有一个良好的理解。为了使内容易于理解,我们会进行大量简化。我们将减少模型的维度,以...AI 技术文章# transformer2年前04070
如何在 🤗 Space 上托管 Unity 游戏你知道吗?Hugging Face Space 可以托管自己开发的 Unity 游戏!惊不惊喜,意不意外?来了解一下吧! Hugging Face Space 是一个能够以简单的方式来构建、托管和分享...AI 技术文章# Game# Unity3年前04070
从 PyTorch DDP 到 Accelerate 到 Trainer,轻松掌握分布式训练概述 本教程假定你已经对于 PyToch 训练一个简单模型有一定的基础理解。本教程将展示使用 3 种封装层级不同的方法调用 DDP (DistributedDataParallel) 进程,在多个 G...AI 技术文章# Accelerate# PyTorch# Trainer3年前04060
千亿参数开源大模型 BLOOM 背后的技术假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,“一朝看尽长安花”似乎近在眼前 …… 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM 的训练或许对你有帮助...AI 技术文章# BLOOM# LLM3年前04060