AI 技术文章 | 第20页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

AI 教程 AI 新闻资讯 AI 技术周刊 AI 活动竞赛 AI 模型排行榜

AI 绘画教程 AI 技术文章 AI 视频教程

排序

发布更新浏览点赞

解码器 | 基于 Transformers 的编码器-解码器模型

基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史，更多背景知识，建议读者阅读由 Sebastion...

AI 技术文章 # Transformers

3年前

05260

编码器 – 解码器 | 基于 Transformers 的编码器 – 解码器模型

3年前

04970

背景 | 基于 Transformers 的编码器 – 解码器模型

!pip install transformers==4.2.1 !pip install sentencepiece==0.1.95 Vaswani 等人在其名作 Attention is all ...

AI 技术文章 # Hugging Face # Transformers

3年前

05340

RWKV – transformer 与 RNN 的强强联合

在 NLP (Natural Language Processing, 自然语言处理) 领域，ChatGPT 和其他的聊天机器人应用引起了极大的关注。每个社区为构建自己的应用，也都在持续地寻求强大、可...

AI 技术文章 # Hugging Face # RNN # Transformers

3年前

04970

如何使用 Megatron-LM 训练语言模型

在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上，并使用许多优化技术以实现稳定高效的训练。Hugging Face 🤗 Accelerate 的创...

AI 技术文章 # Hugging Face # LLM # Train

2年前

05120

珠联璧合：PS 2023 如何安装 SD 插件

如何在 PS 里部署 SD 插件，提高工作效率

AI 技术文章 SD 教程 # AI教程 # AI绘画 # AI绘画教程

2年前

01,0260

越小越好: Q8-Chat，在英特尔至强 CPU 上体验高效的生成式 AI

大语言模型 (LLM) 正在席卷整个机器学习世界。得益于其 transformer 架构，LLM 拥有从大量非结构化数据 (如文本、图像、视频或音频) 中学习的不可思议的能力。它们在多种任务类型上...

AI 技术文章 # Chat # Hugging Face

3年前

04890

辅助生成: 低延迟文本生成的新方向

大型语言模型如今风靡一时，许多公司投入大量资源来扩展它们规模并解锁新功能。然而，作为注意力持续时间不断缩短的人类，我们并不喜欢大模型缓慢的响应时间。由于延迟对于良好的用户体验至关重要，人们通常使用较小...

AI 技术文章 # TXT

2年前

04340

辅助生成：低延迟文本生成的新方向

AI 技术文章 # GPT # Hugging Face # Transformers

2年前

04790

StarCoder: 最先进的代码大模型

关于 BigCode BigCode 是由 Hugging Face 和 ServiceNow 共同领导的开放式科学合作项目，该项目致力于开发负责任的代码大模型。 StarCoder 简介 StarC...

AI 技术文章 # LLM

2年前

04050

加载更多