使用 SpeechT5 进行语音合成、识别和更多功能我们很高兴地宣布,SpeechT5 现在可用于 🤗 Transformers (一个开源库,提供最前沿的机器学习模型实现的开源库)。 SpeechT5 最初见于微软亚洲研究院的这篇论文 SpeechT...AI 技术文章# SpeechT5# Transformers# TTS2年前04050
如何使用 Megatron-LM 训练语言模型在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上,并使用许多优化技术以实现稳定高效的训练。Hugging Face 🤗 Accelerate 的创...AI 技术文章# Hugging Face# LLM# Train2年前05120
Kakao Brain 的开源 ViT、ALIGN 和 COYO 文字最近 Kakao Brain 在 Hugging Face 发布了一个全新的开源图像文本数据集 COYO,包含 7 亿对图像和文本,并训练了两个新的视觉语言模型 ViT 和 ALIGN ViT 和 A...AI 技术文章# ALIGN# COYO# Datasets2年前04030
随机 Transformer在这篇博客中,我们将通过一个端到端的示例来讲解 Transformer 模型中的数学原理。我们的目标是对模型的工作原理有一个良好的理解。为了使内容易于理解,我们会进行大量简化。我们将减少模型的维度,以...AI 技术文章# transformer2年前04070
最新 Hugging Face 强化学习课程(中文版)来啦!人工智能中最引人入胜的话题莫过于深度强化学习 (Deep Reinforcement Learning) 了,我们在 2022 年 12 月 5 日开启了《深度强化学习课程 v2.0》的课程学习,有来...AI 技术文章# Hugging Face# 强化学习# 深度强化学习2年前04841
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析SetFitABSA 是一种可以有效从文本中检测方面级情感的技术。 方面级情感分析 (Aspect-Based Sentiment Analysis,ABSA) 是一种检测文本中特定方面的情感的任务...AI 技术文章# SetFit# SetFitABSA2年前03650
给科研人的 ML 开源发布工具包什么是开源发布工具包? 恭喜你的论文成功发表,这是一个巨大的成就!你的研究成果将为学界做出贡献。 其实除了发表论文之外,你还可以通过发布研究的其他部分,如代码、数据集、模型等,来增加研究的可见度和采用...AI 技术文章# ML# 工具包2年前03810
开放 LLM 排行榜: 深入研究 DROP最近,开放 LLM 排行榜 迎来了 3 个新成员: Winogrande、GSM8k 以及 DROP,它们都使用了 EleutherAI Harness 的原始实现。一眼望去,我们就会发现 DROP ...AI 技术文章# DROP# LLM2年前14100
Optimum + ONNX Runtime—更容易、更快地训练你的 Hugging Face 模型介绍 基于语言、视觉和语音的 Transformer 模型越来越大,以支持终端用户复杂的多模态用例。增加模型大小直接影响训练这些模型所需的资源,并随着模型大小的增加而扩展它们。Hugging Face...AI 技术文章# ONNX Runtime# Optimum2年前04120
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模...AI 技术文章# Whisper# 推理加速2年前03410