利用 🤗 Optimum Intel 和 fastRAG 在 CPU 上优化文本嵌入嵌入模型在很多场合都有广泛应用,如检索、重排、聚类以及分类。近年来,研究界在嵌入模型领域取得了很大的进展,这些进展大大提高了基于语义的应用的竞争力。BGE、GTE 以及 E5 等模型在 MTEB 基准...AI 技术文章# BGE# E5# fastRAG2年前04170
开源代码生成模型 StarCoder 2 全新上线!BigCode 正式推出 StarCoder2 —— 一系列新一代的开放源代码大语言模型 (LLMs)。这些模型全部基于一个全新、大规模且高品质的代码数据集 The Stack v2 进行训练。我们不...AI 技术文章# BigCode# LLMs# NVIDIA2年前03760
在 NVIDIA DGX Cloud 上使用 H100 GPU 轻松训练模型今天,我们正式宣布推出 DGX 云端训练 (Train on DGX Cloud) 服务,这是 Hugging Face Hub 上针对企业 Hub 组织的全新服务。 通过在 DGX 云端训练,你可以...AI 技术文章# DGX Cloud# H100 GPU# NVIDIA2年前04350
数据好合: Argilla 和 Hugging Face Spaces 携手赋能社区合力构建更好的数据集数据好合: Argilla 和 Hugging Face Spaces 携手赋能社区合力构建更好的数据集 最近,Argilla 和 Hugging Face 共同 推出 了 Data is Bette...AI 技术文章# 10kpromptsranked# Argilla# Hugging Face2年前03820
TTS 擂台: 文本转语音模型的自由搏击场对文本转语音 (text-to-speech, TTS) 模型的质量进行自动度量非常困难。虽然评估声音的自然度和语调变化对人类来说是一项微不足道的任务,但对人工智能来说要困难得多。为了推进这一领域的发...AI 技术文章# ChatBot# ElevenLabs# LMSys2年前03740
基于英特尔® Gaudi® 2 AI 加速器的文本生成流水线随着生成式人工智能 (Generative AI,GenAI) 革命的全面推进,使用 Llama 2 等开源 transformer 模型生成文本已成为新风尚。人工智能爱好者及开发人员正在寻求利用此类...AI 技术文章# DeepSpeed# Gaudi# GenAI2年前03730
来自 AI Secure 实验室的 LLM 安全排行榜简介近来,LLM 已深入人心,大有燎原之势。但在我们将其应用于千行百业之前,理解其在不同场景下的安全性和潜在风险显得尤为重要。为此,美国白宫发布了关于安全、可靠、可信的人工智能的行政命令; 欧盟人工智能法...AI 技术文章# AI 安全# Alpaca# DecodingTrust2年前03400
俄罗斯套娃 (Matryoshka) 嵌入模型概述在这篇博客中,我们将向你介绍俄罗斯套娃嵌入的概念,并解释为什么它们很有用。我们将讨论这些模型在理论上是如何训练的,以及你如何使用 Sentence Transformers 来训练它们。 除此之外,我...AI 技术文章# Matryoshka# MultiNLI# Sentence Transformers2年前03930
合成数据: 利用开源技术节约资金、时间和减少碳排放简单概括 你应该使用自己的模型,还是使用 LLM API?创建你自己的模型可以让你完全控制,但需要数据收集、训练和部署方面的专业知识。LLM API 使用起来更简单,但会将数据发送给第三方,并对提供商...AI 技术文章# Hugging Face Hub# LLM# RoBERTa2年前04870