Google Colab 现已支持直接使用 🤗 transformers 库Google Colab,全称 Colaboratory,是 Google Research 团队开发的一款产品。在 Colab 中,任何人都可以通过浏览器编写和执行任意 Python 代码。它尤其适...AI 技术文章# Google Colab# transformer# Transformers2年前03890
Hugging Face 提供的推理 (Inference) 解决方案每天,开发人员和组织都在使用 Hugging Face 平台上托管的模型,将想法变成用作概念验证(proof-of-concept)的 demo,再将 demo 变成生产级的应用。 Transform...AI 技术文章# Inference2年前03890
为 Hugging Face 用户带来无服务器 GPU 推理服务今天,我们非常兴奋地宣布 部署到 Cloudflare Workers AI 功能正式上线,这是 Hugging Face Hub 平台上的一项新服务,它使得通过 Cloudflare 边缘数据中心部...AI 技术文章# Cloudflare Workers AI# GPU# Hugging Face2年前03880
深入理解 BigBird 的块稀疏注意力4## 引言 基于 transformer 的模型已被证明对很多 NLP 任务都非常有用。然而,$$O(n^2)$$ 的时间和内存复杂度 (其中 $$n$$ 是序列长度) 使得在长序列 ($n >...AI 技术文章# BERT# BigBird# Longformer2年前03870
混合专家模型 (MoE) 详解随着 Mixtral 8x7B (announcement, model card) 的推出,一种称为混合专家模型 (Mixed Expert Models,简称 MoEs) 的 Transforme...AI 技术文章# MoE# 混合专家模型2年前03850
Transformers.js:Web 上的最新机器学习技术我们的工程师,Transformers.js 作者Joshua Lochne在2023年11月18日在杭州举办 FEDAY 上带来了主题为「Transformers.js: State-of-the...AI 技术文章AI 视频教程# transformer# Transformers# Web2年前03850
Code Llama:Llama 2 学会写代码了!引言 Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相...AI 技术文章# Llama 22年前03840
扩展说明: 指令微调 Llama 2这篇博客是一篇来自 Meta AI,关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集,有了它,我们则可以使用自己的指令来微调 Llama 2 基础模型。 目标是构建一个能够基于输入内容...AI 技术文章# Llama22年前03830
用于显著提高检索速度和降低成本的二进制和标量嵌入量化我们引入了嵌入量化的概念,并展示了它们对检索速度、内存使用、磁盘空间和成本的影响。我们将讨论理论上和实践中如何对嵌入进行量化,然后介绍一个 演示,展示了 4100 万维基百科文本的真实检索场景。 目录...AI 技术文章2年前03820
数据好合: Argilla 和 Hugging Face Spaces 携手赋能社区合力构建更好的数据集数据好合: Argilla 和 Hugging Face Spaces 携手赋能社区合力构建更好的数据集 最近,Argilla 和 Hugging Face 共同 推出 了 Data is Bette...AI 技术文章# 10kpromptsranked# Argilla# Hugging Face2年前03820