QLoRA

共 2 篇文章

排序

发布更新浏览点赞

使用 Hugging Face 微调 Gemma 模型

使用 Hugging Face 微调 Gemma 模型

我们最近宣布了，来自 Google Deepmind 开放权重的语言模型 Gemma现已通过 Hugging Face 面向更广泛的开源社区开放。该模型提供了两个规模的版本：20 亿和 70 亿参数...

AI 技术文章 # Cloud TPU # Colab # DeepMind

2年前

05580

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

众所周知，LLM 规模庞大，如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。我们之前撰写的 LLM.int8 博文展示了我们是如何将 LLM.int8 论文中的技术通过 bitsand...

AI 技术文章 # 4 比特 # 4 比特量化 # bitsandbytes

2年前

03560