保护 ML 供应链,提高 AI 安全透明度作者 / Google 开源安全团队 (GOSST): Mihai Maruseac、Sarah Meiklejohn、Mark Lodato 消费者和企业几乎每天都会接触到新的 AI 创新和应用。安...AI 技术文章# AI# AI 安全# ML2年前04700
使用 MakerSuite 的调整功能快速生成高质量模型作者: AI 开发者关系团队 Joe Fernandez,以及 AI 开发者营销 人工智能 (AI) 是我们正在积极探索的前沿科技领域。尽管很多人都对使用 AI 感兴趣,但我们意识到大多数开发者可能尚...AI 技术文章# AI# MakerSuite2年前03470
TensorFlow 2.12 和 Keras 2.12 新功能简介发布人: TensorFlow 和 Keras 团队 TensorFlow 2.12 和 Keras 2.12 现已发布!此版本的亮点包括全新的 Keras 模型保存和导出格式、keras.utils...AI 技术文章# Keras# TensorFlow# TensorFlow Core2年前03390
使用 TensorFlow 进行深度学习,轻松处理视频数据发布人: Shilpa Kancharla 视频数据包含丰富的信息,其结构比图像数据的结构更庞大、更复杂。使用深度学习以节省内存的方式对视频进行分类,可以帮助我们更好地理解数据内容。我们在 tenso...AI 技术文章# TensorFlow2年前03370
使用 PyTorch 完全分片数据并行技术加速大模型训练本文,我们将了解如何基于 PyTorch 最新的 完全分片数据并行 (Fully Sharded Data Parallel,FSDP) 功能用 Accelerate 库来训练大模型。 动机 🤗 随着...AI 技术文章# Accelerate# Accelerate 库# FSDP2年前03730
Google Colab 现已支持直接使用 🤗 transformers 库Google Colab,全称 Colaboratory,是 Google Research 团队开发的一款产品。在 Colab 中,任何人都可以通过浏览器编写和执行任意 Python 代码。它尤其适...AI 技术文章# Google Colab# transformer# Transformers2年前03890
深入理解 BigBird 的块稀疏注意力4## 引言 基于 transformer 的模型已被证明对很多 NLP 任务都非常有用。然而,$$O(n^2)$$ 的时间和内存复杂度 (其中 $$n$$ 是序列长度) 使得在长序列 ($n >...AI 技术文章# BERT# BigBird# Longformer2年前03870
使用 LCM LoRA 4 步完成 SDXL 推理LCM 模型 通过将原始模型蒸馏为另一个需要更少步数 (4 到 8 步,而不是原来的 25 到 50 步) 的版本以减少用 Stable Diffusion (或 SDXL) 生成图像所需的步数。蒸馏...AI 技术文章# LCM# LoRA# SDXL2年前04420
使用 PPO 算法进行 RLHF 的 N 步实现细节当下,RLHF/ChatGPT 已经变成了一个非常流行的话题。我们正在致力于更多有关 RLHF 的研究,这篇博客尝试复现 OpenAI 在 2019 年开源的原始 RLHF 代码库,其仓库位置位于 o...AI 技术文章# PPO# PPO算法# RLHF2年前03680
个人编程助手: 训练你自己的编码助手在编程和软件开发这个不断演变的领域中,对效率和生产力的追求催生了许多卓越的创新。其中一个显著的创新就是代码生成模型的出现,如 Codex、StarCoder 和 Code Llama。这些模型在生成类...AI 技术文章# Code Llama# Codex# StarCoder2年前03740