使用 DDPO 在 TRL 中微调 Stable Diffusion 模型引言 扩散模型 (如 DALL-E 2、Stable Diffusion) 是一类文生图模型,在生成图像 (尤其是有照片级真实感的图像) 方面取得了广泛成功。然而,这些模型生成的图像可能并不总是符合人...AI 技术文章# DDPO# Stable Diffusion# TRL2年前03720
企业场景排行榜简介: 现实世界用例排行榜企业场景排行榜简介: 现实世界用例排行榜 今天,Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板 构建的、新的 企业场景排...AI 技术文章# EnDEX# Hugging Face# Leaderboard2年前03700
Hugging Face 分词器新增聊天模板属性一个幽灵,格式不正确的幽灵,在聊天模型中游荡! 太长不看版 现存的聊天模型使用的训练数据格式各各不同,我们需要用这些格式将对话转换为单个字符串并传给分词器。如果我们在微调或推理时使用的格式与模型训练时...AI 技术文章# Hugging Face# 分词# 聊天模板2年前03700
IDEFICS 简介: 最先进视觉语言模型的开源复现我们很高兴发布 IDEFICS ( Image-aware Decoder Enhanced à la Flamingo with Ininterleaved Cross-attention S ) ...AI 技术文章# IDEFICS2年前03700
欢迎 Mixtral – 当前 Hugging Face 上最先进的 MoE 模型最近,Mistral 发布了一个激动人心的大语言模型: Mixtral 8x7b,该模型把开放模型的性能带到了一个新高度,并在许多基准测试上表现优于 GPT-3.5。我们很高兴能够在 Hugging ...AI 技术文章# GPTQ# Mixtral# MoE 模型2年前03680
视觉语言模型详解视觉语言模型可以同时从图像和文本中学习,因此可用于视觉问答、图像描述等多种任务。本文,我们将带大家一览视觉语言模型领域: 作个概述、了解其工作原理、搞清楚如何找到真命天“模”、如何对其进行推理以及如何...AI 技术文章# 视觉语言模型2年前03670
使用 PPO 算法进行 RLHF 的 N 步实现细节当下,RLHF/ChatGPT 已经变成了一个非常流行的话题。我们正在致力于更多有关 RLHF 的研究,这篇博客尝试复现 OpenAI 在 2019 年开源的原始 RLHF 代码库,其仓库位置位于 o...AI 技术文章# PPO# PPO算法# RLHF2年前03670
Llama 3.1 – 405B、70B 和 8B 的多语言与长上下文能力解析Llama 3.1 发布了!今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作,确保在 Hugging Face 生态系统...AI 技术文章# 405B# 70B# 8B1年前03660
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析SetFitABSA 是一种可以有效从文本中检测方面级情感的技术。 方面级情感分析 (Aspect-Based Sentiment Analysis,ABSA) 是一种检测文本中特定方面的情感的任务...AI 技术文章# SetFit# SetFitABSA2年前03650
在 SDXL 上用 T2I-Adapter 实现高效可控的文生图T2I-Adapter 是一种高效的即插即用模型,其能对冻结的预训练大型文生图模型提供额外引导。T2I-Adapter 将 T2I 模型中的内部知识与外部控制信号结合起来。我们可以根据不同的情况训练各...AI 技术文章# ControlLoRA# ControlNet# ControlNet-SDXL2年前03650