长程 Transformer 模型Tay 等人的 Efficient Transformers taxonomy from Efficient Transformers: a Survey 论文 本文由 Teven Le Scao、P...AI 技术文章# Hugging Face# transformer2年前04280
Hugging Face: 代码生成模型的预训练和微调和大家分享我们的机器学习工程师 Loubna Ben Allal 在 10 月上海 KubeCon 大会的主题演讲 题目是: 代码生成模型的预训练和微调 演讲介绍了构建和训练大型代码模型比如: Sta...AI 技术文章AI 视频教程# Hugging Face# 代码生成模型# 微调2年前03940
面向生产的 LLM 优化注意 : _本文同时也是 Transformers 的文档。_ 以 GPT3/4、Falcon 以及 LLama 为代表的大语言模型 (Large Language Model,LLM) 在处理以人为...AI 技术文章# Falcon# GPT3# GPT3/42年前03630
Hugging Face 分词器新增聊天模板属性一个幽灵,格式不正确的幽灵,在聊天模型中游荡! 太长不看版 现存的聊天模型使用的训练数据格式各各不同,我们需要用这些格式将对话转换为单个字符串并传给分词器。如果我们在微调或推理时使用的格式与模型训练时...AI 技术文章# Hugging Face# 分词# 聊天模板2年前03710
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型引言 扩散模型 (如 DALL-E 2、Stable Diffusion) 是一类文生图模型,在生成图像 (尤其是有照片级真实感的图像) 方面取得了广泛成功。然而,这些模型生成的图像可能并不总是符合人...AI 技术文章# DDPO# Stable Diffusion# TRL2年前03730
机器学习即代码的时代已经到来译者注: 到底是 AI 会吃掉软件还是软件会吃掉 AI?为了 job security 工程师应该把宝押在哪儿?这篇 2021 年的文章提供的一些视角似乎印证了它现在的流行,有点“运筹于帷幄之中,决胜...AI 技术文章# Kubeflow# ML# MLOps2年前03390
AudioLDM 2,加速⚡️!AudioLDM 2 由刘濠赫等人在 AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining 一...AI 技术文章# AudioLDM 2# CLAP# Diffusers2年前04520
在 SDXL 上用 T2I-Adapter 实现高效可控的文生图T2I-Adapter 是一种高效的即插即用模型,其能对冻结的预训练大型文生图模型提供额外引导。T2I-Adapter 将 T2I 模型中的内部知识与外部控制信号结合起来。我们可以根据不同的情况训练各...AI 技术文章# ControlLoRA# ControlNet# ControlNet-SDXL2年前03680
使用 FHE 实现加密大语言模型近来,大语言模型 (LLM) 已被证明是提高编程、内容生成、文本分析、网络搜索及远程学习等诸多领域生产力的可靠工具。 大语言模型对用户隐私的影响 尽管 LLM 很有吸引力,但如何保护好 输入给这些模型...AI 技术文章# FHE# Fully Homomorphic Encryption# GPT22年前03700
如何成功将 🤗 API 客户的 transformer 模型推理速度加快 100 倍🤗 Transformers 已成为世界各地数据科学家用以探索最先进 NLP 模型、构建新 NLP 模块的默认库。它拥有超过 5000 个预训练和微调的模型,支持 250 多种语言,任君取用。无论你使...AI 技术文章# transformer# 模型推理2年前03520