ggml 简介ggml 是一个用 C 和 C++ 编写、专注于 Transformer 架构模型推理的机器学习库。该项目完全开源,处于活跃的开发阶段,开发社区也在不断壮大。ggml 和 PyTorch、Tensor...AI 技术文章# ggml# Hugging Face1年前02070
TGI 多-LoRA: 部署一次,搞定 30 个模型的推理服务你是否已厌倦管理多个 AI 模型所带来的复杂性和高成本? 那么, 如果你可以部署一次就搞定 30 个模型推理服务会如何? 在当今的 ML 世界中,哪些希望充分发挥其数据的价值的组织可能最终会进入一个...AI 技术文章# LoRA# TGI1年前02110
XetHub 加入 Hugging Face!我们非常激动地正式宣布,Hugging Face 已收购 XetHub 🔥 XetHub 是一家位于西雅图的公司,由 Yucheng Low、Ajit Banerjee 和 Rajat Arya 创立...AI 技术文章# Hugging Face# XetHub2年前02320
NuminaMath 是如何荣膺首届 AIMO 进步奖的?今年,Numina 和 Hugging Face 合作角逐 AI 数学奥林匹克 (AI Math Olympiad,AIMO) 的首届进步奖。此次比赛旨在对开放 LLM 进行微调,以使其能解决高中难度...AI 技术文章# AIMO# NuminaMath2年前02120
SmolLM: 一个超快速、超高性能的小模型集合简介 本文将介绍 SmolLM。它集合了一系列最尖端的 135M、360M、1.7B 参数量的小模型,这些模型均在一个全新的高质量数据集上训练。本文将介绍数据整理、模型评测、使用方法等相关过程。 引言...AI 技术文章# SmoILM2年前02020
Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope在发布 Gemma 2 一个月后,Google 扩展了其 Gemma 模型系列,新增了以下几款: Gemma 2 2B - 这是 Gemma 2 的 2.6B 参数版本,是设备端使用的理想选择。 Sh...AI 技术文章# Gemma 2# Gemma Scope# ShieldGemma2年前02080
在 Hub 上使用 Presidio 进行自动 PII 检测实验我们在 Hugging Face Hub 上托管的机器学习 (ML) 数据集中发现了一个引人关注的现象: 包含个人未经记录的私密信息。这一现象为机器学习从业者带来了一些特殊挑战。 在本篇博客中,我们将...AI 技术文章# Hugging Face Hub# PII检测# Presidio2年前02390
Llama 3.1 – 405B、70B 和 8B 的多语言与长上下文能力解析Llama 3.1 发布了!今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作,确保在 Hugging Face 生态系统...AI 技术文章# 405B# 70B# 8B2年前03680
在英特尔 Gaudi 2 上加速蛋白质语言模型 ProtST引言 蛋白质语言模型 (Protein Language Models, PLM) 已成为蛋白质结构与功能预测及设计的有力工具。在 2023 年国际机器学习会议 (ICML) 上,MILA 和英特尔实...AI 技术文章# Gaudi 2# ProtST# 蛋白质语言模型2年前02270
为视觉语言多模态模型进行偏好优化为视觉语言多模态模型进行偏好优化 训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本,因为这些算...AI 技术文章# DPO# TRL# VLM2年前02340