技术教程 | 第9页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

最新文章 AI 教程

SmolLM: 一个超快速、超高性能的小模型集合

简介本文将介绍 SmolLM。它集合了一系列最尖端的 135M、360M、1.7B 参数量的小模型，这些模型均在一个全新的高质量数据集上训练。本文将介绍数据整理、模型评测、使用方法等相关过程。引言...

AI 技术文章 # SmoILM

2年前

02020

Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope

在发布 Gemma 2 一个月后，Google 扩展了其 Gemma 模型系列，新增了以下几款： Gemma 2 2B - 这是 Gemma 2 的 2.6B 参数版本，是设备端使用的理想选择。 Sh...

AI 技术文章 # Gemma 2 # Gemma Scope # ShieldGemma

2年前

02080

在 Hub 上使用 Presidio 进行自动 PII 检测实验

我们在 Hugging Face Hub 上托管的机器学习 (ML) 数据集中发现了一个引人关注的现象: 包含个人未经记录的私密信息。这一现象为机器学习从业者带来了一些特殊挑战。在本篇博客中，我们将...

AI 技术文章 # Hugging Face Hub # PII检测 # Presidio

2年前

02390

Llama 3.1 – 405B、70B 和 8B 的多语言与长上下文能力解析

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统...

AI 技术文章 # 405B # 70B # 8B

2年前

03680

在英特尔 Gaudi 2 上加速蛋白质语言模型 ProtST

引言蛋白质语言模型 (Protein Language Models, PLM) 已成为蛋白质结构与功能预测及设计的有力工具。在 2023 年国际机器学习会议 (ICML) 上，MILA 和英特尔实...

AI 技术文章 # Gaudi 2 # ProtST # 蛋白质语言模型

2年前

02270

为视觉语言多模态模型进行偏好优化

为视觉语言多模态模型进行偏好优化训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本，因为这些算...

AI 技术文章 # DPO # TRL # VLM

2年前

02340

微调 Florence-2 – 微软的尖端视觉语言模型

Florence-2 是微软于 2024 年 6 月发布的一个基础视觉语言模型。该模型极具吸引力，因为它尺寸很小 (0.2B 及 0.7B) 且在各种计算机视觉和视觉语言任务上表现出色。 Floren...

AI 技术文章 # Florence2 # 微调 # 视觉语言模型

2年前

02480

GAIA: 一个严苛的智能体基准

简要概括经过一些实验，我们对 Transformers 智能体构建智能体系统的性能印象深刻，因此我们想看看它有多好！我们使用一个用库构建的代码智能体在 GAIA 基准上进行测试，这可以说是最困难...

AI 技术文章 # Agent # GAIA # 智能体

2年前

03090

Hugging Face 全球政策负责人首次参加WAIC 2024 前沿 AI 安全和治理论坛

Hugging Face 全球政策负责人艾琳-索莱曼（ Irene Solaiman ）将参加7月5日在上海举办的WAIC-前沿人工智能安全和治理论坛，并在现场进行主旨演讲和参加圆桌讨论。具体时间信...

AI 活动竞赛 # Hugging Face

2年前

02500

Cosmopedia: 如何为预训练构建大规模合成数据集

本文概述了我们在生成含数十亿词元的合成数据集以复现 Phi-1.5 过程中所遇到的挑战及其解决方案，由此最终创建了 Cosmopedia 合成数据集。合成数据已成为机器学习社区的 C 位话题，其题中之...

AI 技术文章 # Cosmopedia # 数据集

2年前

02470

加载更多