技术教程 | 第9页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

最新文章 AI 教程

微调 Florence-2 – 微软的尖端视觉语言模型

Florence-2 是微软于 2024 年 6 月发布的一个基础视觉语言模型。该模型极具吸引力，因为它尺寸很小 (0.2B 及 0.7B) 且在各种计算机视觉和视觉语言任务上表现出色。 Floren...

AI 技术文章 # Florence2 # 微调 # 视觉语言模型

2年前

02480

GAIA: 一个严苛的智能体基准

简要概括经过一些实验，我们对 Transformers 智能体构建智能体系统的性能印象深刻，因此我们想看看它有多好！我们使用一个用库构建的代码智能体在 GAIA 基准上进行测试，这可以说是最困难...

AI 技术文章 # Agent # GAIA # 智能体

2年前

03090

Cosmopedia: 如何为预训练构建大规模合成数据集

本文概述了我们在生成含数十亿词元的合成数据集以复现 Phi-1.5 过程中所遇到的挑战及其解决方案，由此最终创建了 Cosmopedia 合成数据集。合成数据已成为机器学习社区的 C 位话题，其题中之...

AI 技术文章 # Cosmopedia # 数据集

2年前

02470

BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

HumanEval 是一个用于评估大型语言模型 (LLM) 在代码生成任务中的参考基准，因为它使得对紧凑的函数级代码片段的评估变得容易。然而，关于其在评估 LLM 编程能力方面的有效性越来越多的担忧...

AI 技术文章 # BigCodeBench # HumanEval

2年前

02650

Google 发布最新开放大语言模型 Gemma 2，现已登陆 Hugging Face Hub

Google 发布了最新的开放大语言模型 Gemma 2，我们非常高兴与 Google 合作，确保其在 Hugging Face 生态系统中的最佳集成。你可以在 Hub 上找到 4 个开源模型（2 个...

AI 技术文章 # Gemma 2

2年前

02560

Hugging Face Accelerate 两个后端的故事：FSDP 与 DeepSpeed

社区中有两个流行的零冗余优化器（Zero Redundancy Optimizer，ZeRO）算法实现，一个来自 DeepSpeed，另一个来自 PyTorch。Hugging Face Acce...

AI 技术文章 # DeepSpeed # FDSP

2年前

02770

更难、更好、更快、更强：LLM Leaderboard v2 现已发布

摘要评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点，当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务：论文或营销发布中的得分缺...

AI 技术文章 # Leaderboard # LLM

2年前

04110

英特尔 Gaudi 加速辅助生成

随着模型规模的增长，生成式人工智能的实现需要大量的推理资源。这不仅增加了每次生成的成本，而且还增加了用于满足此类请求的功耗。因此，文本生成的推理优化对于降低延迟、基础设施成本以及功耗都至关重要，其可以...

AI 技术文章 # Gaudi # 辅助生成

2年前

02380

TGI 基准测试

本文主要探讨 TGI 的小兄弟 - TGI 基准测试工具。它能帮助我们超越简单的吞吐量指标，对 TGI 进行更全面的性能剖析，以更好地了解如何根据实际需求对服务进行调优并按需作出最佳的权衡及决策。如果...

AI 技术文章 # 基准测试 # 文本生成

2年前

02640

高斯喷溅｜Hugging Face 3D 机器学习课

🤗 3D 机器学习课程上线🎉 在本课程中，你将学习到：当前 3D 机器学习的总体情况近期发展的重要性如何自己动手制作生成式 3D 演示课程当前有 4 个短视频。由 Hugging Face 机...

AI 视频教程 # 3D # Hugging Face # 高斯喷溅

2年前

02580

加载更多