AI 技术文章 | 第2页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

AI 教程 AI 新闻资讯 AI 技术周刊 AI 活动竞赛 AI 模型排行榜

AI 绘画教程 AI 技术文章 AI 视频教程

排序

发布更新浏览点赞

nanoVLM: 最简洁、最轻量的纯 PyTorch 视觉-语言模型训练代码库

nanoVLM 是使用纯 PyTorch 训练你自己的视觉语言模型 (VLM) 的最简单方式。它是一个轻量级工具包，让你可以在免费的 Colab Notebook 上启动 VLM 训练。 ...

6个月前

010

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

🧭 TL;DR 今天，我们介绍了 SmolVLA，这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型，专为机器人领域设计，并且可以在消费级硬件上运行。仅使用开源社区...

AI 技术文章 # VLA # 机器人

6个月前

090

大模型评估排障指南 | 关于可复现性

这是大模型评估排障指南系列文章的第三篇，敬请关注系列文章: 关于推理关于 $\LaTeX$ 公式解析关于可复现性假设你读了一篇最近的新模型技术报告，然后心血来潮想要在本机复现他们的结果，却发...

AI 技术文章 # LLM # 大模型

7个月前

0290

大模型评估排障指南 | 关于 LaTeX 公式解析

这是大模型评估排障指南系列文章的第二篇，敬请关注系列文章: 关于推理关于 $\LaTeX$ 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为 $\LaTeX$ 的模型时经常会...

AI 技术文章 # LaTex公式 # LLM # 大模型

7个月前

0380

设计即合规: 开放AI生态中的用户数据治理实践

Hugging Face Hub 已成为 AI 协作的核心平台，托管了数万个模型、数据集以及交互式应用程序 (Space)。在开放生态系统中，用户知情同意的管理方式与那些更 "数据饥渴&q...

AI 技术文章 # AI

8个月前

0580

大模型评估排障指南 | 关于推理

这是大模型评估排障指南系列文章的第一篇，敬请关注系列文章: 关于推理关于 $\LaTeX$ 公式解析关于可复现性模型运行非常慢怎么办？调整 batch size 如果你想要评估结果完全可复...

AI 技术文章 # 大模型

8个月前

0560

让 LLM 来评判 | 技巧与提示

这是让 LLM 来评判系列文章的第六篇，敬请关注系列文章: 基础概念选择 LLM 评估模型设计你自己的评估 prompt 评估你的评估结果奖励模型相关内容技巧与提示 LLM 评估模型已知偏...

AI 技术文章 # LLM

8个月前

0880

Open R1 项目进展第三期

Open R1 项目进展第三期本次更新带来三大突破性进展: CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本，同时包含 C++ 和 Python ...

AI 技术文章 # CodeForces # CodeForces-CoTs # IOI

8个月前

01160

Open R1 项目进展第二期

我们启动 Open R1 项目已经两周了，这个项目是为了把 DeepSeek R1 缺失的部分补齐，特别是训练流程和合成数据。这篇文章里，我们很高兴跟大家分享一个大成果: OpenR1-Math...

AI 技术文章 # DeepSeek-R1 # Open-R1

9个月前

0980

Open R1 项目进展第一期

DeepSeek R1 发布已经两周了，而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程...

AI 技术文章 # DeepSeek-R1 # Open-R1

9个月前

01030

加载更多