nanoVLM: 最简洁、最轻量的纯 PyTorch 视觉-语言模型训练代码库nanoVLM 是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在 免费的 Colab Notebook 上启动 VLM 训练。 ...AI 技术文章# nanoVLM# PyTorch# VLM6个月前010
SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案🧭 TL;DR 今天,我们介绍了 SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 仅使用开源社区...AI 技术文章# VLA# 机器人6个月前090
大模型评估排障指南 | 关于可复现性这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发...AI 技术文章# LLM# 大模型7个月前0290
大模型评估排障指南 | 关于 LaTeX 公式解析这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 解析 LaTeX 很难。这个问题在评估输出为 $\LaTeX$ 的模型时经常会...AI 技术文章# LaTex公式# LLM# 大模型7个月前0380
设计即合规: 开放AI生态中的用户数据治理实践Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 "数据饥渴&q...AI 技术文章# AI8个月前0580
大模型评估排障指南 | 关于推理这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章: 关于推理 关于 $\LaTeX$ 公式解析 关于可复现性 模型运行非常慢怎么办? 调整 batch size 如果你想要评估结果完全可复...AI 技术文章# 大模型8个月前0560
让 LLM 来评判 | 技巧与提示这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏...AI 技术文章# LLM8个月前0880
Open R1 项目进展第三期Open R1 项目进展第三期 本次更新带来三大突破性进展: CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python ...AI 技术文章# CodeForces# CodeForces-CoTs# IOI8个月前01160
Open R1 项目进展第二期我们启动 Open R1 项目 已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。 这篇文章里,我们很高兴跟大家分享一个大成果: OpenR1-Math...AI 技术文章# DeepSeek-R1# Open-R19个月前0980
Open R1 项目进展第一期DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程...AI 技术文章# DeepSeek-R1# Open-R19个月前01030