AIHunt | 几百个AI工具导航,国内外AI工具导航大全
  • 首页
  • AI 新闻
  • AI 教程
    • AI 技术文章
    • AI 视频教程
    • AI 绘画教程
      • Stable Diffusion 教程
  • AI 周刊
  • AI 书籍
    • 大语言模型
    • 深度学习
  • AI 账号
  • AI 活动竞赛
  • 开源大语言模型
    • 开源大模型
    • 大模型代码
    • 预训练
    • 指令调优
    • 对齐调优
    • 模型评测
  • 提交AI工具
      最新文章AI 教程
      SmolLM: 一个超快速、超高性能的小模型集合

      SmolLM: 一个超快速、超高性能的小模型集合

      简介 本文将介绍 SmolLM。它集合了一系列最尖端的 135M、360M、1.7B 参数量的小模型,这些模型均在一个全新的高质量数据集上训练。本文将介绍数据整理、模型评测、使用方法等相关过程。 引言...
      AI 技术文章# SmoILM
      1年前
      01950
      Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope

      Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope

      在发布 Gemma 2 一个月后,Google 扩展了其 Gemma 模型系列,新增了以下几款: Gemma 2 2B - 这是 Gemma 2 的 2.6B 参数版本,是设备端使用的理想选择。 Sh...
      AI 技术文章# Gemma 2# Gemma Scope# ShieldGemma
      1年前
      02080
      在 Hub 上使用 Presidio 进行自动 PII 检测实验

      在 Hub 上使用 Presidio 进行自动 PII 检测实验

      我们在 Hugging Face Hub 上托管的机器学习 (ML) 数据集中发现了一个引人关注的现象: 包含个人未经记录的私密信息。这一现象为机器学习从业者带来了一些特殊挑战。 在本篇博客中,我们将...
      AI 技术文章# Hugging Face Hub# PII检测# Presidio
      1年前
      02380
      Llama 3.1 – 405B、70B 和 8B 的多语言与长上下文能力解析

      Llama 3.1 – 405B、70B 和 8B 的多语言与长上下文能力解析

      Llama 3.1 发布了!今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作,确保在 Hugging Face 生态系统...
      AI 技术文章# 405B# 70B# 8B
      1年前
      03660
      在英特尔 Gaudi 2 上加速蛋白质语言模型 ProtST

      在英特尔 Gaudi 2 上加速蛋白质语言模型 ProtST

      引言 蛋白质语言模型 (Protein Language Models, PLM) 已成为蛋白质结构与功能预测及设计的有力工具。在 2023 年国际机器学习会议 (ICML) 上,MILA 和英特尔实...
      AI 技术文章# Gaudi 2# ProtST# 蛋白质语言模型
      1年前
      02220
      为视觉语言多模态模型进行偏好优化

      为视觉语言多模态模型进行偏好优化

      为视觉语言多模态模型进行偏好优化 训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本,因为这些算...
      AI 技术文章# DPO# TRL# VLM
      1年前
      02340
      微调 Florence-2 – 微软的尖端视觉语言模型

      微调 Florence-2 – 微软的尖端视觉语言模型

      Florence-2 是微软于 2024 年 6 月发布的一个基础视觉语言模型。该模型极具吸引力,因为它尺寸很小 (0.2B 及 0.7B) 且在各种计算机视觉和视觉语言任务上表现出色。 Floren...
      AI 技术文章# Florence2# 微调# 视觉语言模型
      1年前
      02480
      GAIA: 一个严苛的智能体基准

      GAIA: 一个严苛的智能体基准

      简要概括 经过一些实验,我们对 Transformers 智能体构建智能体系统的性能印象深刻,因此我们想看看它有多好!我们使用一个 用库构建的代码智能体 在 GAIA 基准上进行测试,这可以说是最困难...
      AI 技术文章# Agent# GAIA# 智能体
      1年前
      03090
      Cosmopedia: 如何为预训练构建大规模合成数据集

      Cosmopedia: 如何为预训练构建大规模合成数据集

      本文概述了我们在生成含数十亿词元的合成数据集以复现 Phi-1.5 过程中所遇到的挑战及其解决方案,由此最终创建了 Cosmopedia 合成数据集。合成数据已成为机器学习社区的 C 位话题,其题中之...
      AI 技术文章# Cosmopedia# 数据集
      1年前
      02470
      BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

      BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

      HumanEval 是一个用于评估大型语言模型 (LLM) 在代码生成任务中的参考基准,因为它使得对紧凑的函数级代码片段的评估变得容易。然而,关于其在评估 LLM 编程能力方面的有效性越来越多的担忧...
      AI 技术文章# BigCodeBench# HumanEval
      1年前
      02610
      加载更多
      AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      收录了国内外的众多 AI工具,包括AI写作工具、AI图像生成和处理、AI视频制作、AI音频转录、AI辅助编程、AI音乐生成、AI绘画设计、AI对话聊天等AI工具,以及AI学习开发的常用网站、教程、开源框架、开源模型和数据集等
      • 提交AI工具
      • 申请友链
      • 广告合作
      关注微信公众号AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      关注微信公众号
      订阅 Telegram 频道AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      订阅 Telegram 频道


        
      网址
      网址文章软件书籍