AIHunt | 几百个AI工具导航,国内外AI工具导航大全
  • 首页
  • AI 新闻
  • AI 教程
    • AI 技术文章
    • AI 视频教程
    • AI 绘画教程
      • Stable Diffusion 教程
  • AI 周刊
  • AI 书籍
    • 大语言模型
    • 深度学习
  • AI 账号
  • AI 活动竞赛
  • 开源大语言模型
    • 开源大模型
    • 大模型代码
    • 预训练
    • 指令调优
    • 对齐调优
    • 模型评测
  • 提交AI工具
      最新文章AI 教程
      使用 PyTorch 完全分片数据并行技术加速大模型训练

      使用 PyTorch 完全分片数据并行技术加速大模型训练

      本文,我们将了解如何基于 PyTorch 最新的 完全分片数据并行 (Fully Sharded Data Parallel,FSDP) 功能用 Accelerate 库来训练大模型。 动机 🤗 随着...
      AI 技术文章# Accelerate# Accelerate 库# FSDP
      2年前
      03770
      Google Colab 现已支持直接使用 🤗 transformers 库

      Google Colab 现已支持直接使用 🤗 transformers 库

      Google Colab,全称 Colaboratory,是 Google Research 团队开发的一款产品。在 Colab 中,任何人都可以通过浏览器编写和执行任意 Python 代码。它尤其适...
      AI 技术文章# Google Colab# transformer# Transformers
      2年前
      03900
      【开源 LLM 基准测试】全新大语言模型基准测试论文:GAIA 与 GPQA 概览

      【开源 LLM 基准测试】全新大语言模型基准测试论文:GAIA 与 GPQA 概览

      探索两篇刚出炉的重磅 LLM 基准测试论文: GAIA:这是一项全方位的人工智能助手评测(顺便一提,视频作者与其他杰出人士合著) GPQA:一个高级别的谷歌可证明问答评测(作者团队同样令人敬佩) 当两...
      AI 技术文章AI 视频教程# GAIA# GPQA# LLM
      2年前
      01,0970
      深入理解 BigBird 的块稀疏注意力

      深入理解 BigBird 的块稀疏注意力

      4## 引言 基于 transformer 的模型已被证明对很多 NLP 任务都非常有用。然而,$$O(n^2)$$ 的时间和内存复杂度 (其中 $$n$$ 是序列长度) 使得在长序列 ($n >...
      AI 技术文章# BERT# BigBird# Longformer
      2年前
      03870
      Transformers.js:Web 上的最新机器学习技术

      Transformers.js:Web 上的最新机器学习技术

      我们的工程师,Transformers.js 作者Joshua Lochne在2023年11月18日在杭州举办 FEDAY 上带来了主题为「Transformers.js: State-of-the...
      AI 技术文章AI 视频教程# transformer# Transformers# Web
      2年前
      03900
      携手 MLCommons,制定有效且值得信赖的 AI 安全基准

      携手 MLCommons,制定有效且值得信赖的 AI 安全基准

      作者 / 技术与社会部 Anoop Sinha 以及 Google Research、Responsible AI 和以人为本技术团队 Marian Croak 标准基准是衡量重要产品质量的公认方法...
      AI 技术文章# AI# AI 安全# DICES
      2年前
      03500
      保护 ML 供应链,提高 AI 安全透明度

      保护 ML 供应链,提高 AI 安全透明度

      作者 / Google 开源安全团队 (GOSST): Mihai Maruseac、Sarah Meiklejohn、Mark Lodato 消费者和企业几乎每天都会接触到新的 AI 创新和应用。安...
      AI 技术文章# AI# AI 安全# ML
      2年前
      04700
      使用 LCM LoRA 4 步完成 SDXL 推理

      使用 LCM LoRA 4 步完成 SDXL 推理

      LCM 模型 通过将原始模型蒸馏为另一个需要更少步数 (4 到 8 步,而不是原来的 25 到 50 步) 的版本以减少用 Stable Diffusion (或 SDXL) 生成图像所需的步数。蒸馏...
      AI 技术文章# LCM# LoRA# SDXL
      2年前
      04480
      【论文快读】大型语言模型中的角色扮演者 (Role playing in Large Language Model)

      【论文快读】大型语言模型中的角色扮演者 (Role playing in Large Language Model)

      这篇论文简要介绍了“大型语言模型中的角色扮演”,该论文讨论了如何将大型语言模型视为角色扮演者,以更好地理解它们的运作方式。作者强调了大型语言模型与人类语言理解的不同之处,指出它们通过预测下一个最可能出...
      AI 技术文章AI 视频教程# LLM# 大语言模型
      2年前
      05640
      【中文科普】🤗 Hugging Face 与 Intel 共同构建生成式 AI

      【中文科普】🤗 Hugging Face 与 Intel 共同构建生成式 AI

      我们中国地区负责人/ 高级工程师 王铁震受 Intel OpenVINO的邀请 与英特尔AI软件工程师杨亦诚一起做了一场关于「人工智能普惠化」的讲座 对Hugging Face是如何通过开源来推进人工...
      AI 技术文章AI 视频教程# Hugging Face# Intel# 生成式 AI
      2年前
      03540
      加载更多
      AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      收录了国内外的众多 AI工具,包括AI写作工具、AI图像生成和处理、AI视频制作、AI音频转录、AI辅助编程、AI音乐生成、AI绘画设计、AI对话聊天等AI工具,以及AI学习开发的常用网站、教程、开源框架、开源模型和数据集等
      • 提交AI工具
      • 申请友链
      • 广告合作
      关注微信公众号AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      关注微信公众号
      订阅 Telegram 频道AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      订阅 Telegram 频道


        
      网址
      网址文章软件书籍