AIHunt | 几百个AI工具导航,国内外AI工具导航大全
  • 首页
  • AI 新闻
  • AI 教程
    • AI 技术文章
    • AI 视频教程
    • AI 绘画教程
      • Stable Diffusion 教程
  • AI 周刊
  • AI 书籍
    • 大语言模型
    • 深度学习
  • AI 账号
  • AI 活动竞赛
  • 开源大语言模型
    • 开源大模型
    • 大模型代码
    • 预训练
    • 指令调优
    • 对齐调优
    • 模型评测
  • 提交AI工具

      LLM

      共 36 篇文章
      排序
      发布更新浏览点赞
      开放 LLM 排行榜: 深入研究 DROP

      开放 LLM 排行榜: 深入研究 DROP

      最近,开放 LLM 排行榜 迎来了 3 个新成员: Winogrande、GSM8k 以及 DROP,它们都使用了 EleutherAI Harness 的原始实现。一眼望去,我们就会发现 DROP ...
      AI 技术文章# DROP# LLM
      2年前
      14100
      Hugging Face 年度回顾:2023,开源大模型之年

      Hugging Face 年度回顾:2023,开源大模型之年

      在 2023 年,大型语言模型(Large Language Models,简称 LLMs)受到了公众的广泛关注,许多人对这些模型的本质及其功能有了基本的了解。是否开源的议题同样引起了广泛的讨论。在 ...
      AI 技术文章# Hugging Face# LLM
      2年前
      03720
      【开源 LLM 基准测试】全新大语言模型基准测试论文:GAIA 与 GPQA 概览

      【开源 LLM 基准测试】全新大语言模型基准测试论文:GAIA 与 GPQA 概览

      探索两篇刚出炉的重磅 LLM 基准测试论文: GAIA:这是一项全方位的人工智能助手评测(顺便一提,视频作者与其他杰出人士合著) GPQA:一个高级别的谷歌可证明问答评测(作者团队同样令人敬佩) 当两...
      AI 技术文章AI 视频教程# GAIA# GPQA# LLM
      2年前
      01,0850
      【论文快读】大型语言模型中的角色扮演者 (Role playing in Large Language Model)

      【论文快读】大型语言模型中的角色扮演者 (Role playing in Large Language Model)

      这篇论文简要介绍了“大型语言模型中的角色扮演”,该论文讨论了如何将大型语言模型视为角色扮演者,以更好地理解它们的运作方式。作者强调了大型语言模型与人类语言理解的不同之处,指出它们通过预测下一个最可能出...
      AI 技术文章AI 视频教程# LLM# 大语言模型
      2年前
      05620
      用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

      用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

      众所周知,LLM 规模庞大,如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。我们之前撰写的 LLM.int8 博文 展示了我们是如何将 LLM.int8 论文 中的技术通过 bitsand...
      AI 技术文章# 4 比特# 4 比特量化# bitsandbytes
      2年前
      03470
      面向生产的 LLM 优化

      面向生产的 LLM 优化

      注意 : _本文同时也是 Transformers 的文档。_ 以 GPT3/4、Falcon 以及 LLama 为代表的大语言模型 (Large Language Model,LLM) 在处理以人为...
      AI 技术文章# Falcon# GPT3# GPT3/4
      2年前
      03630
      使用 FHE 实现加密大语言模型

      使用 FHE 实现加密大语言模型

      近来,大语言模型 (LLM) 已被证明是提高编程、内容生成、文本分析、网络搜索及远程学习等诸多领域生产力的可靠工具。 大语言模型对用户隐私的影响 尽管 LLM 很有吸引力,但如何保护好 输入给这些模型...
      AI 技术文章# FHE# Fully Homomorphic Encryption# GPT2
      2年前
      03650
      重磅| Falcon 180B 正式在 Hugging Face Hub 上发布!

      重磅| Falcon 180B 正式在 Hugging Face Hub 上发布!

      引言 我们很高兴地宣布由 Technology Innovation Institute (TII) 训练的开源大模型 Falcon 180B 登陆 Hugging Face! Falcon 180B...
      AI 技术文章# Falcon 180B# Hugging Face Hub# LLM
      2年前
      03650
      如何使用 Megatron-LM 训练语言模型

      如何使用 Megatron-LM 训练语言模型

      在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上,并使用许多优化技术以实现稳定高效的训练。Hugging Face 🤗 Accelerate 的创...
      AI 技术文章# Hugging Face# LLM# Train
      2年前
      05120
      StarCoder: 最先进的代码大模型

      StarCoder: 最先进的代码大模型

      关于 BigCode BigCode 是由 Hugging Face 和 ServiceNow 共同领导的开放式科学合作项目,该项目致力于开发负责任的代码大模型。 StarCoder 简介 StarC...
      AI 技术文章# LLM
      2年前
      04050
      加载更多
      AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      收录了国内外的众多 AI工具,包括AI写作工具、AI图像生成和处理、AI视频制作、AI音频转录、AI辅助编程、AI音乐生成、AI绘画设计、AI对话聊天等AI工具,以及AI学习开发的常用网站、教程、开源框架、开源模型和数据集等
      • 提交AI工具
      • 申请友链
      • 广告合作
      关注微信公众号AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      关注微信公众号
      订阅 Telegram 频道AIHunt | 几百个AI工具导航,国内外AI工具导航大全
      订阅 Telegram 频道


        
      网址
      网址文章软件书籍