LLM | 第3页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

排序

发布更新浏览点赞

重磅｜ Falcon 180B 正式在 Hugging Face Hub 上发布！

引言我们很高兴地宣布由 Technology Innovation Institute (TII) 训练的开源大模型 Falcon 180B 登陆 Hugging Face！ Falcon 180B...

2年前

03650

面向生产的 LLM 优化

注意 : _本文同时也是 Transformers 的文档。_ 以 GPT3/4、Falcon 以及 LLama 为代表的大语言模型 (Large Language Model，LLM) 在处理以人为...

AI 技术文章 # Falcon # GPT3 # GPT3/4

2年前

03630

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

众所周知，LLM 规模庞大，如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。我们之前撰写的 LLM.int8 博文展示了我们是如何将 LLM.int8 论文中的技术通过 bitsand...

AI 技术文章 # 4 比特 # 4 比特量化 # bitsandbytes

2年前

03470

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地...

AI 技术文章 # Llama3 # LLM # 大语言模型

2年前

03460

来自 AI Secure 实验室的 LLM 安全排行榜简介

近来，LLM 已深入人心，大有燎原之势。但在我们将其应用于千行百业之前，理解其在不同场景下的安全性和潜在风险显得尤为重要。为此，美国白宫发布了关于安全、可靠、可信的人工智能的行政命令; 欧盟人工智能法...

AI 技术文章 # AI 安全 # Alpaca # DecodingTrust

2年前

03400

对 LLM 工具使用进行统一

我们为 LLM 确立了一个跨模型的统一工具调用 API。有了它，你就可以在不同的模型上使用相同的代码，在 Mistral、Cohere、NousResearch 或 Llama 等模型间自由切换，而...

AI 技术文章 # LLM

1年前

02610

LAVE: 使用 LLM 对 Docmatix 进行零样本 VQA 评估 – 我们还需要微调吗？

在开发 Docmatix 时，我们发现经其微调的 Florence-2 在 DocVQA 任务上表现出色，但在基准测试中得分仍比较低。为了提高基准测试得分，我们必须在 DocVQA 数据集上进一步对模...

AI 技术文章 # Docmatix # LAVE # LLM

1年前

02090

让 LLM 来评判 | 基础概念

基础概念这是让 LLM 来评判系列文章的第一篇，敬请关注系列文章: 基础概念选择 LLM 评估模型设计你自己的评估 prompt 评估你的评估结果奖励模型相关内容技巧与提示什么是评估模...

AI 技术文章 # LLM

11个月前

01920

让 LLM 来评判 | 选择 LLM 评估模型

AI 技术文章 # LLM # 评估模型

11个月前

01850

通用辅助生成: 使用任意辅助模型加速解码

太长不看版: 许多 LLM (如 gemma-2-9b 、 Mixtral-8x22B-Instruct-v0.1 等) 苦于缺乏对应小模型，而无法适用辅助生成方案。本文，我们将介绍由英特尔研究院...

AI 技术文章 # LLM

1年前

01830

加载更多