LLM | 第2页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

排序

发布更新浏览点赞

LAVE: 使用 LLM 对 Docmatix 进行零样本 VQA 评估 – 我们还需要微调吗？

在开发 Docmatix 时，我们发现经其微调的 Florence-2 在 DocVQA 任务上表现出色，但在基准测试中得分仍比较低。为了提高基准测试得分，我们必须在 DocVQA 数据集上进一步对模...

1年前

02090

更难、更好、更快、更强：LLM Leaderboard v2 现已发布

摘要评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点，当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务：论文或营销发布中的得分缺...

AI 技术文章 # Leaderboard # LLM

1年前

04080

欢迎 Llama 3：Meta 的新一代开源大语言模型

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地...

AI 技术文章 # Llama3 # LLM # 大语言模型

2年前

03460

来自 AI Secure 实验室的 LLM 安全排行榜简介

近来，LLM 已深入人心，大有燎原之势。但在我们将其应用于千行百业之前，理解其在不同场景下的安全性和潜在风险显得尤为重要。为此，美国白宫发布了关于安全、可靠、可信的人工智能的行政命令; 欧盟人工智能法...

AI 技术文章 # AI 安全 # Alpaca # DecodingTrust

2年前

03400

合成数据: 利用开源技术节约资金、时间和减少碳排放

简单概括你应该使用自己的模型，还是使用 LLM API？创建你自己的模型可以让你完全控制，但需要数据收集、训练和部署方面的专业知识。LLM API 使用起来更简单，但会将数据发送给第三方，并对提供商...

AI 技术文章 # Hugging Face Hub # LLM # RoBERTa

2年前

04870

企业场景排行榜简介: 现实世界用例排行榜

企业场景排行榜简介: 现实世界用例排行榜今天，Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板构建的、新的企业场景排...

AI 技术文章 # EnDEX # Hugging Face # Leaderboard

2年前

03700

使用 Hugging Face 微调 Gemma 模型

我们最近宣布了，来自 Google Deepmind 开放权重的语言模型 Gemma现已通过 Hugging Face 面向更广泛的开源社区开放。该模型提供了两个规模的版本：20 亿和 70 亿参数...

AI 技术文章 # Cloud TPU # Colab # DeepMind

2年前

05570

欢迎 Gemma: Google 最新推出开源大语言模型

今天，Google 发布了一系列最新的开放式大型语言模型 —— Gemma！Google 正在加强其对开源人工智能的支持，我们也非常有幸能够帮助全力支持这次发布，并与 Hugging Face 生态完...

AI 技术文章 # Gemma # Google # LLM

2年前

05220

开源大语言模型作为 LangChain 智能体

概要开源大型语言模型 (LLMs) 现已达到一种性能水平，使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中超过了 GPT-3.5，并且通过微调，其性能可以轻易的得...

AI 技术文章 # LangChain # LLM # 大语言模型

2年前

04080

句子嵌入: 交叉编码和重排序

这个系列目的是揭开嵌入的神秘面纱，并展示如何在你的项目中使用它们。第一篇博客介绍了如何使用和扩展开源嵌入模型，选择现有的模型，当前的评价方法，以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解...

AI 技术文章 # Bi-encoder # Cross Encoder # LLM

2年前

04210

加载更多