大语言模型快速推理:在 Habana Gaudi2 上推理 BLOOMZ本文将展示如何在 Habana® Gaudi®2 上使用 🤗 Optimum Habana。Optimum Habana 是 Gaudi2 和 🤗 Transformers 库之间的桥梁。本文设计并实...AI 技术文章# BLOOMZ# LLM3年前04290
句子嵌入: 交叉编码和重排序这个系列目的是揭开嵌入的神秘面纱,并展示如何在你的项目中使用它们。第一篇博客 介绍了如何使用和扩展开源嵌入模型,选择现有的模型,当前的评价方法,以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解...AI 技术文章# Bi-encoder# Cross Encoder# LLM2年前04210
开放 LLM 排行榜: 深入研究 DROP最近,开放 LLM 排行榜 迎来了 3 个新成员: Winogrande、GSM8k 以及 DROP,它们都使用了 EleutherAI Harness 的原始实现。一眼望去,我们就会发现 DROP ...AI 技术文章# DROP# LLM2年前14100
更难、更好、更快、更强:LLM Leaderboard v2 现已发布摘要 评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点,当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务:论文或营销发布中的得分缺...AI 技术文章# Leaderboard# LLM1年前04080
开源大语言模型作为 LangChain 智能体概要 开源大型语言模型 (LLMs) 现已达到一种性能水平,使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中 超过了 GPT-3.5,并且通过微调,其性能可以轻易的得...AI 技术文章# LangChain# LLM# 大语言模型2年前04080
千亿参数开源大模型 BLOOM 背后的技术假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,“一朝看尽长安花”似乎近在眼前 …… 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM 的训练或许对你有帮助...AI 技术文章# BLOOM# LLM3年前04060
StarCoder: 最先进的代码大模型关于 BigCode BigCode 是由 Hugging Face 和 ServiceNow 共同领导的开放式科学合作项目,该项目致力于开发负责任的代码大模型。 StarCoder 简介 StarC...AI 技术文章# LLM2年前04050
Hugging Face 年度回顾:2023,开源大模型之年在 2023 年,大型语言模型(Large Language Models,简称 LLMs)受到了公众的广泛关注,许多人对这些模型的本质及其功能有了基本的了解。是否开源的议题同样引起了广泛的讨论。在 ...AI 技术文章# Hugging Face# LLM2年前03720
企业场景排行榜简介: 现实世界用例排行榜企业场景排行榜简介: 现实世界用例排行榜 今天,Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板 构建的、新的 企业场景排...AI 技术文章# EnDEX# Hugging Face# Leaderboard2年前03700
使用 FHE 实现加密大语言模型近来,大语言模型 (LLM) 已被证明是提高编程、内容生成、文本分析、网络搜索及远程学习等诸多领域生产力的可靠工具。 大语言模型对用户隐私的影响 尽管 LLM 很有吸引力,但如何保护好 输入给这些模型...AI 技术文章# FHE# Fully Homomorphic Encryption# GPT22年前03650