开源数据集

COIG

开源中文指令通用语料库

标签:

数据集的相关论文:https://arxiv.org/abs/2304.07987,这篇论文的关键点是介绍了指导调整(instruction tuning)的概念,以构建通用语言模型,并提出了中文开放指导通用语言模型(Chinese Open Instruction Generalist),这是一个经过人工验证的高质量中文指导调整语料库,可用于中文LLMs的指导调整。该论文还提供了有关如何构建未来中文指导调整语料库的见解,并提供了五个开源高质量的中文指导语料库作为构建新中文指导语料库的样本。

数据统计

相关导航

没有相关内容!

暂无评论

暂无评论...