neration)技术是一种结合了信息检索(Retrieval)和文本生 成(Generation)的自然语言处理(NLp)方法。核心思想是将传统的检索技术与现代的自然语言 生成技术相结合,以提高文本生成的准确性和相关性。它旨在通过从外部知识库中检索相关信息来 辅助大型语言模型(如 Gpt 系列)生成更准确、可靠的回答。 在 RAG 技术中,整个过程主要分为三个步骤如图 2.2 所示:索引( Indexing)、检索 (Retrieval)和生成(Generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将 其分割成较小的块(chunk)并进行编码,然后存储在向量数据库中。这个过程的关键在于将...