检索增强生成 (RAG) 是将信息检索系统与大型语言模型 (LLM) 相结合的人工智能框架. RAG 通过提供对外部知识库的访问来提高 LLM 响应的准确性和相关性。
- 检索相关文档: RAG 查找与用户查询最相关的文档。
- 增强查询: RAG 将相关文档添加到用户的查询中。
- 发送到 LLM: RAG 将增强查询发送到 LLM 以生成响应。
- 准确性: RAG 提供可供用户检查以验证声明的来源。
- 成本效益: RAG 允许用户更新源而无需重新培训 LLM。
- 开发人员控制: RAG 使排除故障和修复应用程序变得更加容易。
- 数据主权: RAG 允许敏感数据保留在本地。