本地RAG增强检索实现

spring-ai + ollama + milvus 实现本地知识库 RAG 向量增强检索

一、大模型 RAG

现有大语言模型的记忆局限与 RAG 技术

当前所有的大语言模型（LLM）实际上并不具备真正的记忆功能。例如，ChatGPT 所谓的“记忆”能力，仅仅是通过在接收用户输入时，将最近几轮的对话内容合并进提示词（prompt），然后再交给模型处理。然而，LLM 都受 Token 数量的约束，这意味着当输入文本超出一定范围，较早的对话内容就会被遗忘。

阅读原文 2025/03/21 源自 AI

一、大模型 RAG

现有大语言模型的记忆局限与 RAG 技术

本地RAG增强检索实现

OPEN TO

分类

最近更新