本地RAG增强检索实现

spring-ai + ollama + milvus 实现本地知识库 RAG 向量增强检索


一、大模型 RAG

现有大语言模型的记忆局限与 RAG 技术

当前所有的大语言模型(LLM)实际上并不具备真正的记忆功能。例如,ChatGPT 所谓的“记忆”能力,仅仅是通过在接收用户输入时,将最近几轮的对话内容合并进提示词(prompt),然后再交给模型处理。然而,LLM 都受 Token 数量的约束,这意味着当输入文本超出一定范围,较早的对话内容就会被遗忘。

阅读原文   2025/03/21 源自  AI