spring-ai + ollama + milvus 实现本地知识库 RAG 向量增强检索
当前所有的大语言模型(LLM)实际上并不具备真正的记忆功能。例如,ChatGPT 所谓的“记忆”能力,仅仅是通过在接收用户输入时,将最近几轮的对话内容合并进提示词(prompt),然后再交给模型处理。然而,LLM 都受 Token 数量的约束,这意味着当输入文本超出一定范围,较早的对话内容就会被遗忘。
技巧 AI 中间件
Copyright © 2018 Powered by ANDY