Agentic RAG · 探索链
在单次检索之上引入多轮探索机制,由模型评估证据充分性,并决定是否继续检索。
问题路由→
问题规范化→
证据检索⇄
进度评估→
生成答案
- 路由:判断问题是否需要知识库;常规问题直接回答,涉及专业内容与内部资料的问题进入检索。
- 检索 ⇄ 评估循环:基于 LangGraph 状态机,每轮检索后由模型评估证据是否充分,不足则生成新的探索问题继续检索。
- 可视化:整个探索链实时以时间线展示给用户,过程透明、结论可溯源。
- 带引用作答:最终答案标注证据编号,并把相关图片插入正文。
多模态解析与索引
将非结构化文件转换为可检索的结构化知识。
原始文件→
版面分析 + OCR→
Markdown + 视觉块→
多模态向量
- 版面识别:PP-Structure 还原标题、段落顺序、表格、公式、图片区域。
- 视觉块:图、表、图表、整页图单独抽取,可被独立检索并回插答案。
- 统一向量化:文本与图像经多模态 Embedding 编码后写入向量库。
- 支持:PDF、Word/PPT/Excel、图片、音频(ASR 转写)。
混合检索
融合语义召回与关键词精确匹配,兼顾泛化理解与机构名、术语的准确命中。
查询→
稠密语义向量+
稀疏关键词→
融合排序
- 稠密:语义相似度召回,理解同义与上下文。
- 稀疏:关键词/术语精确命中,弥补纯语义的漏召回。
- Weaviate 融合两路打分,按相关度统一排序,并做低相关过滤。
- 结果附相关度分数与原文/配图,可核对可追溯。
多租户隔离
单套部署服务多个团队,租户之间数据完全隔离。
租户→
工作区→
成员 / 文档
- 三级模型:租户拥有工作区,工作区下管理成员与文档。
- 硬隔离:向量检索与文件访问都按
workspace 过滤,跨租户不可见。
- 权限分层:平台管理员 / 租户 / 普通用户,越权访问返回站内 403。
OpenAI 兼容 API
遵循标准接口协议,现有客户端无需改造即可接入。
外部客户端→
/v1/chat/completions→
chat / rag / agent
- 标准
/v1/chat/completions 与 /v1/models。
- Bearer Token(
workspace_id:api_key)鉴权,天然带工作区隔离。
- OpenWebUI、Cherry Studio 等客户端配置地址后即可使用。
- 三种模式:直接对话
chat / 知识库 rag / 智能体 agent。
模型可插拔
对话与嵌入模型均可独立配置,不绑定单一厂商。
豆包 Doubao·
DeepSeek·
通义千问
- 仅需配置
base_url / key / model 即可切换任意 OpenAI 兼容服务。
- 结构化输出自适应:思考型模型可切换至
json_schema,规避强制工具调用限制。
- 嵌入与对话可使用相同或不同的密钥,独立组合。