MMKB 多模态知识库

Tech Features

核心技术特性

Agentic RAG · 探索链

在单次检索之上引入多轮探索机制，由模型评估证据充分性，并决定是否继续检索。

问题路由→ 问题规范化→ 证据检索⇄ 进度评估→ 生成答案

路由：判断问题是否需要知识库；常规问题直接回答，涉及专业内容与内部资料的问题进入检索。
检索 ⇄ 评估循环：基于 LangGraph 状态机，每轮检索后由模型评估证据是否充分，不足则生成新的探索问题继续检索。
可视化：整个探索链实时以时间线展示给用户，过程透明、结论可溯源。
带引用作答：最终答案标注证据编号，并把相关图片插入正文。

LangGraph 状态机多轮探索证据充分性评估引用溯源

多模态解析与索引

将非结构化文件转换为可检索的结构化知识。

原始文件→ 版面分析 + OCR→ Markdown + 视觉块→ 多模态向量

版面识别：PP-Structure 还原标题、段落顺序、表格、公式、图片区域。
视觉块：图、表、图表、整页图单独抽取，可被独立检索并回插答案。
统一向量化：文本与图像经多模态 Embedding 编码后写入向量库。
支持：PDF、Word/PPT/Excel、图片、音频（ASR 转写）。

PP-Structure 版面分析OCR视觉块抽取多模态 Embedding

混合检索

融合语义召回与关键词精确匹配，兼顾泛化理解与机构名、术语的准确命中。

查询→ 稠密语义向量+ 稀疏关键词→ 融合排序

稠密：语义相似度召回，理解同义与上下文。
稀疏：关键词/术语精确命中，弥补纯语义的漏召回。
Weaviate 融合两路打分，按相关度统一排序，并做低相关过滤。
结果附相关度分数与原文/配图，可核对可追溯。

Dense 语义向量Sparse 关键词Hybrid 融合排序低相关过滤

多租户隔离

单套部署服务多个团队，租户之间数据完全隔离。

租户→ 工作区→ 成员 / 文档

三级模型：租户拥有工作区，工作区下管理成员与文档。
硬隔离：向量检索与文件访问都按 workspace 过滤，跨租户不可见。
权限分层：平台管理员 / 租户 / 普通用户，越权访问返回站内 403。

租户 → 工作区 → 成员向量级隔离三级权限

OpenAI 兼容 API

遵循标准接口协议，现有客户端无需改造即可接入。

外部客户端→ /v1/chat/completions→ chat / rag / agent

标准 /v1/chat/completions 与 /v1/models。
Bearer Token（workspace_id:api_key）鉴权，天然带工作区隔离。
OpenWebUI、Cherry Studio 等客户端配置地址后即可使用。
三种模式：直接对话 chat / 知识库 rag / 智能体 agent。

/v1 标准接口Bearer TokenSSE 流式输出

模型可插拔

对话与嵌入模型均可独立配置，不绑定单一厂商。

豆包 Doubao· DeepSeek· 通义千问

仅需配置 base_url / key / model 即可切换任意 OpenAI 兼容服务。
结构化输出自适应：思考型模型可切换至 json_schema，规避强制工具调用限制。
嵌入与对话可使用相同或不同的密钥，独立组合。

base_url / key / modeljson_schema温度 / 思考开关

In Action

主要功能

END-USER CHAT

面向终端用户的对话界面

普通用户登录后直接进入对话界面，检索细节由系统在后台完成，无需额外学习成本。选择「知识库问答」即可基于本租户资料作答。

同源相对链接流式输出Markdown 渲染

EXPLAINABLE

检索与推理过程实时可视化

问题路由、规范化、多轮证据检索、进度评估逐步以时间线呈现，命中文档与相关度分数逐条可查，推理过程全程可追溯。

探索链时间线证据分数可溯源

HYBRID SEARCH

混合检索，结果可核对

语义与稀疏两路融合排序，命中结果附相关度分数、原文与关联图片，支持逐条核对。

语义稀疏混合相关度过滤

DOCS & TENANTS

文档与团队集中管理

拖拽上传、自动流水线处理、状态可视；多租户与用户管理，可为成员开通网页登录或签发 API 密钥。

拖拽上传处理进度工作区隔离API 密钥

从文档到答案
企业级多模态知识库

核心技术特性

Agentic RAG · 探索链

多模态解析与索引

混合检索

多租户隔离

OpenAI 兼容 API

模型可插拔

主要功能

面向终端用户的对话界面

检索与推理过程实时可视化

混合检索，结果可核对

文档与团队集中管理

从上传到问答的自动化流水线

上传

解析

向量化

索引

问答

稳健、开放、可自托管

部署 MMKB，构建你的多模态知识库

从文档到答案企业级多模态知识库

核心技术特性

Agentic RAG · 探索链

多模态解析与索引

混合检索

多租户隔离

OpenAI 兼容 API

模型可插拔

主要功能

面向终端用户的对话界面

检索与推理过程实时可视化

混合检索，结果可核对

文档与团队集中管理

从上传到问答的自动化流水线

上传

解析

向量化

索引

问答

稳健、开放、可自托管

部署 MMKB，构建你的多模态知识库

从文档到答案
企业级多模态知识库