多模态 · 私有化 · Agentic RAG

从文档到答案
企业级多模态知识库

上传 PDF、Office、图片与音频,系统自动完成解析、向量化与索引;提问后经多轮检索与推理,返回附带原文引用与配图的答案,全程本地私有化部署。

PDF / Office 图片 / 扫描件 音频 / 视频 解析 · OCR 多模态向量化 向量库 答案 · 带引用 [1] 引用
0
支持模态
文档 / 图片 / 音频 / 视频
0
检索模式
语义 / 稀疏 / 混合
0
私有化部署
数据不出内网
0
OpenAI 兼容 API
标准接口接入
Tech Features

核心技术特性

Agentic RAG · 探索链

在单次检索之上引入多轮探索机制,由模型评估证据充分性,并决定是否继续检索。

问题路由 问题规范化 证据检索 进度评估 生成答案
  • 路由:判断问题是否需要知识库;常规问题直接回答,涉及专业内容与内部资料的问题进入检索。
  • 检索 ⇄ 评估循环:基于 LangGraph 状态机,每轮检索后由模型评估证据是否充分,不足则生成新的探索问题继续检索。
  • 可视化:整个探索链实时以时间线展示给用户,过程透明、结论可溯源。
  • 带引用作答:最终答案标注证据编号,并把相关图片插入正文。
LangGraph 状态机多轮探索证据充分性评估引用溯源

多模态解析与索引

将非结构化文件转换为可检索的结构化知识。

原始文件 版面分析 + OCR Markdown + 视觉块 多模态向量
  • 版面识别:PP-Structure 还原标题、段落顺序、表格、公式、图片区域。
  • 视觉块:图、表、图表、整页图单独抽取,可被独立检索并回插答案。
  • 统一向量化:文本与图像经多模态 Embedding 编码后写入向量库。
  • 支持:PDF、Word/PPT/Excel、图片、音频(ASR 转写)。
PP-Structure 版面分析OCR视觉块抽取多模态 Embedding

混合检索

融合语义召回与关键词精确匹配,兼顾泛化理解与机构名、术语的准确命中。

查询 稠密语义向量+ 稀疏关键词 融合排序
  • 稠密:语义相似度召回,理解同义与上下文。
  • 稀疏:关键词/术语精确命中,弥补纯语义的漏召回。
  • Weaviate 融合两路打分,按相关度统一排序,并做低相关过滤。
  • 结果附相关度分数与原文/配图,可核对可追溯。
Dense 语义向量Sparse 关键词Hybrid 融合排序低相关过滤

多租户隔离

单套部署服务多个团队,租户之间数据完全隔离。

租户 工作区 成员 / 文档
  • 三级模型:租户拥有工作区,工作区下管理成员与文档。
  • 硬隔离:向量检索与文件访问都按 workspace 过滤,跨租户不可见。
  • 权限分层:平台管理员 / 租户 / 普通用户,越权访问返回站内 403。
租户 → 工作区 → 成员向量级隔离三级权限

OpenAI 兼容 API

遵循标准接口协议,现有客户端无需改造即可接入。

外部客户端 /v1/chat/completions chat / rag / agent
  • 标准 /v1/chat/completions/v1/models
  • Bearer Tokenworkspace_id:api_key)鉴权,天然带工作区隔离。
  • OpenWebUI、Cherry Studio 等客户端配置地址后即可使用。
  • 三种模式:直接对话 chat / 知识库 rag / 智能体 agent
/v1 标准接口Bearer TokenSSE 流式输出

模型可插拔

对话与嵌入模型均可独立配置,不绑定单一厂商。

豆包 Doubao· DeepSeek· 通义千问
  • 仅需配置 base_url / key / model 即可切换任意 OpenAI 兼容服务。
  • 结构化输出自适应:思考型模型可切换至 json_schema,规避强制工具调用限制。
  • 嵌入与对话可使用相同或不同的密钥,独立组合。
base_url / key / modeljson_schema温度 / 思考开关
In Action

主要功能

END-USER CHAT

面向终端用户的对话界面

普通用户登录后直接进入对话界面,检索细节由系统在后台完成,无需额外学习成本。选择「知识库问答」即可基于本租户资料作答。

同源相对链接流式输出Markdown 渲染
chat
EXPLAINABLE

检索与推理过程实时可视化

问题路由、规范化、多轮证据检索、进度评估逐步以时间线呈现,命中文档与相关度分数逐条可查,推理过程全程可追溯。

探索链时间线证据分数可溯源
thinking
HYBRID SEARCH

混合检索,结果可核对

语义与稀疏两路融合排序,命中结果附相关度分数、原文与关联图片,支持逐条核对。

语义稀疏混合相关度过滤
search
DOCS & TENANTS

文档与团队集中管理

拖拽上传、自动流水线处理、状态可视;多租户与用户管理,可为成员开通网页登录或签发 API 密钥。

拖拽上传处理进度工作区隔离API 密钥
documents
Pipeline

从上传到问答的自动化流水线

上传

文档/图片/音频

解析

版面 + OCR

向量化

多模态嵌入

索引

写入向量库

问答

检索+推理+引用
Stack

稳健、开放、可自托管

Django 5.2React 18 + Vite Weaviate 向量库LangGraph Agentic RAG 多模态 EmbeddingPaddleX 文档解析 OpenAI 兼容Docker 私有化 Django 5.2React 18 + Vite Weaviate 向量库LangGraph Agentic RAG 多模态 EmbeddingPaddleX 文档解析 OpenAI 兼容Docker 私有化

部署 MMKB,构建你的多模态知识库

免费试用