AI 产品经理 · 2023.04 – 2024.09 LLM Agent · 多模态理解 · 知识图谱

企业智能知识中台

从 0 到 1 落地企业知识中台，基于多模态文档理解 + LLM Agent 架构，
让企业的非结构化文档自动解析、精准检索、即问即答。

10x+

人效提升

94%

检索准确率

80万+

文档处理总量

12 家

企业客户

SCROLL

知识密集型行业，困在文档里的人。

目标用户

金融、法律、咨询行业的一线分析师、法务专员与项目经理 — 日常工作高度依赖海量历史文档（财报、尽调报告、合同、技术手册）做业务决策，对答案准确性"零容忍"，对核对时间却很敏感。

25 分钟

单次知识检索平均耗时（项目前）

2 分钟

单次知识检索平均耗时（项目后）

文档多而散

合同、报告、财报、技术手册分布在各业务系统与个人本地，多为长篇非结构化数据，跨系统统一检索几乎不可行。

核对成本极高

大模型在专业领域易"幻觉"。一线人员对答案准确性零容忍，即便 AI 给出结论，仍需回原文逐句核对，体验割裂。

复杂任务无法自动化

业务往往不是一问一答，而是跨多份长文档比对。传统静态知识库无状态、无编排，难以承载真正的业务任务链。

三个高价值场景，跑通商业闭环。

Scenario 01 已商业化

合同审查

条款级风险自动识别与定位
对比模板差异、缺失条款提示
风险召回率 96%

Scenario 02 已商业化

财报解读

跨期、跨主体财务数据自动比对
关键指标一键提取与可视化
处理效率最高提升 8 倍

Scenario 03 已商业化

知识问答

跨文档自然语言问答
原文溯源、段落级高亮
Top-3 命中率 94%

三层能力栈，从文档到答案。

多模态解析 Pipeline 示意 — 待替换

多模态文档解析 Pipeline

主导搭建覆盖 PDF、Word、扫描件、表格、图像等多类型文档的标准化解析流水线，统一抽取文本、版面与结构化要素，为下游检索与推理提供高质量原料。

设计决策

把"解析质量"作为独立指标体系来管，建立质量评估闭环，而不是把解析当作 RAG 的隐式步骤 — 否则下游再强的模型也救不回来。

知识图谱关联推理示意 — 待替换

知识图谱与跨文档关联推理

设计统一的知识图谱 Schema，把分散在不同文档里的实体、关系、条款连成网络，让"同一家公司在不同年份财报中的数据""同一类合同条款的差异"具备可推理的结构。

设计决策

不追求"全行业通用图谱"，而是按业务场景定义最小可用 Schema — 优先满足合同审查、财报解读两条强需求线，再向外扩展。

多 Agent 编排与置信度分级示意 — 待替换

多 Agent 协同编排

搭建多 Agent 协同编排体系，由"规划 Agent"拆解任务、调度"检索 / 抽取 / 比对 / 写作"等专项 Agent 协同完成。每一步输出都附带置信度，串联成可追溯的工作流。

设计决策

放弃"一个超级 Agent"的幻想，按职责拆分小 Agent，并把"编排"本身作为产品的核心 IP — 这是真正难复制的部分。

两个关键决策，决定产品能不能卖。

人机协同的边界：置信度分级

初始方案

全自动输出

所有 AI 结果直接呈现给业务人员，问题暴露在最后一公里 — 用户对错误零容忍，一次幻觉就会毁掉整套信任。

→

优化方案

置信度分级闭环

高置信度结果自动执行并溯源；低置信度结果转人工复核，复核数据回流训练 — 既保业务效率，也保产品口碑。

触达 B 端的现实：双部署形态

客户诉求

数据不出内网

金融与法律客户对数据敏感性要求极高，模型推理全链路必须可控、可审计、可私有化。

→

架构设计

私有化 + 公有云

同一套产品形态，支持公有云 SaaS 与本地化私有部署两条路径，覆盖头部敏感客户与中长尾客户两类市场。

企业智能知识中台

知识密集型行业， 困在文档里的人。

目标用户

文档多而散

核对成本极高

复杂任务无法自动化

三个高价值场景， 跑通商业闭环。

合同审查

财报解读

知识问答

三层能力栈， 从文档到答案。

多模态文档解析 Pipeline

知识图谱与跨文档关联推理

多 Agent 协同编排

两个关键决策， 决定产品能不能卖。

人机协同的边界：置信度分级

初始方案

优化方案

触达 B 端的现实：双部署形态

客户诉求

架构设计

数字说话。

知识密集型行业，困在文档里的人。

三个高价值场景，跑通商业闭环。

三层能力栈，从文档到答案。

两个关键决策，决定产品能不能卖。