AI 产品经理 · 2023.04 – 2024.09 LLM Agent · 多模态理解 · 知识图谱

企业智能知识中台

从 0 到 1 落地企业知识中台,基于多模态文档理解 + LLM Agent 架构,
让企业的非结构化文档自动解析、精准检索、即问即答。

10x+
人效提升
94%
检索准确率
80万+
文档处理总量
12 家
企业客户
个人网站首页 — 项目所属作品集
SCROLL

知识密集型行业, 困在文档里的人。

目标用户

金融、法律、咨询行业的一线分析师、法务专员与项目经理 — 日常工作高度依赖海量历史文档(财报、尽调报告、合同、技术手册)做业务决策,对答案准确性"零容忍",对核对时间却很敏感。

25 分钟
单次知识检索平均耗时(项目前)
2 分钟
单次知识检索平均耗时(项目后)
01

文档多而散

合同、报告、财报、技术手册分布在各业务系统与个人本地,多为长篇非结构化数据,跨系统统一检索几乎不可行。

02

核对成本极高

大模型在专业领域易"幻觉"。一线人员对答案准确性零容忍,即便 AI 给出结论,仍需回原文逐句核对,体验割裂。

03

复杂任务无法自动化

业务往往不是一问一答,而是跨多份长文档比对。传统静态知识库无状态、无编排,难以承载真正的业务任务链。

三个高价值场景, 跑通商业闭环。

Scenario 01 已商业化

合同审查

  • 条款级风险自动识别与定位
  • 对比模板差异、缺失条款提示
  • 风险召回率 96%
Scenario 02 已商业化

财报解读

  • 跨期、跨主体财务数据自动比对
  • 关键指标一键提取与可视化
  • 处理效率最高提升 8 倍
Scenario 03 已商业化

知识问答

  • 跨文档自然语言问答
  • 原文溯源、段落级高亮
  • Top-3 命中率 94%

三层能力栈, 从文档到答案。

多模态解析 Pipeline 示意 — 待替换
01

多模态文档解析 Pipeline

主导搭建覆盖 PDF、Word、扫描件、表格、图像等多类型文档的标准化解析流水线,统一抽取文本、版面与结构化要素,为下游检索与推理提供高质量原料。

设计决策

把"解析质量"作为独立指标体系来管,建立质量评估闭环,而不是把解析当作 RAG 的隐式步骤 — 否则下游再强的模型也救不回来。

知识图谱关联推理示意 — 待替换
02

知识图谱与跨文档关联推理

设计统一的知识图谱 Schema,把分散在不同文档里的实体、关系、条款连成网络,让"同一家公司在不同年份财报中的数据""同一类合同条款的差异"具备可推理的结构。

设计决策

不追求"全行业通用图谱",而是按业务场景定义最小可用 Schema — 优先满足合同审查、财报解读两条强需求线,再向外扩展。

多 Agent 编排与置信度分级示意 — 待替换
03

多 Agent 协同编排

搭建多 Agent 协同编排体系,由"规划 Agent"拆解任务、调度"检索 / 抽取 / 比对 / 写作"等专项 Agent 协同完成。每一步输出都附带置信度,串联成可追溯的工作流。

设计决策

放弃"一个超级 Agent"的幻想,按职责拆分小 Agent,并把"编排"本身作为产品的核心 IP — 这是真正难复制的部分。

两个关键决策, 决定产品能不能卖。

01

人机协同的边界:置信度分级

初始方案

全自动输出

所有 AI 结果直接呈现给业务人员,问题暴露在最后一公里 — 用户对错误零容忍,一次幻觉就会毁掉整套信任。

优化方案

置信度分级闭环

高置信度结果自动执行并溯源;低置信度结果转人工复核,复核数据回流训练 — 既保业务效率,也保产品口碑。

02

触达 B 端的现实:双部署形态

客户诉求

数据不出内网

金融与法律客户对数据敏感性要求极高,模型推理全链路必须可控、可审计、可私有化。

架构设计

私有化 + 公有云

同一套产品形态,支持公有云 SaaS 与本地化私有部署两条路径,覆盖头部敏感客户与中长尾客户两类市场。

数字说话。

10x+
人效提升
检索 25 分钟 → 2 分钟
94%
Top-3 命中率
知识问答场景
96%
风险召回率
合同审查场景
12 家
企业客户
金融 / 法律 / 咨询为主
80万+
累计文档处理量
多模态非结构化数据
ARR 280 万
商业化结果
NPS 62 / 续约率 85%