从 0 到 1 落地企业知识中台,基于多模态文档理解 + LLM Agent 架构,
让企业的非结构化文档自动解析、精准检索、即问即答。
金融、法律、咨询行业的一线分析师、法务专员与项目经理 — 日常工作高度依赖海量历史文档(财报、尽调报告、合同、技术手册)做业务决策,对答案准确性"零容忍",对核对时间却很敏感。
合同、报告、财报、技术手册分布在各业务系统与个人本地,多为长篇非结构化数据,跨系统统一检索几乎不可行。
大模型在专业领域易"幻觉"。一线人员对答案准确性零容忍,即便 AI 给出结论,仍需回原文逐句核对,体验割裂。
业务往往不是一问一答,而是跨多份长文档比对。传统静态知识库无状态、无编排,难以承载真正的业务任务链。
主导搭建覆盖 PDF、Word、扫描件、表格、图像等多类型文档的标准化解析流水线,统一抽取文本、版面与结构化要素,为下游检索与推理提供高质量原料。
把"解析质量"作为独立指标体系来管,建立质量评估闭环,而不是把解析当作 RAG 的隐式步骤 — 否则下游再强的模型也救不回来。
设计统一的知识图谱 Schema,把分散在不同文档里的实体、关系、条款连成网络,让"同一家公司在不同年份财报中的数据""同一类合同条款的差异"具备可推理的结构。
不追求"全行业通用图谱",而是按业务场景定义最小可用 Schema — 优先满足合同审查、财报解读两条强需求线,再向外扩展。
搭建多 Agent 协同编排体系,由"规划 Agent"拆解任务、调度"检索 / 抽取 / 比对 / 写作"等专项 Agent 协同完成。每一步输出都附带置信度,串联成可追溯的工作流。
放弃"一个超级 Agent"的幻想,按职责拆分小 Agent,并把"编排"本身作为产品的核心 IP — 这是真正难复制的部分。
所有 AI 结果直接呈现给业务人员,问题暴露在最后一公里 — 用户对错误零容忍,一次幻觉就会毁掉整套信任。
高置信度结果自动执行并溯源;低置信度结果转人工复核,复核数据回流训练 — 既保业务效率,也保产品口碑。
金融与法律客户对数据敏感性要求极高,模型推理全链路必须可控、可审计、可私有化。
同一套产品形态,支持公有云 SaaS 与本地化私有部署两条路径,覆盖头部敏感客户与中长尾客户两类市场。