单体 HTML artifact · 企业用户 · 离线可打开

Token Factory PPT 大纲 v2:面向企业用户

这是按 v2 review 建议生成的读者友好 review cockpit:先结果,后论证;Markdown 仍是 source-of-truth。

状态v2 讨论稿
用途面向大型企业内部 AI / IT / 平台团队的 PPT 大纲
关系基于 v1 review 调整;本版本只服务企业内部 MaaS / Token 供给场景,不再混讲智算中心对外经营
目标页数26 页
听众企业 CIO / CTO、AI 平台负责人、IT 基础设施负责人、FinOps、业务部门管理者、安全合规负责人
叙事规则先结果,后论证
边界这里的“企业用户”不是 A 类个人终端用户,而是 C 类大型企业内部平台方,兼顾 B 类部门 / 应用 / 业务管理者
Source Hashe2c4675d7a95
Generated2026-05-15 04:14:56 UTC
26分页设计
6章节
11含强数字页
v2先结果后论证

Gate Dashboard

v2 必须遵循
Result Firstv2 必须先讲使用后的决策层结果,再讲能力和案例。
Audience Split本版本只面向企业内部平台,不混讲智算中心对外经营。
C Primary企业用户指 C 类大型企业平台方,兼顾 B 类管理者,不是 A 类个人用户。
MaaS BoundaryMaaS 是出口,Token Factory 是供给、经营、治理和优化系统。
Dashboard / CopilotDashboard 是经营驾驶系统;Copilot 是智能工作台。
Disclosure强数字可进内部母稿,公开前确认可披露范围。

核心判断

使用方式

本 HTML 用于一遍人工 review,不是最终 PPT。

章节地图

先结果,后论证

大纲卡片

默认摘要,按需展开完整字段

第一章:先讲企业内部结果

P01-P05 · 5 页
P01

用了 Token Factory,企业得到的是统一、可治理的内部 AI 供给平台

先结果Gate
C 企业 AI / IT 平台负责人开场结果页

企业可以把模型、算力和推理服务统一供给给内部应用、Agent、Copilot 和业务部门。

论证:后面再解释 MaaS 出口、管理后台、Dashboard、Copilot、AI 网关和推理优化如何支撑结果。

  • 统一供给:模型服务、API、Endpoint、模型目录。
  • 统一治理:身份、权限、配额、预算、审计。
  • 统一度量:部门、应用、Agent、Token、SLA、成本、业务价值。
展开完整字段
  • 主对象:C 企业 AI / IT 平台负责人
  • 销售作用:开场结果页
  • 先给结果:企业可以把模型、算力和推理服务统一供给给内部应用、Agent、Copilot 和业务部门。
  • 后续论证:后面再解释 MaaS 出口、管理后台、Dashboard、Copilot、AI 网关和推理优化如何支撑结果。
  • 页面内容:

- 统一供给:模型服务、API、Endpoint、模型目录。

- 统一治理:身份、权限、配额、预算、审计。

- 统一度量:部门、应用、Agent、Token、SLA、成本、业务价值。

  • 视觉建议:企业内部多应用汇聚到 Token Factory 的统一供给图。
  • 素材来源:HARD_GATES.mddashboard-html-materials.md
  • 禁止表达:不要讲成对外售卖 Token 的平台。
  • 下一步引导:让客户确认“统一内部 AI 供给”是核心目标。
P02

结果一:部门、应用和 Agent 的 Token 使用可统计、可分摊

先结果数字需披露确认Gate
C 平台方 / B 管理者治理结果页

企业可以按部门、BU、应用和 Agent 看到 Token 用量、预算使用率、单位业务成本和分摊成本。

论证:Dashboard 的企业内部经营版连接组织、应用、预算、Token 计量和 Chargeback。

  • 活跃部门 23,覆盖 7 个 BU。
  • 应用 / Agent 156,其中 Agent 68、App 88。
  • 月分摊成本 ¥523.8K,预算使用率 72.4%。
展开完整字段
  • 主对象:C 平台方 / B 管理者
  • 销售作用:治理结果页
  • 先给结果:企业可以按部门、BU、应用和 Agent 看到 Token 用量、预算使用率、单位业务成本和分摊成本。
  • 后续论证:Dashboard 的企业内部经营版连接组织、应用、预算、Token 计量和 Chargeback。
  • 页面内容:

- 活跃部门 23,覆盖 7 个 BU。

- 应用 / Agent 156,其中 Agent 68、App 88。

- 月分摊成本 ¥523.8K,预算使用率 72.4%。

- Showback 覆盖率 91.3%。

  • 视觉建议:部门消费排行 + 应用类型分布 + 预算仪表。
  • 素材来源:dashboard-html-materials.md 页面 1 / 2。
  • 禁止表达:不要只讲“内部也能调用 API”。
  • 下一步引导:进入预算与成本控制。
P03

结果二:AI 成本从黑盒变成可解释、可控制的经营账本

先结果数字需披露确认Gate
C FinOps / C 管理层成本治理页

企业能看到单位 Token 成本、部门预算、模型成本、资源池成本和关键业务成本边界。

论证:Token Factory 通过计量计费、FinOps、Dashboard 和 Copilot 把成本归因到部门、应用、模型和资源池。

  • 单位 Token 成本 ¥4.11/百万。
  • 预算使用率 72.4%,可识别预算 >90% 的部门。
  • Copilot 可定位 DeepSeek-R1 成本上升是模型、服务模板、资源池和缓存组合失衡。
展开完整字段
  • 主对象:C FinOps / C 管理层
  • 销售作用:成本治理页
  • 先给结果:企业能看到单位 Token 成本、部门预算、模型成本、资源池成本和关键业务成本边界。
  • 后续论证:Token Factory 通过计量计费、FinOps、Dashboard 和 Copilot 把成本归因到部门、应用、模型和资源池。
  • 页面内容:

- 单位 Token 成本 ¥4.11/百万。

- 预算使用率 72.4%,可识别预算 >90% 的部门。

- Copilot 可定位 DeepSeek-R1 成本上升是模型、服务模板、资源池和缓存组合失衡。

  • 视觉建议:成本从模型 / 资源池 / 部门 / 应用逐层归因图。
  • 素材来源:dashboard-html-materials.mdcopilot-html-materials.md 场景 8。
  • 禁止表达:不要把 FinOps 简化成账单。
  • 下一步引导:进入 SLA 和关键业务保障。
P04

结果三:关键业务有 SLA,低价值流量有治理策略

先结果数字需披露确认Gate
C 平台方 / B 业务管理者服务质量结果页

企业可以保护关键业务和高优先级应用,同时限制低价值或低实时性流量。

论证:AI 网关、路由策略、配额、预算、Copilot 和 Dashboard 共同支撑 SLA 治理。

  • 关键业务保障率 99.5%。
  • Copilot 可识别占用高优先级容量 29% 但收入 / 价值不匹配的租户或工作区。
  • 路由策略可按 SLA 与 ROI 做部分切流,毛利率 +2.8pt。
展开完整字段
  • 主对象:C 平台方 / B 业务管理者
  • 销售作用:服务质量结果页
  • 先给结果:企业可以保护关键业务和高优先级应用,同时限制低价值或低实时性流量。
  • 后续论证:AI 网关、路由策略、配额、预算、Copilot 和 Dashboard 共同支撑 SLA 治理。
  • 页面内容:

- 关键业务保障率 99.5%。

- Copilot 可识别占用高优先级容量 29% 但收入 / 价值不匹配的租户或工作区。

- 路由策略可按 SLA 与 ROI 做部分切流,毛利率 +2.8pt。

  • 视觉建议:关键业务保护层 + 低价值流量治理图。
  • 素材来源:dashboard-html-materials.mdcopilot-html-materials.md 场景 10 / 11。
  • 禁止表达:不要承诺所有请求同等高优先级。
  • 下一步引导:进入安全审计。
P05

结果四:安全、权限和审计形成 AI 使用边界

先结果数字需披露确认Gate
C 安全 / C 平台负责人安全结果页

企业内部 Agent、Copilot 和应用调用模型时,权限、审计、敏感输出和工具调用风险可以被治理。

论证:Token Factory 把安全策略、租户 / 部门边界、API 鉴权、工具调用和审计闭环接入统一控制面。

  • 风险请求 23,412,拦截率 99.2%。
  • 风险类型:Prompt 注入、越权访问、恶意工具调用、敏感输出、数据泄漏尝试、多租户越界。
  • 安全事件闭环率 85.7%。
展开完整字段
  • 主对象:C 安全 / C 平台负责人
  • 销售作用:安全结果页
  • 先给结果:企业内部 Agent、Copilot 和应用调用模型时,权限、审计、敏感输出和工具调用风险可以被治理。
  • 后续论证:Token Factory 把安全策略、租户 / 部门边界、API 鉴权、工具调用和审计闭环接入统一控制面。
  • 页面内容:

- 风险请求 23,412,拦截率 99.2%。

- 风险类型:Prompt 注入、越权访问、恶意工具调用、敏感输出、数据泄漏尝试、多租户越界。

- 安全事件闭环率 85.7%。

  • 视觉建议:企业 AI 风险漏斗 + 审计闭环。
  • 素材来源:dashboard-html-materials.md 页面 4。
  • 禁止表达:不要把安全写成附属能力。
  • 下一步引导:进入企业为什么现在需要统一平台。

---

# 第二章:为什么企业需要统一 Token 供给平台

第二章:为什么企业需要统一 Token 供给平台

P06-P09 · 4 页
P06

分散 AI 调用会带来成本、SLA 和安全失控

先结果Gate
C 管理层 / C 平台方问题定义

如果继续让部门各自接模型和 API,企业会失去统一成本、SLA 和安全边界。

论证:分散调用的问题不是工具多少,而是组织级治理缺失。

  • 多部门各自采购模型 API 或自建服务。
  • 应用 / Agent 缺少统一鉴权、配额、审计和成本归因。
  • 管理层无法判断哪些 AI 使用产生业务价值。
展开完整字段
  • 主对象:C 管理层 / C 平台方
  • 销售作用:问题定义
  • 先给结果:如果继续让部门各自接模型和 API,企业会失去统一成本、SLA 和安全边界。
  • 后续论证:分散调用的问题不是工具多少,而是组织级治理缺失。
  • 页面内容:

- 多部门各自采购模型 API 或自建服务。

- 应用 / Agent 缺少统一鉴权、配额、审计和成本归因。

- 管理层无法判断哪些 AI 使用产生业务价值。

  • 视觉建议:分散调用乱象 -> 统一 Token Factory 的收敛图。
  • 素材来源:HARD_GATES.md
  • 禁止表达:不要讲成“开发者体验优化”。
  • 下一步引导:企业需要内部 MaaS。
P07

内部 MaaS 的目标不是卖 Token,而是持续供给和治理

先结果Gate
C 企业平台方纠偏定位

企业建设内部 MaaS,是为了统一 AI 能力供给、降低重复建设、控制成本并保障关键业务。

论证:Token Factory 背后提供供给、经营、治理和推理优化系统。

  • 统一入口:模型目录、API、Endpoint、Playground。
  • 统一控制:部门、工作区、配额、预算、权限、审计。
  • 统一优化:路由、缓存、模型/GPU 匹配、SLO、成本。
展开完整字段
  • 主对象:C 企业平台方
  • 销售作用:纠偏定位
  • 先给结果:企业建设内部 MaaS,是为了统一 AI 能力供给、降低重复建设、控制成本并保障关键业务。
  • 后续论证:Token Factory 背后提供供给、经营、治理和推理优化系统。
  • 页面内容:

- 统一入口:模型目录、API、Endpoint、Playground。

- 统一控制:部门、工作区、配额、预算、权限、审计。

- 统一优化:路由、缓存、模型/GPU 匹配、SLO、成本。

  • 视觉建议:内部 MaaS 是出口,Token Factory 是后端供给系统。
  • 素材来源:HARD_GATES.md
  • 禁止表达:不要写成 ToC 模型 API 商店。
  • 下一步引导:进入年度 Token 供给计划。
P08

企业真正买的是可持续、可预期、可控成本的 Token 供给结果

先结果数字需披露确认Gate
C 管理层 / C 平台方结果型采购逻辑

企业可以把年度 Token 需求拆成基础包、弹性包和高优先级保障包。

论证:Copilot 能辅助把年度需求、峰值、SLA 和成本边界拆成供给计划。

  • 年度需求 18 亿 Token。
  • SLA 99.9% / 高优先级保障。
  • 基础供给包 + 峰值弹性包 + 高优先级保障包。
展开完整字段
  • 主对象:C 管理层 / C 平台方
  • 销售作用:结果型采购逻辑
  • 先给结果:企业可以把年度 Token 需求拆成基础包、弹性包和高优先级保障包。
  • 后续论证:Copilot 能辅助把年度需求、峰值、SLA 和成本边界拆成供给计划。
  • 页面内容:

- 年度需求 18 亿 Token。

- SLA 99.9% / 高优先级保障。

- 基础供给包 + 峰值弹性包 + 高优先级保障包。

  • 视觉建议:年度 Token 需求拆包图。
  • 素材来源:copilot-html-materials.md 场景 1。
  • 禁止表达:不要只讲平台建设,不讲供给结果。
  • 下一步引导:进入产品能力。
P09

企业内部平台要同时服务平台团队、业务部门和终端应用

先结果Gate
C 平台方 / B 管理者角色框架

Token Factory 让平台团队管供给,业务部门看预算和价值,应用 / Agent 稳定消费模型能力。

论证:A/B/C 角色在企业内部场景中必须分清。

  • C:企业 AI / IT 平台,负责采购、供给、治理。
  • B:部门 / BU / 应用负责人,关注预算、用量、SLA、业务价值。
  • A:终端员工或系统,只是通过应用和 Agent 间接使用 Token。
展开完整字段
  • 主对象:C 平台方 / B 管理者
  • 销售作用:角色框架
  • 先给结果:Token Factory 让平台团队管供给,业务部门看预算和价值,应用 / Agent 稳定消费模型能力。
  • 后续论证:A/B/C 角色在企业内部场景中必须分清。
  • 页面内容:

- C:企业 AI / IT 平台,负责采购、供给、治理。

- B:部门 / BU / 应用负责人,关注预算、用量、SLA、业务价值。

- A:终端员工或系统,只是通过应用和 Agent 间接使用 Token。

  • 视觉建议:企业内部 A/B/C 角色关系图。
  • 素材来源:HARD_GATES.md
  • 禁止表达:不要让 A 类个人用户成为主线。
  • 下一步引导:进入 Token Factory 如何支撑内部 MaaS。

---

# 第三章:Token Factory 如何支撑内部 MaaS

第三章:Token Factory 如何支撑内部 MaaS

P10-P16 · 7 页
P10

统一服务出口:让应用、Agent、Copilot、Workflow 都能接入模型能力

先结果Gate
C 平台方 / B 应用负责人能力论证

企业内部应用可以通过统一 API、模型目录和 Endpoint 接入模型服务。

论证:MaaS 出口负责消费体验,Token Factory 背后负责治理和生产。

  • 接入对象:业务应用、Agent、Copilot、Workflow、知识助手、OpenClaw。
  • 消费能力:API Key、模型目录、Endpoint、Usage / Billing。
  • 数据回流:用量进入部门预算、Dashboard 和 FinOps。
展开完整字段
  • 主对象:C 平台方 / B 应用负责人
  • 销售作用:能力论证
  • 先给结果:企业内部应用可以通过统一 API、模型目录和 Endpoint 接入模型服务。
  • 后续论证:MaaS 出口负责消费体验,Token Factory 背后负责治理和生产。
  • 页面内容:

- 接入对象:业务应用、Agent、Copilot、Workflow、知识助手、OpenClaw。

- 消费能力:API Key、模型目录、Endpoint、Usage / Billing。

- 数据回流:用量进入部门预算、Dashboard 和 FinOps。

  • 视觉建议:多应用接入统一模型服务出口。
  • 素材来源:dashboard-html-materials.mdcopilot-html-materials.md
  • 禁止表达:不要只讲开发者调用 API。
  • 下一步引导:进入组织和权限治理。
P11

组织治理:部门、BU、工作区、应用和 Agent 都有成本归属

先结果Gate
C 平台方 / B 管理者治理能力

每一次 Token 消费都能归属到部门、应用、Agent、工作区和预算对象。

论证:管理后台和 Dashboard 统一组织模型、身份、权限、配额和审计。

  • 组织:部门、BU、工作区、项目。
  • 消费对象:应用、Agent、Copilot、Workflow。
  • 治理对象:权限、配额、预算、审计、SLA。
展开完整字段
  • 主对象:C 平台方 / B 管理者
  • 销售作用:治理能力
  • 先给结果:每一次 Token 消费都能归属到部门、应用、Agent、工作区和预算对象。
  • 后续论证:管理后台和 Dashboard 统一组织模型、身份、权限、配额和审计。
  • 页面内容:

- 组织:部门、BU、工作区、项目。

- 消费对象:应用、Agent、Copilot、Workflow。

- 治理对象:权限、配额、预算、审计、SLA。

  • 视觉建议:组织树 -> 应用 / Agent -> Token 账本。
  • 素材来源:dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把组织治理讲成账号管理。
  • 下一步引导:进入预算和分摊。
P12

预算与分摊:Showback / Chargeback 让内部 AI 成本可管理

先结果数字需披露确认Gate
C FinOps / B 管理者成本能力

企业可以把 AI 成本按部门、应用和业务线分摊,并建立预算预警和成本控制策略。

论证:Token 计量、模型价格、资源池成本和部门预算统一进入 FinOps。

  • 月分摊成本 ¥523.8K。
  • Showback 覆盖率 91.3%。
  • 单位业务成本 ¥4.11/M Token。
展开完整字段
  • 主对象:C FinOps / B 管理者
  • 销售作用:成本能力
  • 先给结果:企业可以把 AI 成本按部门、应用和业务线分摊,并建立预算预警和成本控制策略。
  • 后续论证:Token 计量、模型价格、资源池成本和部门预算统一进入 FinOps。
  • 页面内容:

- 月分摊成本 ¥523.8K。

- Showback 覆盖率 91.3%。

- 单位业务成本 ¥4.11/M Token。

- 预算使用率 72.4%,3 个部门 >90%。

  • 视觉建议:部门预算仪表 + Chargeback 流程。
  • 素材来源:dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把 Chargeback 写成外部收费。
  • 下一步引导:进入模型服务和网关。
P13

模型服务与 AI 网关:让内部模型能力可授权、可限流、可降级、可审计

先结果Gate
C 平台方 / C 安全生产控制能力

企业可以把模型能力变成有权限、有策略、有 SLA、有审计的内部服务。

论证:AI 网关提供鉴权、模型授权、路由、限流、熔断、Fallback 和成本归因。

  • Consumer 维度鉴权和模型授权。
  • 权重、灰度、限流、熔断、审计。
  • 质量、速度、成本、负载共同决策。
展开完整字段
  • 主对象:C 平台方 / C 安全
  • 销售作用:生产控制能力
  • 先给结果:企业可以把模型能力变成有权限、有策略、有 SLA、有审计的内部服务。
  • 后续论证:AI 网关提供鉴权、模型授权、路由、限流、熔断、Fallback 和成本归因。
  • 页面内容:

- Consumer 维度鉴权和模型授权。

- 权重、灰度、限流、熔断、审计。

- 质量、速度、成本、负载共同决策。

  • 视觉建议:AI 网关控制面图。
  • 素材来源:inference-optimization-ppt-materials.md Slide 12。
  • 禁止表达:不要讲成普通 API Gateway。
  • 下一步引导:进入配额与优先级。
P14

配额与优先级:保护关键业务,治理低价值流量

先结果Gate
C 平台方 / B 业务负责人SLA 能力

关键业务可以获得更高优先级和保障,低价值流量可以被限流、降级或转低成本模型池。

论证:配额、预算、SLA、路由和限流策略在 Token Factory 中联动执行。

  • 高优先级业务保障。
  • 非关键任务限流或转低成本模型。
  • 低实时性请求走 balanced 路由。
展开完整字段
  • 主对象:C 平台方 / B 业务负责人
  • 销售作用:SLA 能力
  • 先给结果:关键业务可以获得更高优先级和保障,低价值流量可以被限流、降级或转低成本模型池。
  • 后续论证:配额、预算、SLA、路由和限流策略在 Token Factory 中联动执行。
  • 页面内容:

- 高优先级业务保障。

- 非关键任务限流或转低成本模型。

- 低实时性请求走 balanced 路由。

- Copilot 辅助比较路由方案。

  • 视觉建议:业务优先级与路由策略矩阵。
  • 素材来源:copilot-html-materials.md 场景 10 / 11。
  • 禁止表达:不要承诺无限量高优先级供给。
  • 下一步引导:进入安全。
P15

安全审计:让企业内部 AI 使用有边界、有记录、有处置

先结果数字需披露确认Gate
C 安全 / C 平台方安全能力

模型调用、Agent 工具调用和敏感输出风险都能被识别、拦截和审计。

论证:安全策略与租户 / 部门、工具白名单、Token 配额和审计记录联动。

  • Prompt 注入、越权访问、恶意工具调用、敏感输出、多租户越界。
  • 风险请求 23,412,拦截率 99.2%。
  • 工具调用白名单和外部 API 访问策略。
展开完整字段
  • 主对象:C 安全 / C 平台方
  • 销售作用:安全能力
  • 先给结果:模型调用、Agent 工具调用和敏感输出风险都能被识别、拦截和审计。
  • 后续论证:安全策略与租户 / 部门、工具白名单、Token 配额和审计记录联动。
  • 页面内容:

- Prompt 注入、越权访问、恶意工具调用、敏感输出、多租户越界。

- 风险请求 23,412,拦截率 99.2%。

- 工具调用白名单和外部 API 访问策略。

  • 视觉建议:企业 AI 安全治理闭环。
  • 素材来源:dashboard-html-materials.md 页面 4。
  • 禁止表达:不要只讲“支持审计”。
  • 下一步引导:进入推理生产底座。
P16

推理生产底座:让内部 Agent / Copilot 大规模使用时仍可控

先结果Gate
C 技术管理者 / C 平台方技术能力转业务

企业内部 Agent、Copilot 和 Workflow 规模增长后,仍能控制延迟、吞吐和单位成本。

论证:推理调度、KV Cache、模型/GPU 协同、Planner 和可观测闭环共同支撑。

  • MiniMax-M2.5:单节点 73,495 tokens/s。
  • P90 TTFT 270-490ms,P90 TPOT 19-35ms。
  • KV Cache 支撑多轮对话和长上下文成本控制。
展开完整字段
  • 主对象:C 技术管理者 / C 平台方
  • 销售作用:技术能力转业务
  • 先给结果:企业内部 Agent、Copilot 和 Workflow 规模增长后,仍能控制延迟、吞吐和单位成本。
  • 后续论证:推理调度、KV Cache、模型/GPU 协同、Planner 和可观测闭环共同支撑。
  • 页面内容:

- MiniMax-M2.5:单节点 73,495 tokens/s。

- P90 TTFT 270-490ms,P90 TPOT 19-35ms。

- KV Cache 支撑多轮对话和长上下文成本控制。

  • 视觉建议:Agent / Copilot -> AI 网关 -> 推理底座 -> Dashboard 回写。
  • 素材来源:inference-optimization-ppt-materials.mddashboard-html-materials.md
  • 禁止表达:不要把技术指标与业务结果割裂。
  • 下一步引导:进入 Dashboard / Copilot。

---

# 第四章:Dashboard / Copilot 让内部治理可见、可问、可行动

第四章:Dashboard / Copilot 让内部治理可见、可问、可行动

P17-P21 · 5 页
P17

Dashboard:企业内部 AI 使用治理驾驶舱

先结果数字需披露确认Gate
C 平台方 / B 管理者治理可见

平台团队和管理层可以看到部门、应用、Agent、预算、SLA、安全和业务价值。

论证:Dashboard 的企业内部经营版把组织、应用、Token、成本和保障指标统一展示。

  • 活跃部门、应用 / Agent、预算使用率、Showback 覆盖率。
  • 关键业务保障率 99.5%。
  • 客服中心 Copilot 月均节省人工成本约 ¥180K。
展开完整字段
  • 主对象:C 平台方 / B 管理者
  • 销售作用:治理可见
  • 先给结果:平台团队和管理层可以看到部门、应用、Agent、预算、SLA、安全和业务价值。
  • 后续论证:Dashboard 的企业内部经营版把组织、应用、Token、成本和保障指标统一展示。
  • 页面内容:

- 活跃部门、应用 / Agent、预算使用率、Showback 覆盖率。

- 关键业务保障率 99.5%。

- 客服中心 Copilot 月均节省人工成本约 ¥180K。

  • 视觉建议:企业内部经营 Dashboard 总览。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要写成监控大屏。
  • 下一步引导:进入部门与应用治理。
P18

部门与应用治理:看见谁在用、花了多少、产生什么价值

先结果Gate
B 管理者 / C 平台方业务价值证明

业务部门能看到 AI 使用与预算关系,平台团队能识别高价值和高成本应用。

论证:Dashboard 按部门、应用类型和业务价值评分展示。

  • 研发中心、智能营销、客服中心、数据平台等部门消费排行。
  • 应用类型:Agent、普通应用、Copilot、Workflow、知识助手。
  • 客服中心 Copilot 业务价值评分 A+。
展开完整字段
  • 主对象:B 管理者 / C 平台方
  • 销售作用:业务价值证明
  • 先给结果:业务部门能看到 AI 使用与预算关系,平台团队能识别高价值和高成本应用。
  • 后续论证:Dashboard 按部门、应用类型和业务价值评分展示。
  • 页面内容:

- 研发中心、智能营销、客服中心、数据平台等部门消费排行。

- 应用类型:Agent、普通应用、Copilot、Workflow、知识助手。

- 客服中心 Copilot 业务价值评分 A+。

  • 视觉建议:部门排行 + 应用类型分布 + 价值评分。
  • 素材来源:dashboard-html-materials.md 页面 1 / 2。
  • 禁止表达:不要只讲“统计分析”。
  • 下一步引导:进入 Copilot。
P19

Copilot:企业内部 MaaS 的智能工作台

先结果Gate
C 平台方 / B 管理者智能治理入口

平台团队可以直接问年度供给、部门预算、成本异常、SLA 风险和老板摘要。

论证:Copilot 继承 Dashboard、MaaS、后台和生产数据上下文,但高风险动作回后台执行。

  • 多入口:网页、桌面、语音、手机、Agent、API。
  • 可问:预算、成本、SLA、容量、模型、路由、安全、部门 / 应用用量。
  • 可输出:年度供给计划、老板摘要、成本归因、RCA、报告。
展开完整字段
  • 主对象:C 平台方 / B 管理者
  • 销售作用:智能治理入口
  • 先给结果:平台团队可以直接问年度供给、部门预算、成本异常、SLA 风险和老板摘要。
  • 后续论证:Copilot 继承 Dashboard、MaaS、后台和生产数据上下文,但高风险动作回后台执行。
  • 页面内容:

- 多入口:网页、桌面、语音、手机、Agent、API。

- 可问:预算、成本、SLA、容量、模型、路由、安全、部门 / 应用用量。

- 可输出:年度供给计划、老板摘要、成本归因、RCA、报告。

  • 视觉建议:Copilot 三栏工作台。
  • 素材来源:copilot-html-materials.md
  • 禁止表达:不要写成聊天机器人。
  • 下一步引导:进入年度供给计划。
P20

Copilot 场景:把 18 亿 Token 年度需求拆成可承诺供给计划

先结果数字需披露确认Gate
C 平台方 / C 管理层企业供给计划案例

企业可以把年度需求拆成基础供给包、弹性峰值包和高优先级保障包。

论证:Copilot 帮助定义年度需求、月度波峰、SLA 边界和成本带宽。

  • 年度需求 18 亿 Token。
  • SLA 99.9% / 高优先级保障。
  • 基础供给包 + 峰值弹性包 + 高优先级保障包。
展开完整字段
  • 主对象:C 平台方 / C 管理层
  • 销售作用:企业供给计划案例
  • 先给结果:企业可以把年度需求拆成基础供给包、弹性峰值包和高优先级保障包。
  • 后续论证:Copilot 帮助定义年度需求、月度波峰、SLA 边界和成本带宽。
  • 页面内容:

- 年度需求 18 亿 Token。

- SLA 99.9% / 高优先级保障。

- 基础供给包 + 峰值弹性包 + 高优先级保障包。

- 按季度滚动校准,避免一次性锁死全年假设。

  • 视觉建议:年度供给计划拆包图。
  • 素材来源:copilot-html-materials.md 场景 1。
  • 禁止表达:不要把年度计划讲成一次性平台交付。
  • 下一步引导:进入成本归因。
P21

Copilot 场景:成本上涨时定位模型、模板、资源池和缓存组合

先结果数字需披露确认Gate
C FinOps / C 平台方成本治理案例

成本上涨不是一句“模型贵了”,而是可以拆到模型路径、服务模板、资源池和缓存命中率。

论证:Copilot 能对比替代路由,生成成本和 SLA 影响分析。

  • DeepSeek-R1 单位 Token 成本 ¥2.34 / 1M。
  • 替代路径可能有效吞吐轻微下降,但 ROI 和毛利率更优。
  • 建议先做部分切流,不做一次性全量切换。
展开完整字段
  • 主对象:C FinOps / C 平台方
  • 销售作用:成本治理案例
  • 先给结果:成本上涨不是一句“模型贵了”,而是可以拆到模型路径、服务模板、资源池和缓存命中率。
  • 后续论证:Copilot 能对比替代路由,生成成本和 SLA 影响分析。
  • 页面内容:

- DeepSeek-R1 单位 Token 成本 ¥2.34 / 1M。

- 替代路径可能有效吞吐轻微下降,但 ROI 和毛利率更优。

- 建议先做部分切流,不做一次性全量切换。

  • 视觉建议:成本归因树 + 替代路由比较卡。
  • 素材来源:copilot-html-materials.md 场景 8 / 10。
  • 禁止表达:不要让 Copilot 直接自动改生产配置。
  • 下一步引导:进入 DaoCloud 技术可信。

---

# 第五章:DaoCloud 为什么能支撑企业级生产

第五章:DaoCloud 为什么能支撑企业级生产

P22-P24 · 3 页
P22

DaoCloud 能力:Kubernetes Top3 × vLLM Top5

先结果数字需披露确认Gate
C 技术管理者 / D可信背书

DaoCloud 能把云原生分布式系统和推理引擎优化连接成企业级模型服务生产系统。

论证:企业级内部 MaaS 需要资源调度、推理优化、网关治理、可观测和经营闭环同时成立。

  • Kubernetes Top3。
  • vLLM Top5。
  • InferX 把模型 + 硬件 + SLO 收敛成生产闭环。
展开完整字段
  • 主对象:C 技术管理者 / D
  • 销售作用:可信背书
  • 先给结果:DaoCloud 能把云原生分布式系统和推理引擎优化连接成企业级模型服务生产系统。
  • 后续论证:企业级内部 MaaS 需要资源调度、推理优化、网关治理、可观测和经营闭环同时成立。
  • 页面内容:

- Kubernetes Top3。

- vLLM Top5。

- InferX 把模型 + 硬件 + SLO 收敛成生产闭环。

  • 视觉建议:双技术底座合流图。
  • 素材来源:用户确认、inference-optimization-ppt-materials.md
  • 禁止表达:不要只炫技术排名。
  • 下一步引导:进入 Agent / Copilot 规模化案例。
P23

Agent / Copilot 规模化需要低延迟、长上下文和成本控制

先结果Gate
C 平台方 / C 技术管理者技术转业务

企业内部 Agent 和 Copilot 大规模使用时,用户体验和成本都能被控制。

论证:KV Cache、AI 网关、模型路由和推理优化共同支撑长上下文与多轮对话。

  • MiniMax-M2.5 单节点 73,495 tokens/s。
  • P90 TTFT 270-490ms,P90 TPOT 19-35ms。
  • KV Cache 是长上下文成本的关键杠杆。
展开完整字段
  • 主对象:C 平台方 / C 技术管理者
  • 销售作用:技术转业务
  • 先给结果:企业内部 Agent 和 Copilot 大规模使用时,用户体验和成本都能被控制。
  • 后续论证:KV Cache、AI 网关、模型路由和推理优化共同支撑长上下文与多轮对话。
  • 页面内容:

- MiniMax-M2.5 单节点 73,495 tokens/s。

- P90 TTFT 270-490ms,P90 TPOT 19-35ms。

- KV Cache 是长上下文成本的关键杠杆。

  • 视觉建议:Agent / Copilot 长上下文链路图。
  • 素材来源:inference-optimization-ppt-materials.mddashboard-html-materials.md
  • 禁止表达:不要只讲吞吐,不讲 Agent / Copilot 体验。
  • 下一步引导:进入交付路径。
P24

生产级路径:从模型可用到内部服务可承诺

先结果Gate
C 技术管理者交付可信

企业可以按 SLO、成本和安全边界交付内部模型服务,而不是靠一次性调参。

论证:InferX 覆盖部署、调度、加速、路由、观测、Planner 和经验库。

  • 定义业务 SLO:TTFT、TPOT、吞吐、上下文、成本边界。
  • 跑基线与搜索:模型 + 硬件 + SLO。
  • 上线观测回写:成本、SLA、稳定性进入经验库。
展开完整字段
  • 主对象:C 技术管理者
  • 销售作用:交付可信
  • 先给结果:企业可以按 SLO、成本和安全边界交付内部模型服务,而不是靠一次性调参。
  • 后续论证:InferX 覆盖部署、调度、加速、路由、观测、Planner 和经验库。
  • 页面内容:

- 定义业务 SLO:TTFT、TPOT、吞吐、上下文、成本边界。

- 跑基线与搜索:模型 + 硬件 + SLO。

- 上线观测回写:成本、SLA、稳定性进入经验库。

  • 视觉建议:企业内部模型服务上线流程。
  • 素材来源:inference-optimization-ppt-materials.md Slide 25。
  • 禁止表达:不要承诺无需客户参与即可完成治理。
  • 下一步引导:进入试点推进。

---

# 第六章:落地路径与下一步

第六章:落地路径与下一步

P25-P26 · 2 页
P25

落地方式:先选一个高价值内部 AI 场景做试点

先结果Gate
C 决策层 / C 项目负责人推进下一步

企业可以先用一个部门、一个应用群或一类 Agent 场景验证统一供给、预算和 SLA。

论证:试点需要业务价值、Token 需求、SLA、预算和安全边界同时定义。

  • 候选试点:客服 Copilot、研发 Agent、智能营销、数据平台、知识助手。
  • 定义范围:部门、应用、模型、Token 量、预算、SLA、安全策略。
  • 输出:Dashboard 治理视图、Copilot 摘要、预算分摊报告。
展开完整字段
  • 主对象:C 决策层 / C 项目负责人
  • 销售作用:推进下一步
  • 先给结果:企业可以先用一个部门、一个应用群或一类 Agent 场景验证统一供给、预算和 SLA。
  • 后续论证:试点需要业务价值、Token 需求、SLA、预算和安全边界同时定义。
  • 页面内容:

- 候选试点:客服 Copilot、研发 Agent、智能营销、数据平台、知识助手。

- 定义范围:部门、应用、模型、Token 量、预算、SLA、安全策略。

- 输出:Dashboard 治理视图、Copilot 摘要、预算分摊报告。

  • 视觉建议:试点选择矩阵。
  • 素材来源:dashboard-html-materials.mdcopilot-html-materials.md
  • 禁止表达:不要第一步就做全企业铺开。
  • 下一步引导:确认试点部门和应用。
P26

下一步:30-60-90 天建成内部 Token 供给样板

先结果Gate
C 决策层收口行动

90 天内形成一个可展示、可度量、可扩展的内部 MaaS / Token 供给样板。

论证:从需求盘点、SLO 定义、PoC、治理看板到领导汇报材料逐步推进。

  • 0-30 天:需求盘点、组织对象、应用清单、预算和 SLA。
  • 31-60 天:接入试点应用、建立 MaaS 出口、计量和 Dashboard。
  • 61-90 天:Copilot 分析、成本归因、预算分摊、试点总结和扩展计划。
展开完整字段
  • 主对象:C 决策层
  • 销售作用:收口行动
  • 先给结果:90 天内形成一个可展示、可度量、可扩展的内部 MaaS / Token 供给样板。
  • 后续论证:从需求盘点、SLO 定义、PoC、治理看板到领导汇报材料逐步推进。
  • 页面内容:

- 0-30 天:需求盘点、组织对象、应用清单、预算和 SLA。

- 31-60 天:接入试点应用、建立 MaaS 出口、计量和 Dashboard。

- 61-90 天:Copilot 分析、成本归因、预算分摊、试点总结和扩展计划。

  • 视觉建议:30-60-90 天路线图。
  • 素材来源:copilot-html-materials.md 场景 1、inference-optimization-ppt-materials.md Slide 25。
  • 禁止表达:不要最后只写“联系我们”。
  • 下一步引导:要求客户确认试点业务、平台负责人和资源范围。