单体 HTML artifact · 智算中心 · 离线可打开

Token Factory PPT 大纲 v2:面向智算中心

这是按 v2 review 建议生成的读者友好 review cockpit:先结果,后论证;Markdown 仍是 source-of-truth。

状态v2 讨论稿
用途面向地方智算中心 / 算力平台方高层的 PPT 大纲
关系基于 v1 review 调整;本版本只服务智算中心,不再混讲大型企业内部平台
目标页数28 页
听众地方智算中心领导、平台公司管理层、运营负责人、运维负责人、财务 / 投资负责人
叙事规则先结果,后论证
边界本文只输出 PPT 大纲和内容草稿,不生成最终 PPT、不写官网文案、不做视觉设计
Source Hash3d7c8b74b8d6
Generated2026-05-15 04:14:56 UTC
28分页设计
6章节
11含强数字页
v2先结果后论证

Gate Dashboard

v2 必须遵循
Result Firstv2 必须先讲使用后的决策层结果,再讲能力和案例。
Audience Split本版本只面向智算中心,不混讲企业内部平台。
C Primary主对象是 C 类智算中心,A/B 只作为下游价值证明。
MaaS BoundaryMaaS 是出口,Token Factory 是供给、经营、治理和优化系统。
Dashboard / CopilotDashboard 是经营驾驶系统;Copilot 是智能工作台。
Disclosure强数字可进内部母稿,公开前确认可披露范围。

核心判断

使用方式

本 HTML 用于一遍人工 review,不是最终 PPT。

章节地图

先结果,后论证

大纲卡片

默认摘要,按需展开完整字段

第一章:先讲经营结果

P01-P05 · 5 页
P01

用了 Token Factory,智算中心得到的不是平台,而是可经营的 Token 生意

先结果Gate
C 智算中心管理层开场结果页

智算中心可以把 GPU 资源包装成可售 Token API / 模型服务 / 套餐服务,并看到收入、毛利、SLA 和资产回本。

论证:后面再解释 MaaS 出口、计量计费、Dashboard、Copilot、推理优化如何支撑这个结果。

  • 经营目标:资源变现、客户增长、持续收入。
  • 运营目标:客户、套餐、用量、账单、SLA、毛利闭环。
  • 技术目标:更高吞吐、更低延迟、更低单位 Token 成本、更稳定生产。
展开完整字段
  • 主对象:C 智算中心管理层
  • 销售作用:开场结果页
  • 先给结果:智算中心可以把 GPU 资源包装成可售 Token API / 模型服务 / 套餐服务,并看到收入、毛利、SLA 和资产回本。
  • 后续论证:后面再解释 MaaS 出口、计量计费、Dashboard、Copilot、推理优化如何支撑这个结果。
  • 页面内容:

- 经营目标:资源变现、客户增长、持续收入。

- 运营目标:客户、套餐、用量、账单、SLA、毛利闭环。

- 技术目标:更高吞吐、更低延迟、更低单位 Token 成本、更稳定生产。

  • 视觉建议:从 GPU 资产到 Token 生意的结果链路图。
  • 素材来源:HARD_GATES.mddashboard-html-materials.md
  • 禁止表达:不要把开场写成“我们有一个 MaaS 平台”。
  • 下一步引导:让客户先确认“经营结果”是这次沟通的核心。
P02

经营结果一:同等硬件下,Token 产能和毛利被放大

先结果数字需披露确认Gate
C 管理层 / C 财务经营收益证明

同等硬件下,Token Factory 可让总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。

论证:这些增益来自集中调度、KV Cache、模型匹配、算电协同、安全网关和预算治理。

  • 总吞吐能力:1.60M tok/s -> 2.41M tok/s。
  • 单位 Token 成本:¥5.80/M -> ¥4.11/M。
  • SLA 达标率:95.2% -> 99.7%。
展开完整字段
  • 主对象:C 管理层 / C 财务
  • 销售作用:经营收益证明
  • 先给结果:同等硬件下,Token Factory 可让总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。
  • 后续论证:这些增益来自集中调度、KV Cache、模型匹配、算电协同、安全网关和预算治理。
  • 页面内容:

- 总吞吐能力:1.60M tok/s -> 2.41M tok/s。

- 单位 Token 成本:¥5.80/M -> ¥4.11/M。

- SLA 达标率:95.2% -> 99.7%。

- 日均毛利:¥198.5K -> ¥323.4K。

  • 视觉建议:Without / With Token Factory 对比卡 + 毛利增量瀑布图。
  • 素材来源:dashboard-html-materials.md 页面 1。
  • 禁止表达:不要把数字写成单纯性能跑分。
  • 下一步引导:进入“经营结果如何落到客户和资产”。
P03

经营结果二:每台机器都能回答“赚不赚钱、多久回本”

先结果数字需披露确认Gate
C 财务 / C 管理层资产经营页

智算中心可以按单机资产看到月收入、月毛利、毛利率、回本期、低效预警和扩容建议。

论证:Token Factory 把 Token 计量、模型路由、GPU 使用、成本和财务口径连到同一账本。

  • 高产资产:H100 节点月收入 ¥3.42M,月毛利 ¥1.74M,回本期 10.7 月。
  • 低效资产:A100 / L40S 节点回本期 52-60 月,需要迁移负载或优化匹配。
  • 资产状态:高产资产、健康经营、扩容观察、低效预警。
展开完整字段
  • 主对象:C 财务 / C 管理层
  • 销售作用:资产经营页
  • 先给结果:智算中心可以按单机资产看到月收入、月毛利、毛利率、回本期、低效预警和扩容建议。
  • 后续论证:Token Factory 把 Token 计量、模型路由、GPU 使用、成本和财务口径连到同一账本。
  • 页面内容:

- 高产资产:H100 节点月收入 ¥3.42M,月毛利 ¥1.74M,回本期 10.7 月。

- 低效资产:A100 / L40S 节点回本期 52-60 月,需要迁移负载或优化匹配。

- 资产状态:高产资产、健康经营、扩容观察、低效预警。

  • 视觉建议:单机资产经营矩阵。
  • 素材来源:dashboard-html-materials.md 页面 3。
  • 禁止表达:不要只讲 GPU 利用率。
  • 下一步引导:让客户关注“资产回报”而非“设备在线”。
P04

经营结果三:客户、套餐和用量可以形成增长闭环

先结果数字需披露确认Gate
C 运营客户运营结果页

智算中心能看到哪些租户在消耗、哪些套餐接近升级、哪些客户正在侵蚀 SLA,并把运营动作转成收入增长。

论证:通过 MaaS 出口、计量计费、Dashboard 和 Copilot 把客户运营闭环化。

  • 活跃租户 47,月 Token 消费 3.82T,ARPU ¥18.0K。
  • 12 个租户套餐消耗率 >90%。
  • 星辰科技套餐消耗率 92%,预计升级月增收 ¥45K。
展开完整字段
  • 主对象:C 运营
  • 销售作用:客户运营结果页
  • 先给结果:智算中心能看到哪些租户在消耗、哪些套餐接近升级、哪些客户正在侵蚀 SLA,并把运营动作转成收入增长。
  • 后续论证:通过 MaaS 出口、计量计费、Dashboard 和 Copilot 把客户运营闭环化。
  • 页面内容:

- 活跃租户 47,月 Token 消费 3.82T,ARPU ¥18.0K。

- 12 个租户套餐消耗率 >90%。

- 星辰科技套餐消耗率 92%,预计升级月增收 ¥45K。

  • 视觉建议:租户经营象限 + 套餐升级建议卡。
  • 素材来源:dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把它讲成普通 CRM。
  • 下一步引导:从客户增长进入 Token 经营闭环。
P05

经营结果四:电力约束变成经营调度能力

先结果数字需披露确认Gate
C 管理层 / C 运维 / C 财务智算中心特有结果页

功率、电价、PUE、绿电和碳账户不再只是成本约束,而是可调度的 Token 产能边界。

论证:Token Factory 通过算电协同,在电力波动中保护高价值业务、降低电费并释放额定产能。

  • 功率约束下额定产能:1.72M tok/s -> 2.10M tok/s。
  • 新增额定产能 +8.3%,月节省电费 ¥38.2K。
  • 电力水位触发低优先级降频、区域分流、紧急降载和核心业务保护。
展开完整字段
  • 主对象:C 管理层 / C 运维 / C 财务
  • 销售作用:智算中心特有结果页
  • 先给结果:功率、电价、PUE、绿电和碳账户不再只是成本约束,而是可调度的 Token 产能边界。
  • 后续论证:Token Factory 通过算电协同,在电力波动中保护高价值业务、降低电费并释放额定产能。
  • 页面内容:

- 功率约束下额定产能:1.72M tok/s -> 2.10M tok/s。

- 新增额定产能 +8.3%,月节省电费 ¥38.2K。

- 电力水位触发低优先级降频、区域分流、紧急降载和核心业务保护。

  • 视觉建议:功率水位 -> 调度策略 -> Token 产能 / 成本 / 业务保护图。
  • 素材来源:dashboard-html-materials.md 页面 7。
  • 禁止表达:不要把绿电 / 碳账户写成 ESG 装饰。
  • 下一步引导:进入“为什么传统算力平台做不到这些结果”。

---

# 第二章:为什么智算中心需要 Token Factory

第二章:为什么智算中心需要 Token Factory

P06-P09 · 4 页
P06

有 GPU,不等于有可售 Token 产能

先结果Gate
C 管理层问题定义

如果没有 Token Factory,GPU 很难稳定转成客户可购买、可计量、可承诺 SLA 的服务。

论证:问题不在单点运维,而在资产、模型、服务、计量和经营之间断裂。

  • 断点 1:GPU 在线但模型匹配、调度和利用率不稳定。
  • 断点 2:模型能跑但没有客户可消费的 MaaS 出口。
  • 断点 3:有调用但没有收入、毛利、回本期和客户运营。
展开完整字段
  • 主对象:C 管理层
  • 销售作用:问题定义
  • 先给结果:如果没有 Token Factory,GPU 很难稳定转成客户可购买、可计量、可承诺 SLA 的服务。
  • 后续论证:问题不在单点运维,而在资产、模型、服务、计量和经营之间断裂。
  • 页面内容:

- 断点 1:GPU 在线但模型匹配、调度和利用率不稳定。

- 断点 2:模型能跑但没有客户可消费的 MaaS 出口。

- 断点 3:有调用但没有收入、毛利、回本期和客户运营。

  • 视觉建议:资产 -> 产能 -> 服务 -> 收入的断裂链路。
  • 素材来源:HARD_GATES.mddashboard-html-materials.md
  • 禁止表达:不要把智算中心问题简化成“缺运维工具”。
  • 下一步引导:客户接受“需要经营系统”。
P07

裸算力竞争会越来越难,Token 服务才有经营空间

先结果Gate
C 管理层 / C 运营市场背景

智算中心要从卖裸资源,升级为区域 AI 服务商和 Token 供给运营方。

论证:本地企业、政府、产业客户真正需要的是稳定 API、模型服务、SLA、账单和服务支持。

  • 裸算力价格容易被比较,服务质量和经营能力难以复制。
  • Token API、模型服务、Agent 接入和行业应用更容易形成持续客户关系。
  • 平台需要客户、套餐、计量、结算、SLA 和安全。
展开完整字段
  • 主对象:C 管理层 / C 运营
  • 销售作用:市场背景
  • 先给结果:智算中心要从卖裸资源,升级为区域 AI 服务商和 Token 供给运营方。
  • 后续论证:本地企业、政府、产业客户真正需要的是稳定 API、模型服务、SLA、账单和服务支持。
  • 页面内容:

- 裸算力价格容易被比较,服务质量和经营能力难以复制。

- Token API、模型服务、Agent 接入和行业应用更容易形成持续客户关系。

- 平台需要客户、套餐、计量、结算、SLA 和安全。

  • 视觉建议:资源中心 -> 服务中心 -> 运营中心 -> 区域 AI 服务商阶梯图。
  • 素材来源:用户口述、source-prototype-materials.md
  • 禁止表达:不要讲成“再做一个云平台”。
  • 下一步引导:进入 Token Factory 定位。
P08

智算中心经营 Token 生意,需要三类角色协同

先结果Gate
C 管理层组织视角

运营、运维、财务必须看同一个 Token 经营事实,否则无法持续增长。

论证:Token Factory 通过 Dashboard / Copilot / 管理后台把三类角色连接起来。

  • 运营:客户、套餐、用量、订单、升级、续费。
  • 运维:资源池、模型服务、SLA、队列、缓存、故障和容量。
  • 财务:收入、成本、毛利、回本期、预算、分成。
展开完整字段
  • 主对象:C 管理层
  • 销售作用:组织视角
  • 先给结果:运营、运维、财务必须看同一个 Token 经营事实,否则无法持续增长。
  • 后续论证:Token Factory 通过 Dashboard / Copilot / 管理后台把三类角色连接起来。
  • 页面内容:

- 运营:客户、套餐、用量、订单、升级、续费。

- 运维:资源池、模型服务、SLA、队列、缓存、故障和容量。

- 财务:收入、成本、毛利、回本期、预算、分成。

  • 视觉建议:运营 / 运维 / 财务三角协同图。
  • 素材来源:HARD_GATES.mddashboard-html-materials.md
  • 禁止表达:不要只讲技术团队视角。
  • 下一步引导:进入完整产品闭环。
P09

Token Factory 的定位:GPU 资源变现的 MaaS 操作系统

先结果Gate
C 管理层产品定义

Token Factory 帮智算中心把 GPU 资源组织成可交付、可计量、可经营、可优化的 Token 产能。

论证:MaaS 是服务出口,Token Factory 是背后的工厂和经营系统。

  • 服务出口:API、模型目录、Endpoint、套餐、账单。
  • 生产系统:推理调度、网关、缓存、异构硬件、SLA。
  • 经营系统:Dashboard、Copilot、FinOps、客户运营、算电协同。
展开完整字段
  • 主对象:C 管理层
  • 销售作用:产品定义
  • 先给结果:Token Factory 帮智算中心把 GPU 资源组织成可交付、可计量、可经营、可优化的 Token 产能。
  • 后续论证:MaaS 是服务出口,Token Factory 是背后的工厂和经营系统。
  • 页面内容:

- 服务出口:API、模型目录、Endpoint、套餐、账单。

- 生产系统:推理调度、网关、缓存、异构硬件、SLA。

- 经营系统:Dashboard、Copilot、FinOps、客户运营、算电协同。

  • 视觉建议:前台 MaaS / 后台 Token Factory 工厂图。
  • 素材来源:HARD_GATES.md
  • 禁止表达:不要把 Token Factory 降级成 ToC API 门户。
  • 下一步引导:进入“产品如何支撑结果”。

---

# 第三章:Token Factory 如何把资源变成生意

第三章:Token Factory 如何把资源变成生意

P10-P16 · 7 页
P10

MaaS 服务出口:让 Token 可交付、可消费、可计量

先结果Gate
C 运营能力论证

智算中心能把模型服务包装成客户可购买和可接入的 Token 服务。

论证:MaaS 出口提供 API、模型目录、Endpoint、API Key、Usage / Billing。

  • 客户接入:API Key、OpenAI 兼容接口、模型目录、Playground。
  • 服务包装:套餐、模型服务、价格、SLA、用量账单。
  • 数据回流:用量进入计量、账单、Dashboard 和 FinOps。
展开完整字段
  • 主对象:C 运营
  • 销售作用:能力论证
  • 先给结果:智算中心能把模型服务包装成客户可购买和可接入的 Token 服务。
  • 后续论证:MaaS 出口提供 API、模型目录、Endpoint、API Key、Usage / Billing。
  • 页面内容:

- 客户接入:API Key、OpenAI 兼容接口、模型目录、Playground。

- 服务包装:套餐、模型服务、价格、SLA、用量账单。

- 数据回流:用量进入计量、账单、Dashboard 和 FinOps。

  • 视觉建议:客户调用入口到计量账单的服务流。
  • 素材来源:source-prototype-materials.md
  • 禁止表达:不要让 MaaS 抢走 Token Factory 主体。
  • 下一步引导:进入后台治理。
P11

管理后台:把经营策略变成可执行、可审计的控制面

先结果Gate
C 运营 / C 运维能力论证

智算中心可以把租户、模型、配额、计费、安全和 SLA 策略统一执行。

论证:后台不是菜单集合,而是 Token 经营策略的执行入口。

  • 租户 / 客户:等级、套餐、额度、账单、合同。
  • 模型 / 服务:模型上架、Endpoint、路由、限流、灰度、Fallback。
  • 治理 / 审计:权限、安全、策略、操作记录、风险处置。
展开完整字段
  • 主对象:C 运营 / C 运维
  • 销售作用:能力论证
  • 先给结果:智算中心可以把租户、模型、配额、计费、安全和 SLA 策略统一执行。
  • 后续论证:后台不是菜单集合,而是 Token 经营策略的执行入口。
  • 页面内容:

- 租户 / 客户:等级、套餐、额度、账单、合同。

- 模型 / 服务:模型上架、Endpoint、路由、限流、灰度、Fallback。

- 治理 / 审计:权限、安全、策略、操作记录、风险处置。

  • 视觉建议:经营策略下发到后台控制面的信息架构图。
  • 素材来源:copilot-html-materials.md 产品边界。
  • 禁止表达:不要把 Copilot 写成直接改生产配置。
  • 下一步引导:进入计量计费。
P12

计量计费:把 Token 用量转成订单、账单和分成

先结果Gate
C 财务 / C 运营商业闭环论证

Token 使用可以进入可结算账本,支撑套餐、订单、超额、续费和分成。

论证:统一 Token 计量口径连接模型成本、资源池成本、客户套餐和收入分摊。

  • 对客户:套餐消耗、账单、续费、升级。
  • 对平台:收入、成本、毛利、分成、预算。
  • 对合作:初装费 + 运维费 + Token 分成。
展开完整字段
  • 主对象:C 财务 / C 运营
  • 销售作用:商业闭环论证
  • 先给结果:Token 使用可以进入可结算账本,支撑套餐、订单、超额、续费和分成。
  • 后续论证:统一 Token 计量口径连接模型成本、资源池成本、客户套餐和收入分摊。
  • 页面内容:

- 对客户:套餐消耗、账单、续费、升级。

- 对平台:收入、成本、毛利、分成、预算。

- 对合作:初装费 + 运维费 + Token 分成。

  • 视觉建议:Token 计量 -> 账单 -> 分成 -> 毛利的闭环。
  • 素材来源:dashboard-html-materials.md 页面 2 / 3、copilot-html-materials.md 场景 2。
  • 禁止表达:不要只讲“计费模块”。
  • 下一步引导:进入 Dashboard 经营驾驶。
P13

AI 网关:把模型服务变成可售卖、可治理、可承诺 SLA 的生产服务

先结果Gate
C 运维 / C 技术管理者生产能力论证

客户买到的不是“能跑的模型”,而是稳定、可授权、可降级、可审计的 Token 服务。

论证:AI 网关承担鉴权、模型授权、路由、限流、熔断、Fallback、审计和成本归因。

  • 可靠路由:实例负载均衡、失败降级、模型级 Fallback。
  • 访问治理:Consumer 鉴权、模型授权、API Token 健康管理。
  • 成本联动:按照模型、租户、资源池做成本归因。
展开完整字段
  • 主对象:C 运维 / C 技术管理者
  • 销售作用:生产能力论证
  • 先给结果:客户买到的不是“能跑的模型”,而是稳定、可授权、可降级、可审计的 Token 服务。
  • 后续论证:AI 网关承担鉴权、模型授权、路由、限流、熔断、Fallback、审计和成本归因。
  • 页面内容:

- 可靠路由:实例负载均衡、失败降级、模型级 Fallback。

- 访问治理:Consumer 鉴权、模型授权、API Token 健康管理。

- 成本联动:按照模型、租户、资源池做成本归因。

  • 视觉建议:请求经网关路由到不同模型服务和 GPU 池。
  • 素材来源:inference-optimization-ppt-materials.md Slide 12。
  • 禁止表达:不要写成普通 API Gateway。
  • 下一步引导:进入推理优化。
P14

推理优化:同样的卡,产出更多 Token,成本更低

先结果Gate
C 管理层 / C 运维 / C 财务技术转经营

同样的 GPU 成本,通过吞吐、利用率、缓存和调度优化,可以提升收入上限和毛利空间。

论证:DaoCloud 把 Kubernetes 调度能力和 vLLM 推理引擎能力接成生产系统。

  • 单卡经营账本:H200 / DeepSeek 单卡月收入 0.52 万 -> 0.93 万,成本 0.68 万不变。
  • 推理指标:TTFT / TPOT / 吞吐 / 利用率最终都要转成客户体验和单位 Token 成本。
  • 技术抓手:PD 分离、KV Cache、Planner、模型/GPU 匹配。
展开完整字段
  • 主对象:C 管理层 / C 运维 / C 财务
  • 销售作用:技术转经营
  • 先给结果:同样的 GPU 成本,通过吞吐、利用率、缓存和调度优化,可以提升收入上限和毛利空间。
  • 后续论证:DaoCloud 把 Kubernetes 调度能力和 vLLM 推理引擎能力接成生产系统。
  • 页面内容:

- 单卡经营账本:H200 / DeepSeek 单卡月收入 0.52 万 -> 0.93 万,成本 0.68 万不变。

- 推理指标:TTFT / TPOT / 吞吐 / 利用率最终都要转成客户体验和单位 Token 成本。

- 技术抓手:PD 分离、KV Cache、Planner、模型/GPU 匹配。

  • 视觉建议:单卡收入成本对比图。
  • 素材来源:inference-optimization-ppt-materials.md Slide 3。
  • 禁止表达:不要讲 benchmark 而不讲经营账。
  • 下一步引导:进入异构硬件和国产算力。
P15

异构硬件:把存量卡、新卡和国产卡统一变成可售产能

先结果数字需披露确认Gate
C 运维 / C 管理层智算中心适配能力

智算中心已有的异构资源可以被纳管、匹配和优化,减少闲置和错配损耗。

论证:Token Factory 通过模型/GPU 协同、异构调度和推理优化保护既有投资。

  • H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。
  • 海光 DCU:吞吐 ↑49.5%,TPOT ↓50.3%。
  • A800:TPS ↑1.2x-2.1x,成本 ↓约 40%。
展开完整字段
  • 主对象:C 运维 / C 管理层
  • 销售作用:智算中心适配能力
  • 先给结果:智算中心已有的异构资源可以被纳管、匹配和优化,减少闲置和错配损耗。
  • 后续论证:Token Factory 通过模型/GPU 协同、异构调度和推理优化保护既有投资。
  • 页面内容:

- H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。

- 海光 DCU:吞吐 ↑49.5%,TPOT ↓50.3%。

- A800:TPS ↑1.2x-2.1x,成本 ↓约 40%。

  • 视觉建议:异构资源池 -> 统一 Token 产能池图。
  • 素材来源:inference-optimization-ppt-materials.md 案例。
  • 禁止表达:不要只写“支持多硬件”。
  • 下一步引导:进入算电和安全。
P16

安全治理:保护可售产能和多租户边界

先结果数字需披露确认Gate
C 安全 / C 运维商用保障

Token 服务可以在多租户和 Agent 场景下保护客户隔离、业务连续性和审计闭环。

论证:安全治理覆盖 Prompt 注入、越权访问、恶意工具调用、敏感输出和多租户越界。

  • 今日总请求 18.7M,风险请求 23,412,拦截率 99.2%。
  • 被保护业务 97.8%,安全事件闭环率 85.7%。
  • 安全策略与配额、审计、租户等级联动。
展开完整字段
  • 主对象:C 安全 / C 运维
  • 销售作用:商用保障
  • 先给结果:Token 服务可以在多租户和 Agent 场景下保护客户隔离、业务连续性和审计闭环。
  • 后续论证:安全治理覆盖 Prompt 注入、越权访问、恶意工具调用、敏感输出和多租户越界。
  • 页面内容:

- 今日总请求 18.7M,风险请求 23,412,拦截率 99.2%。

- 被保护业务 97.8%,安全事件闭环率 85.7%。

- 安全策略与配额、审计、租户等级联动。

  • 视觉建议:风险请求漏斗 + 治理动作卡。
  • 素材来源:dashboard-html-materials.md 页面 4。
  • 禁止表达:不要把安全写成合规勾选项。
  • 下一步引导:进入运营驾驶。

---

# 第四章:Dashboard / Copilot 让经营可见、可问、可行动

第四章:Dashboard / Copilot 让经营可见、可问、可行动

P17-P22 · 6 页
P17

Dashboard:经营驾驶系统,不是监控大屏

先结果Gate
C 管理层 / C 运营 / C 财务运营能力证明

领导能直接看到产能、收入、毛利、价值归因、风险和预测。

论证:Dashboard 把 GPU、模型、Token、租户、成本、电力、安全和财务指标放到一个经营视角。

  • 经营价值:实时吞吐、今日收入、今日毛利、月末预测。
  • 业务经营:租户、套餐、ARPU、客户升级。
  • FinOps:收入、成本、毛利、预算、ROI、回本期。
展开完整字段
  • 主对象:C 管理层 / C 运营 / C 财务
  • 销售作用:运营能力证明
  • 先给结果:领导能直接看到产能、收入、毛利、价值归因、风险和预测。
  • 后续论证:Dashboard 把 GPU、模型、Token、租户、成本、电力、安全和财务指标放到一个经营视角。
  • 页面内容:

- 经营价值:实时吞吐、今日收入、今日毛利、月末预测。

- 业务经营:租户、套餐、ARPU、客户升级。

- FinOps:收入、成本、毛利、预算、ROI、回本期。

  • 视觉建议:经营驾驶舱三层结构。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要叫“监控大屏”。
  • 下一步引导:进入客户运营视图。
P18

客户经营 Dashboard:找到增长客户,也识别侵蚀 SLA 的客户

先结果Gate
C 运营运营场景证明

平台能找到套餐升级机会、低价值高占用客户和高优先级容量压力。

论证:租户、模型、GPU、Token 输出和收入贡献在同一张视图里关联。

  • 租户排行、收入贡献、套餐消耗率。
  • 租户 -> 模型 -> GPU -> Token 输出的 Sankey 链路。
  • Copilot 可继续问“哪个租户正在侵蚀 SLA”。
展开完整字段
  • 主对象:C 运营
  • 销售作用:运营场景证明
  • 先给结果:平台能找到套餐升级机会、低价值高占用客户和高优先级容量压力。
  • 后续论证:租户、模型、GPU、Token 输出和收入贡献在同一张视图里关联。
  • 页面内容:

- 租户排行、收入贡献、套餐消耗率。

- 租户 -> 模型 -> GPU -> Token 输出的 Sankey 链路。

- Copilot 可继续问“哪个租户正在侵蚀 SLA”。

  • 视觉建议:租户象限 + SLA 侵蚀提示。
  • 素材来源:dashboard-html-materials.md 页面 2、copilot-html-materials.md 场景 11。
  • 禁止表达:不要只展示客户列表。
  • 下一步引导:进入资产和财务视角。
P19

FinOps:让智算中心按 Token 口径经营收入、成本和毛利

先结果数字需披露确认Gate
C 财务 / C 管理层财务可信证明

财务能看到本月收入、成本、毛利、单位 Token 收益和成本回收率。

论证:FinOps 连接计量、账单、资源成本、模型成本和资产折旧。

  • 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。
  • 单位 Token 成本 ¥4.11/百万,收入 ¥6.66/百万,毛利 ¥2.55/百万。
  • 成本回收率 161.3%。
展开完整字段
  • 主对象:C 财务 / C 管理层
  • 销售作用:财务可信证明
  • 先给结果:财务能看到本月收入、成本、毛利、单位 Token 收益和成本回收率。
  • 后续论证:FinOps 连接计量、账单、资源成本、模型成本和资产折旧。
  • 页面内容:

- 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。

- 单位 Token 成本 ¥4.11/百万,收入 ¥6.66/百万,毛利 ¥2.55/百万。

- 成本回收率 161.3%。

  • 视觉建议:单位 Token 经济性卡片。
  • 素材来源:dashboard-html-materials.md 页面 3。
  • 禁止表达:不要把 FinOps 写成成本报表。
  • 下一步引导:进入 Copilot 的行动能力。
P20

Copilot:让运营和运维直接问毛利、容量、路由和 SLA

先结果Gate
C 运营 / C 运维智能运营证明

复杂经营问题可以用自然语言快速定位原因、生成建议和报告。

论证:Copilot 连接 Dashboard、MaaS、管理后台和生产数据,但高风险动作回后台执行。

  • 可问:毛利、SLA、容量、路由、缓存、预算、安全、模型、租户、异常。
  • 可输出:毛利报告、12 小时容量预测、老板摘要、分成草案、RCA。
  • 动作边界:建议和草案由 Copilot 生成,生产变更在后台执行。
展开完整字段
  • 主对象:C 运营 / C 运维
  • 销售作用:智能运营证明
  • 先给结果:复杂经营问题可以用自然语言快速定位原因、生成建议和报告。
  • 后续论证:Copilot 连接 Dashboard、MaaS、管理后台和生产数据,但高风险动作回后台执行。
  • 页面内容:

- 可问:毛利、SLA、容量、路由、缓存、预算、安全、模型、租户、异常。

- 可输出:毛利报告、12 小时容量预测、老板摘要、分成草案、RCA。

- 动作边界:建议和草案由 Copilot 生成,生产变更在后台执行。

  • 视觉建议:三栏 Copilot 工作台。
  • 素材来源:copilot-html-materials.md
  • 禁止表达:不要写成聊天机器人或自动改生产配置。
  • 下一步引导:进入两个具体 Copilot 场景。
P21

Copilot 场景:毛利下降时,先归因再行动

先结果数字需披露确认Gate
C 运营 / C 财务智能经营案例

毛利变差时,Copilot 能按影响大小拆出模型成本、租户结构和缓存命中率问题。

论证:系统不是只告诉你“毛利下降”,而是给出可执行的经营分析方案。

  • 毛利率 34.7%,有效吞吐 18.4M Token/分钟。
  • DeepSeek-R1 高成本路径占比上升。
  • research-lab 租户挤占高优先级容量。
展开完整字段
  • 主对象:C 运营 / C 财务
  • 销售作用:智能经营案例
  • 先给结果:毛利变差时,Copilot 能按影响大小拆出模型成本、租户结构和缓存命中率问题。
  • 后续论证:系统不是只告诉你“毛利下降”,而是给出可执行的经营分析方案。
  • 页面内容:

- 毛利率 34.7%,有效吞吐 18.4M Token/分钟。

- DeepSeek-R1 高成本路径占比上升。

- research-lab 租户挤占高优先级容量。

- KV Cache 命中率 78% -> 72%。

  • 视觉建议:影响排序卡 + 建议动作卡。
  • 素材来源:copilot-html-materials.md 场景 3。
  • 禁止表达:不要把“系统更忙”误写成经营更好。
  • 下一步引导:进入容量高峰场景。
P22

Copilot 场景:高峰容量先改路由,再限流,最后扩容

先结果数字需披露确认Gate
C 运维 / C 运营智能运维案例

流量上涨 30% 时,系统给出保护 ROI 的执行顺序,而不是直接建议加机器。

论证:Copilot 同时看 GPU 池、租户、模型、队列、路由和可售容量。

  • pool-a100-prod 86% 高占用。
  • 可售容量预计只支撑 2.4 小时。
  • 建议先改路由,再限流或转低成本模型池,最后评估扩容。
展开完整字段
  • 主对象:C 运维 / C 运营
  • 销售作用:智能运维案例
  • 先给结果:流量上涨 30% 时,系统给出保护 ROI 的执行顺序,而不是直接建议加机器。
  • 后续论证:Copilot 同时看 GPU 池、租户、模型、队列、路由和可售容量。
  • 页面内容:

- pool-a100-prod 86% 高占用。

- 可售容量预计只支撑 2.4 小时。

- 建议先改路由,再限流或转低成本模型池,最后评估扩容。

  • 视觉建议:容量预测 + 动作优先级阶梯。
  • 素材来源:copilot-html-materials.md 场景 4。
  • 禁止表达:不要把扩容作为唯一答案。
  • 下一步引导:进入 DaoCloud 技术可信。

---

# 第五章:DaoCloud 为什么能交付结果

第五章:DaoCloud 为什么能交付结果

P23-P26 · 4 页
P23

DaoCloud 的底层优势:Kubernetes Top3 × vLLM Top5

先结果数字需披露确认Gate
C 决策层 / C 技术管理者可信背书

DaoCloud 能把云原生资源调度和推理引擎优化连接成生产系统。

论证:智算中心需要的不是单点引擎,而是跨资源、模型、网关、观测和经营的系统级能力。

  • Kubernetes Top3:资源池化、调度、队列、容错、可观测。
  • vLLM Top5:推理引擎、KV Cache、PD 分离、吞吐优化。
  • InferX:把模型 + 硬件 + SLO 变成可复制部署路径。
展开完整字段
  • 主对象:C 决策层 / C 技术管理者
  • 销售作用:可信背书
  • 先给结果:DaoCloud 能把云原生资源调度和推理引擎优化连接成生产系统。
  • 后续论证:智算中心需要的不是单点引擎,而是跨资源、模型、网关、观测和经营的系统级能力。
  • 页面内容:

- Kubernetes Top3:资源池化、调度、队列、容错、可观测。

- vLLM Top5:推理引擎、KV Cache、PD 分离、吞吐优化。

- InferX:把模型 + 硬件 + SLO 变成可复制部署路径。

  • 视觉建议:Kubernetes 能力与 vLLM 能力合流图。
  • 素材来源:用户确认、inference-optimization-ppt-materials.md
  • 禁止表达:不要只炫排名。
  • 下一步引导:进入生产闭环。
P24

InferX:把推理优化收敛成生产闭环

先结果Gate
C 技术管理者 / C 运维交付可信

模型和硬件组合不需要每次从零摸索,可以沉淀为可验证、可复用的生产路径。

论证:InferX 覆盖部署、调度、加速、路由、观测和 Planner 回写。

  • 部署:well-lit path / Helm / 模型服务。
  • 调度:LWS / Kueue / DRA / HAMi。
  • 加速:PD 分离、KV Cache、量化、Kernel。
展开完整字段
  • 主对象:C 技术管理者 / C 运维
  • 销售作用:交付可信
  • 先给结果:模型和硬件组合不需要每次从零摸索,可以沉淀为可验证、可复用的生产路径。
  • 后续论证:InferX 覆盖部署、调度、加速、路由、观测和 Planner 回写。
  • 页面内容:

- 部署:well-lit path / Helm / 模型服务。

- 调度:LWS / Kueue / DRA / HAMi。

- 加速:PD 分离、KV Cache、量化、Kernel。

- 回写:SLO、成本、租户和调优经验库。

  • 视觉建议:InferX 生产闭环飞轮。
  • 素材来源:inference-optimization-ppt-materials.md Slide 8。
  • 禁止表达:不要讲成“我们有推理引擎”。
  • 下一步引导:进入案例矩阵。
P25

五类案例证明:不同硬件都能转成可售 Token 产能

先结果数字需披露确认Gate
C 决策层 / D案例证明

DaoCloud 能在新架构、异构集群、国产 DCU 和成熟 A800 上拿到量化收益。

论证:案例覆盖智算中心最关心的存量资产保护、国产算力商业化和先进硬件扩展。

  • H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。
  • GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。
  • MiniMax-M2.5:单节点 73,495 tokens/s。
展开完整字段
  • 主对象:C 决策层 / D
  • 销售作用:案例证明
  • 先给结果:DaoCloud 能在新架构、异构集群、国产 DCU 和成熟 A800 上拿到量化收益。
  • 后续论证:案例覆盖智算中心最关心的存量资产保护、国产算力商业化和先进硬件扩展。
  • 页面内容:

- H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。

- GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。

- MiniMax-M2.5:单节点 73,495 tokens/s。

- 海光 DCU:吞吐 ↑49.5%,TPOT ↓50.3%。

- A800:TPS ↑1.2x-2.1x,成本 ↓约 40%。

  • 视觉建议:五张案例卡片。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要展开工程缩写清单。
  • 下一步引导:进入智算中心合作模式。
P26

交付不是安装软件,而是跑通样板经营闭环

先结果Gate
C 管理层 / C 项目负责人降低落地疑虑

DaoCloud 会帮助智算中心从资源盘点走到样板客户、计量结算和经营测算。

论证:交付路径围绕“可售 Token 产能”和“经营闭环”定义,而不是围绕功能清单。

  • 资源盘点:GPU / NPU / DCU、模型、网络、存储、电力、现有平台。
  • SLO 定义:TTFT、TPOT、吞吐、成本、SLA、安全。
  • 经营口径:客户、套餐、计量、结算、毛利、回本期。
展开完整字段
  • 主对象:C 管理层 / C 项目负责人
  • 销售作用:降低落地疑虑
  • 先给结果:DaoCloud 会帮助智算中心从资源盘点走到样板客户、计量结算和经营测算。
  • 后续论证:交付路径围绕“可售 Token 产能”和“经营闭环”定义,而不是围绕功能清单。
  • 页面内容:

- 资源盘点:GPU / NPU / DCU、模型、网络、存储、电力、现有平台。

- SLO 定义:TTFT、TPOT、吞吐、成本、SLA、安全。

- 经营口径:客户、套餐、计量、结算、毛利、回本期。

  • 视觉建议:资源盘点 -> PoC -> 样板闭环路线。
  • 素材来源:inference-optimization-ppt-materials.md Slide 25。
  • 禁止表达:不要承诺一次安装即经营成功。
  • 下一步引导:进入合作模式。

---

# 第六章:合作模式与下一步

第六章:合作模式与下一步

P27-P28 · 2 页
P27

合作模式:建设费、运维费和 Token 分成绑定经营结果

先结果Gate
C 管理层 / C 财务商业合作

智算中心可以通过“前期建设 + 持续运维 + Token 分成”把软件采购变成经营合作。

论证:Token Factory 能提供统一计量、结算口径和经营数据,使分成可核算。

  • 初装费:覆盖项目建设和平台上线。
  • 运维费:覆盖持续承接、运行保障和优化。
  • Token 分成:绑定 Token 供给与经营结果。
展开完整字段
  • 主对象:C 管理层 / C 财务
  • 销售作用:商业合作
  • 先给结果:智算中心可以通过“前期建设 + 持续运维 + Token 分成”把软件采购变成经营合作。
  • 后续论证:Token Factory 能提供统一计量、结算口径和经营数据,使分成可核算。
  • 页面内容:

- 初装费:覆盖项目建设和平台上线。

- 运维费:覆盖持续承接、运行保障和优化。

- Token 分成:绑定 Token 供给与经营结果。

  • 视觉建议:三段式商业合作模型。
  • 素材来源:copilot-html-materials.md 场景 2。
  • 禁止表达:不要只写“License 销售”。
  • 下一步引导:确认一个样板场景。
P28

下一步:90 天跑通一个可复制样板

先结果Gate
C 决策层推进下一步

90 天内形成一个可展示、可测算、可复用的 Token 经营样板。

论证:以具体资源和客户场景为输入,输出 PoC、经营测算和领导决策材料。

  • 0-30 天:资源盘点、客户场景选择、SLO 和计量口径定义。
  • 31-60 天:部署 PoC、建立 MaaS 出口、接入样板租户。
  • 61-90 天:Dashboard / Copilot 运营、经营测算、合作模式草案。
展开完整字段
  • 主对象:C 决策层
  • 销售作用:推进下一步
  • 先给结果:90 天内形成一个可展示、可测算、可复用的 Token 经营样板。
  • 后续论证:以具体资源和客户场景为输入,输出 PoC、经营测算和领导决策材料。
  • 页面内容:

- 0-30 天:资源盘点、客户场景选择、SLO 和计量口径定义。

- 31-60 天:部署 PoC、建立 MaaS 出口、接入样板租户。

- 61-90 天:Dashboard / Copilot 运营、经营测算、合作模式草案。

  • 视觉建议:90 天路线图。
  • 素材来源:copilot-html-materials.mdinference-optimization-ppt-materials.md
  • 禁止表达:不要最后只放联系方式。
  • 下一步引导:要求客户确认样板租户、资源池和经营目标。