单体 HTML artifact · 一遍 review · 离线可打开

Token Factory 产品功能增强版 PPT 大纲 v1

这是为演示和人工审阅优化的 review cockpit:先看总览、gate 和三条 review 路径,再按章节 drill down。它不是最终 PPT,也不替代原始 Markdown。

状态v1 讨论稿
用途产研团队提供给市场团队的产品力素材母稿,供后续裁剪成销售 PPT、官网、白皮书、Demo 脚本和售前资料
关系保留 sales-ppt-outline-v1.md,本文不是覆盖版,而是产品功能展开更多的新版本
建议页数42 页素材母稿;市场团队对外销售拜访时可裁剪回 25-30 页
听众市场团队、售前团队、销售团队、产品与研发团队;最终加工对象仍是地方智算中心和大型企业高层
权重地方智算中心约 60%,大型企业内部 MaaS / Token 供给平台约 40%
边界本文只输出 PPT 大纲和内容草稿,不生成最终 PPT、不写官网完整文案、不做视觉设计
Source Hash2b3637b17fab
Generated2026-05-14 04:48:21 UTC

一遍 review 的读法

先骨架,后细节。默认看骨干路径和 Gate Dashboard;只有需要追素材时,再展开对应页卡的完整字段。

定位
两类 C
能力地图
产品模块
交付可信

边界提醒

这个 HTML 是展示 artifact。版本维护、决策记录和后续增删改仍以 product-feature-ppt-outline-v1.md 为准。

42分页设计
7章节
60/40地方智算 / 大型企业
42含强数字页

Gate Dashboard

演示时常驻的红队边界
C PrimaryC 是采购和运营主体,A/B 只是价值证明。
60/40地方智算中心约 60%,大型企业约 40%。
MaaS BoundaryMaaS 是出口,Token Factory 是工厂。
DashboardDashboard 是经营驾驶系统,不是监控大屏。
CopilotCopilot 是智能工作台,不直接执行高风险生产变更。
SourceMarkdown 是 source-of-truth,HTML 只用于 review 和分享。
Disclosure强数字可进内部母稿,公开前需确认披露范围。

三条 review 路径

避免连续滚 42 页

Narrative Spine

P01-P04、P10-P12、P22、P29、P33、P41-P42。用于快速检查主线有没有跑偏。

Sales Cut

优先看后续可裁剪成 25-30 页销售拜访版的页卡。

Full Material Review

完整检查 42 页,适合市场团队二次加工前逐页核对。

章节地图

从长文转为可扫读的信息架构

这一版要比销售拜访版更体现 Token Factory 的产品力和产研专业度,但不能变成产品手册。

Token Factory 的核心不是“提供一个 MaaS 门户”,而是把 GPU / NPU / DCU 资源、模型服务、推理优化、AI 网关、计量计费、Dashboard、Copilot、FinOps、安全、算电协同和交付方法组织成一套可供给、可治理、可经营、可持续优化的 Token 生产与经营系统。

市场团队后续加工时,应从本文中裁剪不同版本:

  • 销售拜访版:保留经营叙事、关键产品闭环、技术可信和下一步推进。
  • 官网版:保留产品定位、两类 C 场景、产品模块、技术先进性和联系转化。
  • 产品白皮书版:保留完整能力地图、Dashboard / Copilot / 计量 / FinOps / 交付路径。
  • Demo 脚本版:保留 Dashboard、Copilot、MaaS 出口、管理后台和典型数据。

本文仍遵守原主线,不从功能清单开场:

  1. 先讲 Token Factory 的定位与角色,不让市场团队误写成 ToC MaaS。
  2. 再讲两类 C 客户的经营问题,保持地方智算中心 60%、大型企业 40%。
  3. 接着讲产品全景与模块协作,说明 Token Factory 是一个系统。
  4. 深入展开 MaaS 出口、管理后台、计量计费、Dashboard、Copilot。
  5. 再讲推理生产、AI 网关、SLO、KV Cache、模型/GPU 协同、安全、算电协同。
  6. 最后讲落地路径、DaoCloud 技术可信和 90 天推进。

42 页大纲卡片

默认摘要,按需展开完整字段

第一章:定位与角色框架

P01-P04 · 4 页
P01

Token Factory:把 GPU、模型和运营组织成 Token 供给系统

骨干页销售裁剪数字需披露确认Gate
C 管理层产品总定位地方智算中心 60%,大型企业 40%

Token Factory 是把资源、模型、推理、计量、治理和经营组织起来的 Token 供给系统。

地方 60% / 企业 40%
  • Token Factory 管的不是单个模型服务,而是从资源到 Token 再到经营结果的完整链路。
  • 对地方智算中心,它帮助 GPU 资源形成对外可售卖的 MaaS 服务。
  • 对大型企业,它帮助内部 AI 能力形成统一供给、预算分摊和治理体系。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业 AI 平台负责人
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:产品总定位
  • 经营 / 治理问题:客户已有 GPU / 模型 / 平台,但缺少稳定、可计量、可经营的 Token 供给系统。
  • 一句话结论:Token Factory 是把资源、模型、推理、计量、治理和经营组织起来的 Token 供给系统。
  • 页面内容:

- Token Factory 管的不是单个模型服务,而是从资源到 Token 再到经营结果的完整链路。

- 对地方智算中心,它帮助 GPU 资源形成对外可售卖的 MaaS 服务。

- 对大型企业,它帮助内部 AI 能力形成统一供给、预算分摊和治理体系。

  • 可复用素材:产品口号可保留“GPU 资源变现与内部供给的 MaaS 操作系统”。
  • 视觉建议:中心为 Token Factory,左侧资源与模型,右侧 API、应用、Agent、部门、客户、收入 / 内部价值。
  • 素材来源与状态:HARD_GATES.md,用户确认定位。
  • 禁止表达:不要写成“模型 API 商店”“开发者平台”“推理平台换名”。
  • 市场加工提示:适合作为封面或官网 Hero 的定位基础,但官网文案后续再单独打磨。
P02

MaaS 是出口,Token Factory 是背后的工厂

骨干页销售裁剪数字需披露确认Gate
C 管理层MaaS 出口与系统边界地方智算中心 60%,大型企业 40%

MaaS 只是客户消费 Token 的出口,Token Factory 才是把资源生产成稳定 Token 产能的工厂。

地方 60% / 企业 40%
  • MaaS 负责 API、模型目录、Endpoint、Usage / Billing 等消费入口。
  • Token Factory 负责资源调度、推理优化、计量计费、租户治理、Dashboard、Copilot、FinOps 和安全。
  • 没有工厂能力,MaaS 只能是门户;有了工厂能力,MaaS 才能稳定交付和持续经营。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心运营方、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:MaaS 出口与系统边界
  • 经营 / 治理问题:客户容易把 MaaS 理解成 ToC API 门户,忽略背后的供给、治理和经营能力。
  • 一句话结论:MaaS 只是客户消费 Token 的出口,Token Factory 才是把资源生产成稳定 Token 产能的工厂。
  • 页面内容:

- MaaS 负责 API、模型目录、Endpoint、Usage / Billing 等消费入口。

- Token Factory 负责资源调度、推理优化、计量计费、租户治理、Dashboard、Copilot、FinOps 和安全。

- 没有工厂能力,MaaS 只能是门户;有了工厂能力,MaaS 才能稳定交付和持续经营。

  • 可复用素材:MaaS 是出口,Token Factory 是工厂
  • 视觉建议:前台门店 / 后台工厂式结构图,前台是 API 与应用,后台是生产、治理、经营系统。
  • 素材来源与状态:HARD_GATES.mdcopilot-html-materials.md
  • 禁止表达:不要把 MaaS 写成主产品,不要让 Token Factory 被降级成 API 网关。
  • 市场加工提示:这页是市场团队避免跑偏的核心页。
P03

A/B/C/D 角色图:C 是采购运营主体,A/B 是价值证明

骨干页销售裁剪数字需披露确认Gate
C 管理层用户与角色框架地方智算中心 60%,大型企业 40%

Token Factory 的主客户是 C,A/B 证明 C 买了以后能产生价值,D 证明 DaoCloud 能把它做成长期业务。

地方 60% / 企业 40%
  • A:真正使用 Token 的终端用户,可能直接调用 API,也可能通过 OpenClaw、Agent、Copilot、Workflow 使用。
  • B:企业内部使用与管理组织,关注部门、应用、预算、成本、统计和治理。
  • C:采购与运营主体,当前优先地方智算中心,也覆盖大型企业内部平台方。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:用户与角色框架
  • 经营 / 治理问题:如果不区分 A/B/C/D,市场材料容易把终端体验当成主线。
  • 一句话结论:Token Factory 的主客户是 C,A/B 证明 C 买了以后能产生价值,D 证明 DaoCloud 能把它做成长期业务。
  • 页面内容:

- A:真正使用 Token 的终端用户,可能直接调用 API,也可能通过 OpenClaw、Agent、Copilot、Workflow 使用。

- B:企业内部使用与管理组织,关注部门、应用、预算、成本、统计和治理。

- C:采购与运营主体,当前优先地方智算中心,也覆盖大型企业内部平台方。

- D:DaoCloud 和投资 / 战略视角,关注技术领先、产品化、可复制商业模式和平台订单。

  • 可复用素材:A/B/C/D 定义表。
  • 视觉建议:四象限角色图,C 放中心,A/B 放右侧价值证明,D 放底部可信与增长逻辑。
  • 素材来源与状态:用户口述、HARD_GATES.md
  • 禁止表达:不要把 A/B 写成采购主线。
  • 市场加工提示:所有后续页面都应能回到这张角色图。
P04

两类 C:地方智算中心对外经营,大型企业内部供给

骨干页销售裁剪数字需披露确认Gate
C 管理层核心场景框架地方智算中心 60%,大型企业 40%

地方智算中心看重资源变现,大型企业看重内部 AI 供给治理;两者是同一套系统的两种经营目标。

地方 60% / 企业 40%
  • 地方智算中心:客户、套餐、计量、结算、毛利、资产回本、算电协同。
  • 大型企业:部门、预算、Showback / Chargeback、应用 / Agent 接入、SLA、安全、审计。
  • 共性能力:MaaS 出口、管理后台、Dashboard、Copilot、推理生产、FinOps、安全和可观测。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:核心场景框架
  • 经营 / 治理问题:两类客户目标不同,但底层都需要 Token 供给、计量、治理和优化系统。
  • 一句话结论:地方智算中心看重资源变现,大型企业看重内部 AI 供给治理;两者是同一套系统的两种经营目标。
  • 页面内容:

- 地方智算中心:客户、套餐、计量、结算、毛利、资产回本、算电协同。

- 大型企业:部门、预算、Showback / Chargeback、应用 / Agent 接入、SLA、安全、审计。

- 共性能力:MaaS 出口、管理后台、Dashboard、Copilot、推理生产、FinOps、安全和可观测。

  • 可复用素材:60/40 场景权重。
  • 视觉建议:左右对照表,中间共享 Token Factory 能力栈。
  • 素材来源与状态:HARD_GATES.md
  • 禁止表达:不要把大型企业做成附录,也不要把地方智算中心讲成单纯 IDC 运维。
  • 市场加工提示:适合作为所有方案材料的场景导航页。

---

# 第二章:两类 C 客户经营问题

第二章:两类 C 客户经营问题

P05-P09 · 5 页
P05

地方智算中心:有资源不等于有可售 Token 产能

销售裁剪数字需披露确认Gate
C 管理层地方智算中心场景地方智算中心 100%,大型企业 0%

地方智算中心要从“有算力”升级为“能持续交付 Token 服务并经营客户”。

地方 100% / 企业 -%
  • 资源侧:GPU / NPU / DCU、国产卡、存量卡、新卡、电力和机房。
  • 市场侧:政府、产业客户、本地企业、开发者、AI 应用服务商。
  • 缺口:客户接入、模型服务、计量计费、套餐、SLA、毛利、回本期。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、C 运营、C 财务
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 功能归属:地方智算中心场景
  • 经营 / 治理问题:GPU 资产、机房、电力和地方客户资源没有自然变成可售服务。
  • 一句话结论:地方智算中心要从“有算力”升级为“能持续交付 Token 服务并经营客户”。
  • 页面内容:

- 资源侧:GPU / NPU / DCU、国产卡、存量卡、新卡、电力和机房。

- 市场侧:政府、产业客户、本地企业、开发者、AI 应用服务商。

- 缺口:客户接入、模型服务、计量计费、套餐、SLA、毛利、回本期。

  • 可复用素材:资源中心到区域 AI 服务商的升级路径。
  • 视觉建议:升级阶梯:资源中心 -> Token 生产中心 -> MaaS 运营中心 -> 区域 AI 服务商。
  • 素材来源与状态:用户口述、dashboard-html-materials.md
  • 禁止表达:不要只讲“纳管 GPU 集群”。
  • 市场加工提示:销售场景中可保留,官网可裁剪成地方智算中心场景页。
P06

地方智算经营闭环:客户、套餐、用量、结算、毛利、SLA 必须连起来

销售裁剪数字需披露确认Gate
C 运营经营闭环地方智算中心 100%,大型企业 0%

Token 生意必须把客户承接、Token 计量、费用结算、SLA 和毛利放在同一条链路里。

地方 100% / 企业 -%
  • 客户获取:企业客户、AI 应用、Agent、区域生态。
  • 商业包装:API Key、模型服务、套餐、订单、账单、分成。
  • 供给保障:SLA、容量、功率、风险防护、模型路由。
展开完整字段和演示提示
  • 主对象:C 运营
  • C 类细分:地方智算中心运营、C 财务、C 管理层
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 功能归属:经营闭环
  • 经营 / 治理问题:地方平台即使有客户和 GPU,也可能没有可复制的经营模式。
  • 一句话结论:Token 生意必须把客户承接、Token 计量、费用结算、SLA 和毛利放在同一条链路里。
  • 页面内容:

- 客户获取:企业客户、AI 应用、Agent、区域生态。

- 商业包装:API Key、模型服务、套餐、订单、账单、分成。

- 供给保障:SLA、容量、功率、风险防护、模型路由。

- 经营动作:套餐升级、租户分层、低效产能优化、续费和扩容。

  • 可复用素材:Copilot 场景里的“初装费 + 运维费 + Token 分成”。
  • 视觉建议:经营飞轮:获客 -> 接入 -> 消费 -> 计量 -> 结算 -> 毛利 -> 运营动作。
  • 素材来源与状态:copilot-html-materials.md 场景 2、dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把计费结算讲成孤立功能。
  • 市场加工提示:适合售前讲商业模式,也适合市场团队做方案图。
P07

大型企业:内部 AI 调用分散,预算、SLA、安全、归因不可控

销售裁剪数字需披露确认Gate
C 管理层大型企业场景地方智算中心 0%,大型企业 100%

大型企业需要的是内部 Token 供给平台,而不是对外售卖的 ToC MaaS。

地方 -% / 企业 100%
  • 内部使用对象:Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。
  • 平台方问题:模型多、账号多、预算散、权限散、指标散、审计难。
  • 管理层问题:不知道 AI 成本花在哪里,不知道关键业务是否被保障。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:大型企业 AI 平台负责人、IT 平台负责人
  • 场景权重:地方智算中心 0%,大型企业 100%
  • 功能归属:大型企业场景
  • 经营 / 治理问题:企业内部 AI 应用增长很快,但模型调用、预算、安全和 SLA 分散在不同团队。
  • 一句话结论:大型企业需要的是内部 Token 供给平台,而不是对外售卖的 ToC MaaS。
  • 页面内容:

- 内部使用对象:Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。

- 平台方问题:模型多、账号多、预算散、权限散、指标散、审计难。

- 管理层问题:不知道 AI 成本花在哪里,不知道关键业务是否被保障。

  • 可复用素材:23 个部门、156 个应用 / Agent、Showback 覆盖率 91.3%。
  • 视觉建议:企业内多部门多应用散乱调用,汇聚到统一 Token Factory。
  • 素材来源与状态:dashboard-html-materials.md 页面 1 / 2。
  • 禁止表达:不要把大型企业套成地方智算中心的分成模式。
  • 市场加工提示:大型企业版本应强调内部供给、预算、审计、关键业务保障。
P08

大型企业治理闭环:部门、应用、Agent、预算、Showback / Chargeback、审计

销售裁剪数字需披露确认Gate
C 大型企业平台方内部治理闭环地方智算中心 10%,大型企业 90%

Token Factory 让企业内部 AI 使用可统计、可预算、可分摊、可保障。

地方 10% / 企业 90%
  • 组织维度:部门、BU、工作区、项目、应用、Agent。
  • 成本维度:预算、单位 Token 成本、Showback、Chargeback、成本回收。
  • 服务维度:关键业务保障、SLA、容量、限流、降级、审计。
展开完整字段和演示提示
  • 主对象:C 大型企业平台方
  • C 类细分:企业 AI 平台、FinOps、IT、业务管理者
  • 场景权重:地方智算中心 10%,大型企业 90%
  • 功能归属:内部治理闭环
  • 经营 / 治理问题:内部 AI 平台如果不能分摊、预算和审计,最终会变成成本黑洞。
  • 一句话结论:Token Factory 让企业内部 AI 使用可统计、可预算、可分摊、可保障。
  • 页面内容:

- 组织维度:部门、BU、工作区、项目、应用、Agent。

- 成本维度:预算、单位 Token 成本、Showback、Chargeback、成本回收。

- 服务维度:关键业务保障、SLA、容量、限流、降级、审计。

- 价值维度:客服中心 Copilot 月均节省人工成本约 ¥180K。

  • 可复用素材:Chargeback ¥523.8K、预算使用率 72.4%、关键业务保障率 99.5%。
  • 视觉建议:企业内部治理闭环图:需求 -> 配额 -> 使用 -> 统计 -> 分摊 -> 优化。
  • 素材来源与状态:dashboard-html-materials.md 页面 1 / 2。
  • 禁止表达:不要只写“企业内部也能用 API”。
  • 市场加工提示:适合官网“大型企业内部 AI 供给平台”模块。
P09

A/B 如何证明 C 买得值:真实调用和组织治理形成价值闭环

销售裁剪数字需披露确认Gate
C 管理层A/B 价值证明地方智算中心 55%,大型企业 45%

A 带来真实 Token 消费,B 带来组织治理和业务效率,这两者共同证明 C 的采购价值。

地方 55% / 企业 45%
  • A 的使用:API、模型服务、AI 应用、Agent、OpenClaw、Workflow。
  • B 的管理:部门、预算、成本、应用、Agent、SLA、统计、内部价值。
  • C 的收益:地方智算中心获得收入和客户运营数据,大型企业获得内部供给治理能力。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:A/B 价值证明
  • 经营 / 治理问题:C 买了以后,必须证明 A/B 会使用并产生收入或内部价值。
  • 一句话结论:A 带来真实 Token 消费,B 带来组织治理和业务效率,这两者共同证明 C 的采购价值。
  • 页面内容:

- A 的使用:API、模型服务、AI 应用、Agent、OpenClaw、Workflow。

- B 的管理:部门、预算、成本、应用、Agent、SLA、统计、内部价值。

- C 的收益:地方智算中心获得收入和客户运营数据,大型企业获得内部供给治理能力。

  • 可复用素材:消费类型占比:API 接入应用 32%、Agent 22%、企业 Copilot 15%。
  • 视觉建议:A/B 流量和治理信号回流到 C 的经营驾驶舱。
  • 素材来源与状态:dashboard-html-materials.md 页面 1。
  • 禁止表达:不要让 A/B 成为主采购对象。
  • 市场加工提示:适合串联使用场景与采购决策。

---

# 第三章:产品全景与能力地图

第三章:产品全景与能力地图

P10-P14 · 5 页
P10

产品架构总览:服务出口、控制面、驾驶舱、智能工作台、生产底座

骨干页销售裁剪数字需披露确认Gate
C 技术管理者产品架构总览地方智算中心 60%,大型企业 40%

Token Factory 由 MaaS 服务出口、管理控制面、Dashboard 经营驾驶、Copilot 智能工作台和 InferX 生产底座协同构成。

地方 60% / 企业 40%
  • 服务出口:API、模型目录、Endpoint、Usage / Billing。
  • 控制面:租户、部门、模型、配额、计量、计费、安全、审计。
  • 驾驶舱:经营价值、业务经营、FinOps、生产运营、算电、模型/GPU 协同。
展开完整字段和演示提示
  • 主对象:C 技术管理者
  • C 类细分:地方智算中心技术负责人、大型企业平台负责人
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:产品架构总览
  • 经营 / 治理问题:市场材料需要说明 Token Factory 是完整产品系统,不是几个功能拼盘。
  • 一句话结论:Token Factory 由 MaaS 服务出口、管理控制面、Dashboard 经营驾驶、Copilot 智能工作台和 InferX 生产底座协同构成。
  • 页面内容:

- 服务出口:API、模型目录、Endpoint、Usage / Billing。

- 控制面:租户、部门、模型、配额、计量、计费、安全、审计。

- 驾驶舱:经营价值、业务经营、FinOps、生产运营、算电、模型/GPU 协同。

- 智能工作台:经营分析、容量规划、成本归因、SLA 治理、报告摘要。

- 生产底座:AI 网关、推理调度、推理加速、观测、Planner、异构硬件。

  • 可复用素材:Token Factory = MaaS 运营闭环 + Dashboard/Copilot 经营闭环 + InferX 生产闭环。
  • 视觉建议:五层架构图,从上到下:消费入口、经营控制、智能决策、生产控制、资源底座。
  • 素材来源与状态:source-prototype-materials.mdinference-optimization-ppt-materials.md
  • 禁止表达:不要按菜单树平铺。
  • 市场加工提示:适合作为产品介绍章节的总览页。
P11

价值链:资源 -> 模型 -> 推理 -> Token -> 计量 -> 收入 / 内部价值

骨干页销售裁剪数字需披露确认Gate
C 管理层产品价值链地方智算中心 65%,大型企业 35%

Token Factory 管的不是“调用一次模型”,而是资源转成 Token 产能,再转成收入或内部价值的全链路。

地方 65% / 企业 35%
  • 资源层:GPU / NPU / DCU、电力、网络、存储。
  • 模型层:模型上架、模板、版本、路由、SLO。
  • 推理层:调度、加速、缓存、队列、网关。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业平台负责人、C 财务
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 功能归属:产品价值链
  • 经营 / 治理问题:客户经常看到资源、模型、API,但看不到它们如何连成经营结果。
  • 一句话结论:Token Factory 管的不是“调用一次模型”,而是资源转成 Token 产能,再转成收入或内部价值的全链路。
  • 页面内容:

- 资源层:GPU / NPU / DCU、电力、网络、存储。

- 模型层:模型上架、模板、版本、路由、SLO。

- 推理层:调度、加速、缓存、队列、网关。

- Token 层:吞吐、延迟、可售容量、SLA。

- 经营层:计量、账单、分成、预算、毛利、回本期。

  • 可复用素材:单卡收入 0.52 万 -> 0.93 万,成本 0.68 万不变。
  • 视觉建议:横向价值链,分别标注地方智算中心和大型企业的最终结果。
  • 素材来源与状态:inference-optimization-ppt-materials.md Slide 3、dashboard-html-materials.md
  • 禁止表达:不要只讲资源池化,不讲经营结果。
  • 市场加工提示:这是“产研视角”最重要的解释页之一。
P12

模块协作:MaaS、管理后台、Dashboard、Copilot、可观测、基础设施各司其职

骨干页销售裁剪数字需披露确认Gate
C 技术管理者模块协作地方智算中心 55%,大型企业 45%

MaaS 负责消费,管理后台负责执行,Dashboard 负责看见,Copilot 负责分析,InferX 负责生产。

地方 55% / 企业 45%
  • MaaS:服务出口和模型消费入口。
  • 管理后台:租户、策略、计量、模型、配额、安全、高风险动作执行。
  • Dashboard:指标、趋势、资产、财务、资源、安全、电力和模型/GPU 协同可视化。
展开完整字段和演示提示
  • 主对象:C 技术管理者
  • C 类细分:C 运维、C 运营、大型企业平台团队
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:模块协作
  • 经营 / 治理问题:市场团队容易把 Dashboard / Copilot / MaaS 混写,导致能力边界不清。
  • 一句话结论:MaaS 负责消费,管理后台负责执行,Dashboard 负责看见,Copilot 负责分析,InferX 负责生产。
  • 页面内容:

- MaaS:服务出口和模型消费入口。

- 管理后台:租户、策略、计量、模型、配额、安全、高风险动作执行。

- Dashboard:指标、趋势、资产、财务、资源、安全、电力和模型/GPU 协同可视化。

- Copilot:提问、归因、规划、建议、报告和摘要。

- InferX / 基础设施:部署、调度、加速、网关、观测和 Planner。

  • 可复用素材:Copilot 不替代 Dashboard,而是自然语言触达 Dashboard 背后的指标和判断逻辑。
  • 视觉建议:模块关系图,箭头标出“提问 -> 看见 -> 执行 -> 回写”。
  • 素材来源与状态:copilot-html-materials.md “与 Dashboard / MaaS / 后台的关系”。
  • 禁止表达:不要让 Copilot 直接变成生产配置执行入口。
  • 市场加工提示:适合做 Demo 脚本的模块边界页。
P13

客户、伙伴与 DaoCloud 的边界:谁提供资源,谁组织产能,谁经营客户

数字需披露确认Gate
C 管理层交付与合作边界地方智算中心 70%,大型企业 30%

客户提供资源和场景,DaoCloud 用 Token Factory 把它组织成可经营的 Token 产能,双方再围绕样板闭环推进经营。

地方 70% / 企业 30%
  • 客户侧:资源、机房、电力、客户场景、业务优先级、组织治理。
  • DaoCloud 侧:产品、推理优化、交付方法、Dashboard / Copilot、运营工具。
  • 共同侧:SLO 定义、计量口径、经营测算、样板项目、持续优化。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业平台负责人
  • 场景权重:地方智算中心 70%,大型企业 30%
  • 功能归属:交付与合作边界
  • 经营 / 治理问题:客户需要知道购买 Token Factory 之后,自己和 DaoCloud 分别承担什么。
  • 一句话结论:客户提供资源和场景,DaoCloud 用 Token Factory 把它组织成可经营的 Token 产能,双方再围绕样板闭环推进经营。
  • 页面内容:

- 客户侧:资源、机房、电力、客户场景、业务优先级、组织治理。

- DaoCloud 侧:产品、推理优化、交付方法、Dashboard / Copilot、运营工具。

- 共同侧:SLO 定义、计量口径、经营测算、样板项目、持续优化。

  • 可复用素材:地方智算中心初装费 + 运维费 + Token 分成;大型企业年度 Token 供给计划。
  • 视觉建议:三栏边界图:客户负责 / DaoCloud 负责 / 共同推进。
  • 素材来源与状态:copilot-html-materials.md 场景 1 / 2。
  • 禁止表达:不要把产品说成“交付完平台就结束”。
  • 市场加工提示:适合售前和商务合作页。
P14

产品对象矩阵:每个模块服务谁、解决什么经营或治理问题

数字需披露确认Gate
市场团队、售前团队对象-功能矩阵地方智算中心 60%,大型企业 40%

Token Factory 的每个模块都必须能映射到对象、场景、问题和经营结果。

地方 60% / 企业 40%
  • MaaS 出口:服务 A / B 消费,帮助 C 交付 Token。
  • 管理后台:服务 C 运营 / 运维 / 财务,执行租户、模型、配额、计量、安全策略。
  • Dashboard:服务 B / C / D,看经营、治理、资产和技术效果。
展开完整字段和演示提示
  • 主对象:市场团队、售前团队
  • C 类细分:地方智算中心、大型企业平台方、C 运维、C 运营、C 财务
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:对象-功能矩阵
  • 经营 / 治理问题:市场团队需要一张素材索引,避免功能与对象混乱。
  • 一句话结论:Token Factory 的每个模块都必须能映射到对象、场景、问题和经营结果。
  • 页面内容:

- MaaS 出口:服务 A / B 消费,帮助 C 交付 Token。

- 管理后台:服务 C 运营 / 运维 / 财务,执行租户、模型、配额、计量、安全策略。

- Dashboard:服务 B / C / D,看经营、治理、资产和技术效果。

- Copilot:服务 B / C,问经营、成本、容量、SLA、预算、异常和摘要。

- InferX / AI 网关:服务 C 技术团队,把模型变成可承诺 SLA 的生产服务。

  • 可复用素材:能力映射表。
  • 视觉建议:矩阵图,行是模块,列是 A/B/C/D 与地方智算中心 / 大型企业。
  • 素材来源与状态:HARD_GATES.md、各素材汇总。
  • 禁止表达:不要用“用户”一词泛化所有角色。
  • 市场加工提示:这页可作为市场团队二次创作的检查表。

---

# 第四章:MaaS 出口、后台治理与计量计费

第四章:MaaS 出口、后台治理与计量计费

P15-P21 · 7 页
P15

MaaS 出口:API、模型目录、Playground、Endpoint、API Key、Usage / Billing

销售裁剪数字需披露确认Gate
A / B,辅助对象 CMaaS 服务出口地方智算中心 55%,大型企业 45%

MaaS 出口让 Token 能被真正消费,但它只是 Token Factory 的前台。

地方 55% / 企业 45%
  • API:OpenAI 兼容、API Key、鉴权、限流。
  • 模型目录:模型能力、价格、SLA、适用场景。
  • Playground:试用、调试、体验。
展开完整字段和演示提示
  • 主对象:A / B,辅助对象 C
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:MaaS 服务出口
  • 经营 / 治理问题:C 要把 Token 交付给 A/B,必须有标准化、低摩擦、可计量的消费入口。
  • 一句话结论:MaaS 出口让 Token 能被真正消费,但它只是 Token Factory 的前台。
  • 页面内容:

- API:OpenAI 兼容、API Key、鉴权、限流。

- 模型目录:模型能力、价格、SLA、适用场景。

- Playground:试用、调试、体验。

- Endpoint:模型服务实例、路由、状态和调用入口。

- Usage / Billing:用量、账单、套餐消耗和费用归属。

  • 可复用素材:A 可以直接调用 Token API,也可以通过 OpenClaw / Agent / AI 应用间接使用。
  • 视觉建议:MaaS 门户界面示意,旁边标注后台能力支撑。
  • 素材来源与状态:老板 HTML 原型索引、copilot-html-materials.md
  • 禁止表达:不要让这一页成为“Token Factory 就是 MaaS”的证据。
  • 市场加工提示:适合官网产品模块,但需要和工厂能力并列出现。
P16

A/B 消费体验:开发者、应用、Agent、内部部门如何低摩擦接入 Token

数字需披露确认Gate
A / B消费体验与价值证明地方智算中心 50%,大型企业 50%

Token Factory 让 A/B 通过 API、应用、Agent 和内部服务自然消费 Token,并把使用数据回流给 C。

地方 50% / 企业 50%
  • A:开发者、终端 AI 产品、Agent、OpenClaw、Workflow。
  • B:部门、业务应用、企业 Copilot、知识助手、数据平台。
  • C:通过用量、预算、SLA、收入、毛利和业务价值判断平台是否成功。
展开完整字段和演示提示
  • 主对象:A / B
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 功能归属:消费体验与价值证明
  • 经营 / 治理问题:C 的平台价值最终要靠 A/B 的真实使用来证明。
  • 一句话结论:Token Factory 让 A/B 通过 API、应用、Agent 和内部服务自然消费 Token,并把使用数据回流给 C。
  • 页面内容:

- A:开发者、终端 AI 产品、Agent、OpenClaw、Workflow。

- B:部门、业务应用、企业 Copilot、知识助手、数据平台。

- C:通过用量、预算、SLA、收入、毛利和业务价值判断平台是否成功。

  • 可复用素材:消费结构:API 接入应用 32%、Agent 22%、企业 Copilot 15%、Workflow 8%。
  • 视觉建议:A/B 多入口消费流,回流到计量、Dashboard 和 FinOps。
  • 素材来源与状态:dashboard-html-materials.md 页面 1。
  • 禁止表达:不要把 A 的体验写成主购买理由。
  • 市场加工提示:销售版可缩成一页,产品白皮书可展开入口形态。
P17

管理后台:经营优先、治理第二、技术靠后

销售裁剪数字需披露确认Gate
C 运营 / C 运维 / C 财务管理控制面地方智算中心 60%,大型企业 40%

管理后台是 Token Factory 的执行控制面,负责把经营策略变成可审计、可追踪、可回滚的配置。

地方 60% / 企业 40%
  • 经营对象:租户、部门、工作区、应用、Agent、客户、订单。
  • 供给对象:模型、Endpoint、资源池、SLA、路由、配额。
  • 治理对象:权限、安全、审计、预算、计量、账单、策略。
展开完整字段和演示提示
  • 主对象:C 运营 / C 运维 / C 财务
  • C 类细分:地方智算中心平台运营、大型企业平台团队
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:管理控制面
  • 经营 / 治理问题:后台如果按工程菜单组织,客户看不到经营动作;如果按经营组织,才能支撑 C 的日常运营。
  • 一句话结论:管理后台是 Token Factory 的执行控制面,负责把经营策略变成可审计、可追踪、可回滚的配置。
  • 页面内容:

- 经营对象:租户、部门、工作区、应用、Agent、客户、订单。

- 供给对象:模型、Endpoint、资源池、SLA、路由、配额。

- 治理对象:权限、安全、审计、预算、计量、账单、策略。

- 高风险动作:由管理后台显式执行,而不是由 Copilot 自动改生产配置。

  • 可复用素材:Copilot 负责建议,后台负责执行和审计。
  • 视觉建议:控制面信息架构图,不做菜单截图堆叠。
  • 素材来源与状态:copilot-html-materials.md 产品边界、HARD_GATES.md
  • 禁止表达:不要把后台写成“管理页面集合”。
  • 市场加工提示:适合产研说明 Token Factory 的产品完整性。
P18

租户、工作区与部门:地方智算看客户租户,大型企业看内部组织

数字需披露确认Gate
C 运营 / B 管理者组织与租户治理地方智算中心 55%,大型企业 45%

同一套组织模型既能管理外部租户,也能管理企业内部部门和应用。

地方 55% / 企业 45%
  • 地方智算中心:租户、套餐、客户等级、合同、收入贡献、升级机会。
  • 大型企业:部门、BU、工作区、项目、应用、Agent、预算、Chargeback。
  • 共性:身份、权限、配额、用量、账单、SLA、审计。
展开完整字段和演示提示
  • 主对象:C 运营 / B 管理者
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:组织与租户治理
  • 经营 / 治理问题:Token 使用必须归属到客户、部门、应用和预算对象,否则无法经营或分摊。
  • 一句话结论:同一套组织模型既能管理外部租户,也能管理企业内部部门和应用。
  • 页面内容:

- 地方智算中心:租户、套餐、客户等级、合同、收入贡献、升级机会。

- 大型企业:部门、BU、工作区、项目、应用、Agent、预算、Chargeback。

- 共性:身份、权限、配额、用量、账单、SLA、审计。

  • 可复用素材:47 活跃租户、23 活跃部门、156 应用 / Agent。
  • 视觉建议:双视角组织模型,左边外部客户,右边内部组织。
  • 素材来源与状态:dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把“租户”只理解成 SaaS 账号。
  • 市场加工提示:大型企业材料要把“租户”转译为“部门 / BU / 工作区”。
P19

模型服务与网关策略:模型上架、服务模板、路由、限流、灰度、SLA

数字需披露确认Gate
C 运维 / C 技术管理者模型服务与 AI 网关地方智算中心 60%,大型企业 40%

AI 网关和模型服务策略把模型能力变成可交付、可售卖、可审计的生产服务。

地方 60% / 企业 40%
  • 模型上架:模型版本、服务模板、上下文、SLO、价格和成本标签。
  • 网关策略:鉴权、模型授权、权重、灰度、限流、熔断、Fallback。
  • 经营联动:成本归因、租户策略、SLA 优先级、低价值流量治理。
展开完整字段和演示提示
  • 主对象:C 运维 / C 技术管理者
  • C 类细分:地方智算中心运维、大型企业平台运维
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:模型服务与 AI 网关
  • 经营 / 治理问题:模型能跑不等于服务能卖,必须能治理、路由、限流、降级和承诺 SLA。
  • 一句话结论:AI 网关和模型服务策略把模型能力变成可交付、可售卖、可审计的生产服务。
  • 页面内容:

- 模型上架:模型版本、服务模板、上下文、SLO、价格和成本标签。

- 网关策略:鉴权、模型授权、权重、灰度、限流、熔断、Fallback。

- 经营联动:成本归因、租户策略、SLA 优先级、低价值流量治理。

  • 可复用素材:AI 网关支持 Consumer 鉴权、模型授权、灰度、限流、熔断、审计和成本归因。
  • 视觉建议:请求从 API 进入网关,网关根据成本、负载、SLA 和权限路由到模型服务。
  • 素材来源与状态:inference-optimization-ppt-materials.md Slide 12。
  • 禁止表达:不要把网关只讲成流量转发。
  • 市场加工提示:技术深度材料可补充网关策略,销售材料只保留经营含义。
P20

计量计费:Token 计量、账单、套餐、订单、分成、Showback / Chargeback

销售裁剪数字需披露确认Gate
C 财务 / C 运营 / B 管理者计量、计费与结算地方智算中心 60%,大型企业 40%

计量计费把 Token 使用转成经营账本,地方智算中心看收入分成,大型企业看预算分摊。

地方 60% / 企业 40%
  • 地方智算中心:订单、套餐、用量账单、超额、续费、分成、客户升级。
  • 大型企业:部门预算、Showback、Chargeback、单位业务成本、成本回收。
  • 统一口径:Token 用量、模型单价、SLA 等级、资源池成本、租户 / 部门归属。
展开完整字段和演示提示
  • 主对象:C 财务 / C 运营 / B 管理者
  • C 类细分:地方智算中心运营财务、大型企业 FinOps
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:计量、计费与结算
  • 经营 / 治理问题:没有统一计量和账单,Token 产能无法变成收入,也无法在企业内部治理。
  • 一句话结论:计量计费把 Token 使用转成经营账本,地方智算中心看收入分成,大型企业看预算分摊。
  • 页面内容:

- 地方智算中心:订单、套餐、用量账单、超额、续费、分成、客户升级。

- 大型企业:部门预算、Showback、Chargeback、单位业务成本、成本回收。

- 统一口径:Token 用量、模型单价、SLA 等级、资源池成本、租户 / 部门归属。

  • 可复用素材:月分摊成本 ¥523.8K,单位 Token 成本 ¥4.11/M,单位 Token 收入 ¥6.66/M,单位 Token 毛利 ¥2.55/M。
  • 视觉建议:地方智算中心账单流与大型企业分摊流左右对照。
  • 素材来源与状态:dashboard-html-materials.md 页面 2 / 3。
  • 禁止表达:不要把计量计费写成“账单页面”。
  • 市场加工提示:适合市场团队制作 ROI 测算器或售前计算表。
P21

配额与预算:把成本保护、安全策略、SLA 优先级变成可执行政策

数字需披露确认Gate
C 运营 / C 财务 / B 管理者配额、预算与策略治理地方智算中心 50%,大型企业 50%

Token Factory 把预算、配额、安全和 SLA 从管理要求变成可执行的平台策略。

地方 50% / 企业 50%
  • 配额:租户 / 部门 / 应用 / Agent 的 Token 上限、速率和优先级。
  • 预算:月度预算、预警、超额控制、成本归因。
  • SLA:高优先级业务保护、低价值流量限流、路由降级。
展开完整字段和演示提示
  • 主对象:C 运营 / C 财务 / B 管理者
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 功能归属:配额、预算与策略治理
  • 经营 / 治理问题:Token 供给如果没有配额、预算和优先级,容易出现高价值业务被低价值流量挤占。
  • 一句话结论:Token Factory 把预算、配额、安全和 SLA 从管理要求变成可执行的平台策略。
  • 页面内容:

- 配额:租户 / 部门 / 应用 / Agent 的 Token 上限、速率和优先级。

- 预算:月度预算、预警、超额控制、成本归因。

- SLA:高优先级业务保护、低价值流量限流、路由降级。

- 安全:风控策略、权限边界、异常调用处置。

  • 可复用素材:预算可控率 94.8%,关键业务保障率 99.5%。
  • 视觉建议:策略从管理目标下发到网关、模型服务、计量和 Dashboard。
  • 素材来源与状态:dashboard-html-materials.md 页面 1、copilot-html-materials.md 场景 11。
  • 禁止表达:不要只讲“配额设置”。
  • 市场加工提示:大型企业版重点讲预算和关键业务保障;地方智算版重点讲客户等级和套餐保护。

---

# 第五章:Dashboard、FinOps 与 Copilot

第五章:Dashboard、FinOps 与 Copilot

P22-P33 · 12 页
P22

Dashboard:Token 经营驾驶系统,不是普通监控大屏

骨干页销售裁剪数字需披露确认Gate
C 管理层 / C 运营 / C 财务Dashboard 总定位地方智算中心 60%,大型企业 40%

Dashboard 把 GPU、模型、Token、租户、部门、成本、电力、安全和财务指标放到一个经营视角里。

地方 60% / 企业 40%
  • 经营价值:产能、收入、毛利、风险和预测。
  • 业务经营:租户 / 客户、部门 / 应用 / Agent。
  • FinOps:收入、成本、毛利、预算、ROI、单机资产。
展开完整字段和演示提示
  • 主对象:C 管理层 / C 运营 / C 财务
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:Dashboard 总定位
  • 经营 / 治理问题:客户不只需要看机器是否在线,更需要看资源是否转化成产能、收入、毛利和内部价值。
  • 一句话结论:Dashboard 把 GPU、模型、Token、租户、部门、成本、电力、安全和财务指标放到一个经营视角里。
  • 页面内容:

- 经营价值:产能、收入、毛利、风险和预测。

- 业务经营:租户 / 客户、部门 / 应用 / Agent。

- FinOps:收入、成本、毛利、预算、ROI、单机资产。

- 生产运营:请求、吞吐、延迟、缓存、队列、SLA。

- 算电与模型/GPU:电力、PUE、绿电、模型匹配、错配损耗。

  • 可复用素材:Dashboard = DaoCloud Token Factory 经营驾驶系统。
  • 视觉建议:Dashboard 信息架构图,突出“经营驾驶”而非“监控”。
  • 素材来源与状态:dashboard-html-materials.md
  • 禁止表达:不要写成“监控大屏”“资源监控页面”。
  • 市场加工提示:产品官网可拆成多个子模块,销售版保留 1-2 张关键截图即可。
P23

经营价值总览:同等硬件下看吞吐、成本、SLA、毛利的整体增益

销售裁剪数字需披露确认Gate
C 决策层 / C 财务Dashboard 经营价值地方智算中心 65%,大型企业 35%

Dashboard 用 Without / With 经营增益证明 Token Factory 不是部署工具,而是经营增益系统。

地方 65% / 企业 35%
  • 实时吞吐:2.41M Token/s。
  • 今日收入:¥847.2K;今日毛利:¥323.4K。
  • 同等硬件对比:吞吐 +50.6%,单位 Token 成本 -29.1%,SLA 95.2% -> 99.7%,日均毛利 +62.9%。
展开完整字段和演示提示
  • 主对象:C 决策层 / C 财务
  • C 类细分:地方智算中心管理层、大型企业平台负责人
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 功能归属:Dashboard 经营价值
  • 经营 / 治理问题:客户需要量化“用了 Token Factory 之后到底变好了什么”。
  • 一句话结论:Dashboard 用 Without / With 经营增益证明 Token Factory 不是部署工具,而是经营增益系统。
  • 页面内容:

- 实时吞吐:2.41M Token/s。

- 今日收入:¥847.2K;今日毛利:¥323.4K。

- 同等硬件对比:吞吐 +50.6%,单位 Token 成本 -29.1%,SLA 95.2% -> 99.7%,日均毛利 +62.9%。

- 价值归因:调度优化、KV Cache、模型匹配、算电协同、产能吸收、安全防护。

  • 可复用素材:日均毛利增量 +¥124.9K/日,调度贡献 +¥42.3K/日,KV Cache +¥28.6K/日。
  • 视觉建议:上方 KPI 卡,下方 Without / With 对比和价值归因瀑布图。
  • 素材来源与状态:dashboard-html-materials.md 页面 1,数字按 v1 真实素材处理。
  • 禁止表达:不要只展示指标,不解释经营含义。
  • 市场加工提示:这页是市场团队最容易转成销售价值页的素材。
P24

租户与客户经营:把客户、套餐、消费和升级机会串成增长闭环

数字需披露确认Gate
C 运营Dashboard 业务经营地方智算中心 100%,大型企业 0%

租户与客户经营视图帮助地方智算中心把 Token 消费转成客户运营动作。

地方 100% / 企业 -%
  • 47 个活跃租户,月 Token 消费 3.82T,月收入 ¥846.7K,ARPU ¥18.0K。
  • 12 个租户套餐消耗率 >90%。
  • 星辰科技月消费 380B、收入贡献 ¥228K,套餐消耗率 92%,预计升级月增收 ¥45K。
展开完整字段和演示提示
  • 主对象:C 运营
  • C 类细分:地方智算中心运营、销售运营、客户成功
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 功能归属:Dashboard 业务经营
  • 经营 / 治理问题:地方智算中心需要知道哪些客户在消耗、谁值得升级、谁侵蚀 SLA、哪里有增长机会。
  • 一句话结论:租户与客户经营视图帮助地方智算中心把 Token 消费转成客户运营动作。
  • 页面内容:

- 47 个活跃租户,月 Token 消费 3.82T,月收入 ¥846.7K,ARPU ¥18.0K。

- 12 个租户套餐消耗率 >90%。

- 星辰科技月消费 380B、收入贡献 ¥228K,套餐消耗率 92%,预计升级月增收 ¥45K。

- 租户 -> 模型 -> GPU -> Token 输出的 Sankey 链路。

  • 可复用素材:租户分层、套餐升级、收入贡献、SLA 侵蚀治理。
  • 视觉建议:租户象限图 + 套餐升级建议卡。
  • 素材来源与状态:dashboard-html-materials.md 页面 2。
  • 禁止表达:不要把它讲成 CRM;这是 Token 消费和经营数据驱动的客户运营。
  • 市场加工提示:地方智算中心销售材料可重点使用。
P25

部门、应用与 Agent 治理:企业内部 AI 使用可统计、可分摊、可保障

数字需披露确认Gate
B 管理者 / C 大型企业平台方Dashboard 企业内部经营地方智算中心 10%,大型企业 90%

Token Factory 让企业内部 AI 使用从“分散调用”变成可统计、可分摊、可预算、可保障的内部供给体系。

地方 10% / 企业 90%
  • 活跃部门 23,覆盖 7 个 BU。
  • 应用 / Agent 156,其中 Agent 68、App 88。
  • 月分摊成本 ¥523.8K,预算使用率 72.4%,单位业务成本 ¥4.11/M Token。
展开完整字段和演示提示
  • 主对象:B 管理者 / C 大型企业平台方
  • C 类细分:大型企业 AI 平台、FinOps、业务部门负责人
  • 场景权重:地方智算中心 10%,大型企业 90%
  • 功能归属:Dashboard 企业内部经营
  • 经营 / 治理问题:大型企业内部 AI 使用快速增长后,部门、应用、Agent 的成本和价值需要被看见。
  • 一句话结论:Token Factory 让企业内部 AI 使用从“分散调用”变成可统计、可分摊、可预算、可保障的内部供给体系。
  • 页面内容:

- 活跃部门 23,覆盖 7 个 BU。

- 应用 / Agent 156,其中 Agent 68、App 88。

- 月分摊成本 ¥523.8K,预算使用率 72.4%,单位业务成本 ¥4.11/M Token。

- 客服中心 Copilot 业务价值评分 A+,月均节省人工成本约 ¥180K。

  • 可复用素材:Showback 覆盖率 91.3%,关键业务保障率 99.5%。
  • 视觉建议:部门消费排行 + 应用类型分布 + 预算状态。
  • 素材来源与状态:dashboard-html-materials.md 页面 1 / 2。
  • 禁止表达:不要把企业内部场景写成“也可以卖 Token”。
  • 市场加工提示:大型企业官网场景页和白皮书可重点使用。
P26

FinOps:单位 Token 成本、收入、毛利、预算、预测和 ROI

销售裁剪数字需披露确认Gate
C 财务 / FinOps / 管理层FinOps 与财务驾驶舱地方智算中心 60%,大型企业 40%

FinOps 把 Token 供给从技术服务变成可核算、可预测、可优化的经营账本。

地方 60% / 企业 40%
  • 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。
  • 单位 Token 成本 ¥4.11/百万,收入 ¥6.66/百万,毛利 ¥2.55/百万。
  • 成本回收率 161.3%,预算剩余 ¥2.80M。
展开完整字段和演示提示
  • 主对象:C 财务 / FinOps / 管理层
  • C 类细分:地方智算中心财务、大型企业 FinOps
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:FinOps 与财务驾驶舱
  • 经营 / 治理问题:GPU 投资必须回答收入、成本、毛利、预算、回收和预测问题。
  • 一句话结论:FinOps 把 Token 供给从技术服务变成可核算、可预测、可优化的经营账本。
  • 页面内容:

- 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。

- 单位 Token 成本 ¥4.11/百万,收入 ¥6.66/百万,毛利 ¥2.55/百万。

- 成本回收率 161.3%,预算剩余 ¥2.80M。

- 月度 P&L 预测与成本结构:GPU 算力、电力、存储、网络、软件许可、安全、运维。

  • 可复用素材:财务 KPI 表、月度 P&L、成本结构。
  • 视觉建议:P&L 卡片 + 成本结构饼图 + 单位 Token 经济性指标。
  • 素材来源与状态:dashboard-html-materials.md 页面 3。
  • 禁止表达:不要把 FinOps 简化成“成本报表”。
  • 市场加工提示:高层材料可保留 3-4 个核心指标,白皮书可展开成本结构。
P27

单机资产经营:每台机器是否赚钱、多久回本、是否低效

数字需披露确认Gate
C 财务 / C 管理层 / C 运维资产经营地方智算中心 75%,大型企业 25%

Token Factory 能把 GPU 服务器从成本项变成可核算的经营资产。

地方 75% / 企业 25%
  • 每台机器的月 Token、月收入、月 OPEX、月折旧、月毛利、毛利率、CAPEX、回本期、利用率。
  • 高产资产:TF-H100-AZ1-03,月收入 ¥3.42M,月毛利 ¥1.74M,回本期 10.7 月。
  • 低效预警:A100 / L40S 节点回本期 52-60 月,需要迁移负载或优化模型匹配。
展开完整字段和演示提示
  • 主对象:C 财务 / C 管理层 / C 运维
  • C 类细分:地方智算中心财务、大型企业平台资产管理
  • 场景权重:地方智算中心 75%,大型企业 25%
  • 功能归属:资产经营
  • 经营 / 治理问题:智算投资最终要落到单机资产、回本期和低效预警,而不是只看总利用率。
  • 一句话结论:Token Factory 能把 GPU 服务器从成本项变成可核算的经营资产。
  • 页面内容:

- 每台机器的月 Token、月收入、月 OPEX、月折旧、月毛利、毛利率、CAPEX、回本期、利用率。

- 高产资产:TF-H100-AZ1-03,月收入 ¥3.42M,月毛利 ¥1.74M,回本期 10.7 月。

- 低效预警:A100 / L40S 节点回本期 52-60 月,需要迁移负载或优化模型匹配。

- 资产状态:高产资产、健康经营、扩容观察、低效预警。

  • 可复用素材:单机资产经营视图和资产矩阵逻辑。
  • 视觉建议:资产泡泡矩阵,横轴利用率,纵轴单机月毛利,大小为账面净值。
  • 素材来源与状态:dashboard-html-materials.md 页面 3。
  • 禁止表达:不要直接暴露完整节点清单给外部材料,正式公开需匿名化。
  • 市场加工提示:适合闭门销售拜访和 ROI 测算,不一定适合公开官网。
P28

生产与 SLA 运营:从“服务可用”到“可承诺 SLA 的 Token 生产系统”

数字需披露确认Gate
C 运维 / C 技术管理者生产运营 Dashboard地方智算中心 60%,大型企业 40%

生产运营视图把请求、吞吐、延迟、缓存、队列和 GPU 利用率连接到 SLA 承诺。

地方 60% / 企业 40%
  • 实时请求量 34.2K,Token 吞吐 2.41M。
  • TTFT P50 / P99:128 / 342ms;TPOT P50 / P99:18 / 45ms。
  • KV Cache 命中率 84.3%,GPU 平均利用率 78.6%,512 卡在线。
展开完整字段和演示提示
  • 主对象:C 运维 / C 技术管理者
  • C 类细分:地方智算中心运维、大型企业平台运维
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:生产运营 Dashboard
  • 经营 / 治理问题:Token 服务如果不能稳定满足延迟、吞吐和队列目标,就无法对客户或内部关键业务承诺。
  • 一句话结论:生产运营视图把请求、吞吐、延迟、缓存、队列和 GPU 利用率连接到 SLA 承诺。
  • 页面内容:

- 实时请求量 34.2K,Token 吞吐 2.41M。

- TTFT P50 / P99:128 / 342ms;TPOT P50 / P99:18 / 45ms。

- KV Cache 命中率 84.3%,GPU 平均利用率 78.6%,512 卡在线。

- 队列深度 127,降级 / 限流状态无。

  • 可复用素材:热门模型、热门 GPU 池、空转率 6.8%、错配率 4.2%。
  • 视觉建议:SLA 指标卡 + 队列 / 缓存 / GPU 利用率趋势。
  • 素材来源与状态:dashboard-html-materials.md 页面 5。
  • 禁止表达:不要把它讲成“技术监控”,要讲生产承诺和经营风险。
  • 市场加工提示:适合售前技术交流和运维负责人沟通。
P29

Copilot:经营、运维、FinOps、安全和容量规划的智能工作台

骨干页销售裁剪数字需披露确认Gate
B / CCopilot 总定位地方智算中心 60%,大型企业 40%

Copilot 不是聊天机器人,而是面向 Token 供给和经营的智能工作台。

地方 60% / 企业 40%
  • 多入口:网页、桌面、语音、手机、数字人、Agent、API。
  • 输入能力:对话 / 规划模式,自动路由与模型选择。
  • 分析对象:毛利、SLA、容量、路由、缓存、预算、安全、模型、租户、异常事件。
展开完整字段和演示提示
  • 主对象:B / C
  • C 类细分:C 运营、C 运维、C 财务、大型企业平台团队
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:Copilot 总定位
  • 经营 / 治理问题:Token Factory 指标和对象复杂,运营人员需要用自然语言进入分析、归因和报告。
  • 一句话结论:Copilot 不是聊天机器人,而是面向 Token 供给和经营的智能工作台。
  • 页面内容:

- 多入口:网页、桌面、语音、手机、数字人、Agent、API。

- 输入能力:对话 / 规划模式,自动路由与模型选择。

- 分析对象:毛利、SLA、容量、路由、缓存、预算、安全、模型、租户、异常事件。

- 输出能力:建议、方案、报告、老板摘要、RCA、容量预测、分成草案。

  • 可复用素材:Copilot 小字定位“DaoCloud Token Factory 智能工作台”。
  • 视觉建议:三栏工作台:左会话、中分析、右 Inspector / 指标 / 动作。
  • 素材来源与状态:copilot-html-materials.md
  • 禁止表达:不要写成“AI 客服”“智能问答机器人”。
  • 市场加工提示:适合 Demo 脚本;正式外发需确认哪些入口可对外讲。
P30

Copilot 经营分析:毛利、成本、租户、缓存和路由的可行动归因

销售裁剪数字需披露确认Gate
C 运营 / C 财务Copilot 经营分析地方智算中心 65%,大型企业 35%

Copilot 把“毛利变差”拆成可解释、可排序、可行动的原因。

地方 65% / 企业 35%
  • 毛利率 34.7%,有效吞吐 18.4M Token/分钟。
  • 第一原因:DeepSeek-R1 高成本路径占比上升,单位 Token 成本 ¥1.82 / 1M。
  • 第二原因:research-lab 租户挤占高优先级容量。
展开完整字段和演示提示
  • 主对象:C 运营 / C 财务
  • C 类细分:地方智算中心运营、大型企业 FinOps
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 功能归属:Copilot 经营分析
  • 经营 / 治理问题:经营指标变差时,团队需要快速知道是模型、租户、资源池、缓存还是路由造成。
  • 一句话结论:Copilot 把“毛利变差”拆成可解释、可排序、可行动的原因。
  • 页面内容:

- 毛利率 34.7%,有效吞吐 18.4M Token/分钟。

- 第一原因:DeepSeek-R1 高成本路径占比上升,单位 Token 成本 ¥1.82 / 1M。

- 第二原因:research-lab 租户挤占高优先级容量。

- 第三原因:KV Cache 命中率 78% -> 72%,推高 TTFT 和队列深度。

- 动作:生成报告、打开 Dashboard、比较 GLM-4.5 替代路由、去后台执行。

  • 可复用素材:Copilot 场景 3 “毛利被压缩的原因分析”。
  • 视觉建议:问题 -> 影响排序 -> 指标证据 -> 建议动作流程。
  • 素材来源与状态:copilot-html-materials.md 场景 3。
  • 禁止表达:不要让 Copilot 直接自动调整生产路由。
  • 市场加工提示:这是最能体现 Copilot 产品力的场景之一。
P31

Copilot 容量、SLA 与 RCA:先路由、再限流、最后扩容

数字需披露确认Gate
C 运维 / C 运营Copilot 容量规划与根因分析地方智算中心 60%,大型企业 40%

Copilot 帮运维把容量、SLA、队列、缓存和路由连起来,给出保护 ROI 的执行顺序。

地方 60% / 企业 40%
  • 晚高峰:流量上涨 30%,pool-a100-prod 86% 高占用,可售容量仅支撑 2.4 小时。
  • 建议顺序:先改路由,再对低价值请求限流或转低成本模型池,最后评估扩容。
  • RCA:OpenClaw / workflow agent 可获得 TTFT 抬升、队列 184、DeepSeek-R1 路径抖动等结构化结论。
展开完整字段和演示提示
  • 主对象:C 运维 / C 运营
  • C 类细分:地方智算中心运维、大型企业平台运维
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:Copilot 容量规划与根因分析
  • 经营 / 治理问题:高峰流量和异常事件不能只靠人工排查,也不能简单用扩容解决。
  • 一句话结论:Copilot 帮运维把容量、SLA、队列、缓存和路由连起来,给出保护 ROI 的执行顺序。
  • 页面内容:

- 晚高峰:流量上涨 30%,pool-a100-prod 86% 高占用,可售容量仅支撑 2.4 小时。

- 建议顺序:先改路由,再对低价值请求限流或转低成本模型池,最后评估扩容。

- RCA:OpenClaw / workflow agent 可获得 TTFT 抬升、队列 184、DeepSeek-R1 路径抖动等结构化结论。

- 输出:12 小时容量预测、缓解建议、Agent 可消费的根因摘要。

  • 可复用素材:Copilot 场景 4 / 5。
  • 视觉建议:高峰容量预测线 + 执行动作优先级阶梯。
  • 素材来源与状态:copilot-html-materials.md 场景 4 / 5。
  • 禁止表达:不要把容量不足的答案固定写成“扩机器”。
  • 市场加工提示:适合面向 C 运维和技术管理层。
P32

Copilot 供给计划、分成方案和老板摘要:把复杂运营转成可沟通材料

数字需披露确认Gate
C 管理层 / C 运营 / B 管理者Copilot 方案生成与摘要地方智算中心 50%,大型企业 50%

Copilot 能把 Token 供给和经营分析转成年度计划、分成草案、老板摘要和客户方案。

地方 50% / 企业 50%
  • 大型企业:18 亿 Token 年度需求拆成基础供给包、峰值弹性包和高优先级保障包,SLA 99.9%。
  • 地方智算中心:判断 GPU 资源是否形成经营闭环,生成初装费、运维费和 Token 分成草案。
  • 管理层:生成今日经营摘要,保留 SLA、毛利、容量、风险和下一步。
展开完整字段和演示提示
  • 主对象:C 管理层 / C 运营 / B 管理者
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 功能归属:Copilot 方案生成与摘要
  • 经营 / 治理问题:平台团队需要把复杂的资源、成本、容量和经营结果转成客户、老板和内部团队能理解的材料。
  • 一句话结论:Copilot 能把 Token 供给和经营分析转成年度计划、分成草案、老板摘要和客户方案。
  • 页面内容:

- 大型企业:18 亿 Token 年度需求拆成基础供给包、峰值弹性包和高优先级保障包,SLA 99.9%。

- 地方智算中心:判断 GPU 资源是否形成经营闭环,生成初装费、运维费和 Token 分成草案。

- 管理层:生成今日经营摘要,保留 SLA、毛利、容量、风险和下一步。

- 展厅 / 培训:数字人 AIRI 复用同一套 Copilot 能力。

  • 可复用素材:场景 1、2、6、9 的话术。
  • 视觉建议:四类输出卡:年度供给计划、分成草案、老板摘要、展厅讲解。
  • 素材来源与状态:copilot-html-materials.md 场景 1 / 2 / 6 / 9。
  • 禁止表达:不要把 AIRI / 数字人作为核心销售承诺,除非后续确认对外范围。
  • 市场加工提示:适合市场团队做 Demo 话术和展厅讲解素材。
P33

Copilot 动作边界:分析、解释、建议、生成草案;高风险动作回后台执行

骨干页数字需披露确认Gate
C 技术管理者 / C 安全 / 大型企业平台负责人Copilot 治理边界地方智算中心 55%,大型企业 45%

Copilot 提升分析和决策效率,但高风险结构性配置变更必须进入管理后台显式执行和审计。

地方 55% / 企业 45%
  • Copilot 做:理解上下文、归因、规划、生成建议、生成报告、生成草案。
  • Dashboard 做:查看指标、趋势、资产、财务、资源、安全、电力和模型/GPU 协同。
  • 管理后台做:策略配置、模型路由、租户配额、预算、安全、审计和高风险动作执行。
展开完整字段和演示提示
  • 主对象:C 技术管理者 / C 安全 / 大型企业平台负责人
  • C 类细分:C 运维、C 安全、C 管理层
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:Copilot 治理边界
  • 经营 / 治理问题:客户会担心智能助手直接改生产配置,带来安全、审计和稳定风险。
  • 一句话结论:Copilot 提升分析和决策效率,但高风险结构性配置变更必须进入管理后台显式执行和审计。
  • 页面内容:

- Copilot 做:理解上下文、归因、规划、生成建议、生成报告、生成草案。

- Dashboard 做:查看指标、趋势、资产、财务、资源、安全、电力和模型/GPU 协同。

- 管理后台做:策略配置、模型路由、租户配额、预算、安全、审计和高风险动作执行。

- MaaS 做:服务消费和模型调用。

  • 可复用素材:“高风险的结构性配置变更不直接在 Copilot 里执行,而是引导到管理后台完成。”
  • 视觉建议:四段闭环:问 -> 看 -> 建议 -> 后台执行 / 审计。
  • 素材来源与状态:copilot-html-materials.md 产品边界。
  • 禁止表达:不要说“自然语言一键改生产配置”。
  • 市场加工提示:这页能降低客户对智能化控制的安全疑虑。

---

# 第六章:推理生产、运维、安全与算电协同

第六章:推理生产、运维、安全与算电协同

P34-P40 · 7 页
P34

InferX 生产闭环:模型 + 硬件 + SLO 的可复制交付路径

销售裁剪数字需披露确认Gate
C 技术管理者 / D推理生产闭环地方智算中心 60%,大型企业 40%

InferX 把部署、调度、加速、路由、观测和 Planner 回写收敛成生产闭环。

地方 60% / 企业 40%
  • 模型部署:well-lit path / Helm / 模型服务。
  • 算力调度:LWS / Kueue / DRA / HAMi。
  • 推理加速:PD 分离、KV Kernel、量化。
展开完整字段和演示提示
  • 主对象:C 技术管理者 / D
  • C 类细分:地方智算中心技术负责人、大型企业平台架构负责人
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:推理生产闭环
  • 经营 / 治理问题:客户不需要一次性专家调参,而需要可复制、可验证、可持续优化的生产路径。
  • 一句话结论:InferX 把部署、调度、加速、路由、观测和 Planner 回写收敛成生产闭环。
  • 页面内容:

- 模型部署:well-lit path / Helm / 模型服务。

- 算力调度:LWS / Kueue / DRA / HAMi。

- 推理加速:PD 分离、KV Kernel、量化。

- 网关路由:限流、兜底、权重、鉴权。

- 观测闭环:SLO、成本、租户、调优回写。

  • 可复用素材:Token Factory 技术底座 = InferX 生产闭环 + MaaS 运营闭环 + Dashboard/Copilot 经营闭环。
  • 视觉建议:生产闭环飞轮。
  • 素材来源与状态:inference-optimization-ppt-materials.md Slide 8。
  • 禁止表达:不要把 InferX 讲成单个推理引擎。
  • 市场加工提示:高层版只保留“可复制交付路径”,技术版可展开各环节。
P35

AI 网关:模型服务的生产控制面

销售裁剪数字需披露确认Gate
C 运维 / C 技术管理者AI 网关地方智算中心 60%,大型企业 40%

AI 网关把模型能力变成有权限、有策略、有 SLA、有成本归因的企业级服务。

地方 60% / 企业 40%
  • 可靠路由:失败自动降级、模型级 Fallback、实例级负载均衡。
  • 访问治理:Consumer 鉴权、模型授权、API Token 健康管理。
  • 流量策略:权重、灰度、限流、熔断、审计和成本归因。
展开完整字段和演示提示
  • 主对象:C 运维 / C 技术管理者
  • C 类细分:地方智算中心运维、大型企业平台运维
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:AI 网关
  • 经营 / 治理问题:模型服务要可售卖、可治理、可审计、可降级,不能只是能调用。
  • 一句话结论:AI 网关把模型能力变成有权限、有策略、有 SLA、有成本归因的企业级服务。
  • 页面内容:

- 可靠路由:失败自动降级、模型级 Fallback、实例级负载均衡。

- 访问治理:Consumer 鉴权、模型授权、API Token 健康管理。

- 流量策略:权重、灰度、限流、熔断、审计和成本归因。

- 模型选择:质量、速度、成本、负载共同决策。

  • 可复用素材:Gateway 是 C 类客户从“模型可用”走向“服务可售 / 可管 / 可审计”的关键。
  • 视觉建议:入口请求经过网关策略分发到不同模型服务和资源池。
  • 素材来源与状态:inference-optimization-ppt-materials.md Slide 12。
  • 禁止表达:不要写成普通 API Gateway。
  • 市场加工提示:适合技术交流和大型企业安全审计材料。
P36

运维与 SLO:TTFT、TPOT、Goodput、队列、故障恢复和容量预测

数字需披露确认Gate
C 运维生产运维与 SLO地方智算中心 55%,大型企业 45%

Token Factory 把 TTFT、TPOT、吞吐、队列、容量和故障恢复组织成可承诺的 SLO 体系。

地方 55% / 企业 45%
  • 性能指标:TTFT、TPOT、吞吐、Goodput、P99。
  • 稳定指标:队列深度、错误率、降级、限流、Fallback、恢复时间。
  • 生命周期:启动前预检、运行态监测、自动恢复、SLO 回写。
展开完整字段和演示提示
  • 主对象:C 运维
  • C 类细分:地方智算中心运维、大型企业平台运维
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 功能归属:生产运维与 SLO
  • 经营 / 治理问题:Token 服务的商业化前提是稳定体验和故障恢复,不是 Demo 可用。
  • 一句话结论:Token Factory 把 TTFT、TPOT、吞吐、队列、容量和故障恢复组织成可承诺的 SLO 体系。
  • 页面内容:

- 性能指标:TTFT、TPOT、吞吐、Goodput、P99。

- 稳定指标:队列深度、错误率、降级、限流、Fallback、恢复时间。

- 生命周期:启动前预检、运行态监测、自动恢复、SLO 回写。

- 经营关系:SLO 决定客户可售等级、关键业务保障和毛利空间。

  • 可复用素材:TTFT P50 / P99:128 / 342ms,TPOT P50 / P99:18 / 45ms。
  • 视觉建议:SLO 控制环:指标 -> 策略 -> 执行 -> 回写。
  • 素材来源与状态:dashboard-html-materials.md 页面 5、inference-optimization-ppt-materials.md Slide 13。
  • 禁止表达:不要只讲“监控告警”。
  • 市场加工提示:适合 C 运维和企业平台团队。
P37

KV Cache:多轮对话、Agent 和长上下文的成本与体验杠杆

数字需披露确认Gate
C 技术管理者 / B 平台管理者推理优化与成本控制地方智算中心 45%,大型企业 55%

KV Cache 是长上下文和 Agent 场景降低单位 Token 成本、稳定响应体验的关键能力。

地方 45% / 企业 55%
  • 场景:企业 Copilot、多轮客服、Agent ReAct、代码工作流、知识助手。
  • 价值:减少重复计算,降低 TTFT / TPOT,提升缓存命中率,降低单位 Token 成本。
  • 经营联动:KV Cache 命中率下降会推高队列、延迟和毛利压力。
展开完整字段和演示提示
  • 主对象:C 技术管理者 / B 平台管理者
  • C 类细分:地方智算中心运维、大型企业 Agent 平台方
  • 场景权重:地方智算中心 45%,大型企业 55%
  • 功能归属:推理优化与成本控制
  • 经营 / 治理问题:Copilot、Agent、Workflow 天然长上下文、多轮交互,如果不能复用上下文,会推高成本和延迟。
  • 一句话结论:KV Cache 是长上下文和 Agent 场景降低单位 Token 成本、稳定响应体验的关键能力。
  • 页面内容:

- 场景:企业 Copilot、多轮客服、Agent ReAct、代码工作流、知识助手。

- 价值:减少重复计算,降低 TTFT / TPOT,提升缓存命中率,降低单位 Token 成本。

- 经营联动:KV Cache 命中率下降会推高队列、延迟和毛利压力。

- 数据例子:毛利归因中 KV Cache 命中率 78% -> 72%,成为成本恶化原因之一。

  • 可复用素材:价值归因中 KV Cache 日贡献 +¥28.6K/日。
  • 视觉建议:多轮对话上下文复用图 + 成本下降箭头。
  • 素材来源与状态:inference-optimization-ppt-materials.md Slide 16、dashboard-html-materials.mdcopilot-html-materials.md
  • 禁止表达:不要写成底层缓存术语堆料。
  • 市场加工提示:大型企业 Agent / Copilot 场景尤其适合使用。
P38

模型 / GPU 协同与异构调度:把存量、新卡和国产卡变成统一产能池

销售裁剪数字需披露确认Gate
C 运维 / C 财务 / D模型/GPU 协同、异构算力调度地方智算中心 70%,大型企业 30%

Token Factory 通过模型/GPU 协同和异构调度,把不同硬件组织成统一的高毛利 Token 产能池。

地方 70% / 企业 30%
  • 模型/GPU 热力矩阵:18 种模型、4 种 GPU,最佳匹配率 91.8%。
  • 错配损耗:产能损失约 101K tok/s,消除错配后有效产能 +4.2%,单位成本 -6.8%,月节省 ¥68K。
  • 异构案例:H20 & R6KD、海光 DCU、A800、GB300。
展开完整字段和演示提示
  • 主对象:C 运维 / C 财务 / D
  • C 类细分:地方智算中心运维财务、大型企业平台技术负责人
  • 场景权重:地方智算中心 70%,大型企业 30%
  • 功能归属:模型/GPU 协同、异构算力调度
  • 经营 / 治理问题:地方智算中心和大型企业往往拥有多型号 GPU、国产卡和存量资产,错配会造成产能和毛利损失。
  • 一句话结论:Token Factory 通过模型/GPU 协同和异构调度,把不同硬件组织成统一的高毛利 Token 产能池。
  • 页面内容:

- 模型/GPU 热力矩阵:18 种模型、4 种 GPU,最佳匹配率 91.8%。

- 错配损耗:产能损失约 101K tok/s,消除错配后有效产能 +4.2%,单位成本 -6.8%,月节省 ¥68K。

- 异构案例:H20 & R6KD、海光 DCU、A800、GB300。

- 策略:大模型优先高端 GPU,轻量模型迁移到 A100 / L40S,释放高端算力。

  • 可复用素材:Qwen-72B 在 A100 上成本 +18%,GLM-4-9B 在 H100 上算力浪费 42%。
  • 视觉建议:模型 x GPU 热力矩阵 + 资源池统一产能图。
  • 素材来源与状态:dashboard-html-materials.md 页面 8、inference-optimization-ppt-materials.md
  • 禁止表达:不要把异构调度讲成“兼容更多硬件”这么浅。
  • 市场加工提示:地方智算中心材料应重点突出“保护既有投资”。
P39

安全治理:Prompt 注入、越权、恶意工具、敏感输出和审计闭环

数字需披露确认Gate
C 安全 / C 平台负责人 / B 管理者安全与多租户防护地方智算中心 50%,大型企业 50%

安全治理不是附属模块,而是保护可售产能、客户隔离和关键业务连续性的基础能力。

地方 50% / 企业 50%
  • 今日总请求 18.7M,风险请求 23,412,拦截请求 23,224,拦截率 99.2%。
  • 风险类型:Prompt 注入、越权访问、恶意工具调用、敏感输出、数据泄漏尝试、多租户越界。
  • 业务保护:被保护业务 97.8%,安全事件闭环率 85.7%,平均处置时延 4.2min。
展开完整字段和演示提示
  • 主对象:C 安全 / C 平台负责人 / B 管理者
  • C 类细分:地方智算中心安全运维、大型企业安全合规
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 功能归属:安全与多租户防护
  • 经营 / 治理问题:Token 服务一旦进入多租户、Agent 和企业内部关键业务,就必须保护租户边界、业务连续性和审计链路。
  • 一句话结论:安全治理不是附属模块,而是保护可售产能、客户隔离和关键业务连续性的基础能力。
  • 页面内容:

- 今日总请求 18.7M,风险请求 23,412,拦截请求 23,224,拦截率 99.2%。

- 风险类型:Prompt 注入、越权访问、恶意工具调用、敏感输出、数据泄漏尝试、多租户越界。

- 业务保护:被保护业务 97.8%,安全事件闭环率 85.7%,平均处置时延 4.2min。

- 动作:临时降低配额、加强输入审计、收紧工具调用白名单。

  • 可复用素材:Prompt 注入尝试增加 15% 已全部拦截;测试沙盒 Prompt 注入尝试激增 340%。
  • 视觉建议:风险请求漏斗 + 风险类型分布 + 治理动作卡。
  • 素材来源与状态:dashboard-html-materials.md 页面 4。
  • 禁止表达:不要把安全写成“合规勾选项”。
  • 市场加工提示:公开材料要谨慎使用风险对象明细,闭门材料可展开。
P40

算电协同:电力是 Token 产能边界,不是 ESG 装饰

数字需披露确认Gate
C 管理层 / C 运维 / C 财务算电协同地方智算中心 80%,大型企业 20%

算电协同把电力约束从被动限制变成主动调度和经营优化能力。

地方 80% / 企业 20%
  • 实时总功率 1,847 kW,上限 2,400 kW,功率余量 553 kW。
  • PUE 1.28,单位 Token 电耗 2.28 mWh/M。
  • 协同后功率约束下额定产能 1.72M tok/s -> 2.10M tok/s,新增额定产能 +8.3%。
展开完整字段和演示提示
  • 主对象:C 管理层 / C 运维 / C 财务
  • C 类细分:地方智算中心管理层,辅助大型企业平台方
  • 场景权重:地方智算中心 80%,大型企业 20%
  • 功能归属:算电协同
  • 经营 / 治理问题:对地方智算中心来说,电力、PUE、分时电价、绿电和碳账户直接影响可售 Token 产能和毛利。
  • 一句话结论:算电协同把电力约束从被动限制变成主动调度和经营优化能力。
  • 页面内容:

- 实时总功率 1,847 kW,上限 2,400 kW,功率余量 553 kW。

- PUE 1.28,单位 Token 电耗 2.28 mWh/M。

- 协同后功率约束下额定产能 1.72M tok/s -> 2.10M tok/s,新增额定产能 +8.3%。

- 月节省电费 ¥38.2K,碳排放下降 37%。

- 业务保护策略:低优先级降频、区域分流、紧急降载、核心业务保护。

  • 可复用素材:算电协同本周累计提升额定产能 +8.3%,节省电费 ¥12.6K。
  • 视觉建议:功率水位 -> 调度策略 -> Token 产能 / 成本 / 业务保护。
  • 素材来源与状态:dashboard-html-materials.md 页面 7。
  • 禁止表达:不要把绿电和碳账户当成装饰性 ESG。
  • 市场加工提示:地方智算中心方案中必须保留,大型企业版可弱化。

---

# 第七章:落地路径与可信证据

第七章:落地路径与可信证据

P41-P42 · 2 页
P41

案例矩阵:不是概念,是多硬件、多模型下的可量化收益

骨干页销售裁剪数字需披露确认Gate
C 决策层 / D技术可信与案例证明地方智算中心 65%,大型企业 35%

DaoCloud 的推理优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800,能转化为可量化 Token 产能收益。

地方 65% / 企业 35%
  • H20 & R6KD:TTFT ↓97%,TPOT ↓91%,吞吐 ↑39x。
  • GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。
  • MiniMax-M2.5:单节点 73,495 tokens/s,P90 TTFT 270-490ms,P90 TPOT 19-35ms。
展开完整字段和演示提示
  • 主对象:C 决策层 / D
  • C 类细分:地方智算中心管理层、大型企业平台负责人、投资 / 战略视角
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 功能归属:技术可信与案例证明
  • 经营 / 治理问题:客户需要知道 DaoCloud 的能力不是概念,而是能在不同硬件和模型上拿到结果。
  • 一句话结论:DaoCloud 的推理优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800,能转化为可量化 Token 产能收益。
  • 页面内容:

- H20 & R6KD:TTFT ↓97%,TPOT ↓91%,吞吐 ↑39x。

- GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。

- MiniMax-M2.5:单节点 73,495 tokens/s,P90 TTFT 270-490ms,P90 TPOT 19-35ms。

- 海光 DCU Qwen3:吞吐 ↑49.5%,TPOT ↓50.3%。

- A800 通用基线:TPS ↑1.2x-2.1x,成本 ↓约 40%,TTFT ↓30-55%。

  • 可复用素材:Kubernetes Top3、vLLM Top5。
  • 视觉建议:五张案例卡片,字段统一为“硬件场景 / 优化动作 / 经营结果”。
  • 素材来源与状态:inference-optimization-ppt-materials.md,Top3 / Top5 为用户确认。
  • 禁止表达:不要展开过多底层缩写和命令级细节。
  • 市场加工提示:正式公开前需要确认案例可署名与数字可披露范围。
P42

落地路径:从资源盘点到 90 天样板经营闭环

骨干页销售裁剪数字需披露确认Gate
C 管理层 / C 项目负责人交付路径与下一步地方智算中心 60%,大型企业 40%

Token Factory 的落地不是一次性平台安装,而是从资源盘点、SLO 定义、PoC、经营测算到样板运营的闭环推进。

地方 60% / 企业 40%
  • 第 1 阶段:资源盘点,梳理 GPU / NPU / DCU、模型、客户 / 部门、功率、电力和现有平台。
  • 第 2 阶段:SLO 与经营口径定义,明确 TTFT、TPOT、吞吐、单位 Token 成本、毛利、预算、SLA。
  • 第 3 阶段:PoC 与基线测算,建立 Without / With 对比。
展开完整字段和演示提示
  • 主对象:C 管理层 / C 项目负责人
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 功能归属:交付路径与下一步
  • 经营 / 治理问题:客户不能只听完产品能力,需要知道下一步如何验证、落地和形成样板。
  • 一句话结论:Token Factory 的落地不是一次性平台安装,而是从资源盘点、SLO 定义、PoC、经营测算到样板运营的闭环推进。
  • 页面内容:

- 第 1 阶段:资源盘点,梳理 GPU / NPU / DCU、模型、客户 / 部门、功率、电力和现有平台。

- 第 2 阶段:SLO 与经营口径定义,明确 TTFT、TPOT、吞吐、单位 Token 成本、毛利、预算、SLA。

- 第 3 阶段:PoC 与基线测算,建立 Without / With 对比。

- 第 4 阶段:样板闭环,地方智算中心跑通租户 / 套餐 / 计量 / 结算 / 分成,大型企业跑通部门 / 应用 / 预算 / SLA / 审计。

- 第 5 阶段:领导决策材料,输出经营测算、技术方案、风险边界和后续扩展路径。

  • 可复用素材:地方智算中心初装费 + 运维费 + Token 分成;大型企业年度 Token 供给计划。
  • 视觉建议:90 天路线图,分为 0-30 / 31-60 / 61-90 天。
  • 素材来源与状态:copilot-html-materials.md 场景 1 / 2、inference-optimization-ppt-materials.md Slide 25。
  • 禁止表达:不要承诺“一次交付即经营成功”。
  • 市场加工提示:销售版可作为收口页;产品白皮书可拆成实施方法论。

---

市场团队裁剪建议

销售拜访版裁剪

建议从 42 页中裁剪为 25-30 页:

  • 必留:P01-P04、P05-P09、P10-P12、P15、P17、P20、P22-P23、P26-P30、P34-P35、P38-P42。
  • 可选:P16、P18-P19、P24-P25、P27-P28、P31-P33、P36-P37。
  • 删除或放备份:字段过细的资产表、完整租户清单、完整热力矩阵、安全对象明细、绿证 / 碳交易细账。

官网版裁剪

建议抽象为统一入口的 6 个模块:

  • 产品定位:P01-P04。
  • 两类用户场景:P05-P08。
  • 产品能力全景:P10-P14。
  • 经营驾驶与智能工作台:P22-P33。
  • 技术先进性:P34-P41。
  • 落地与联系:P42。

Demo 脚本裁剪

建议按一条真实演示链路组织:

  1. A/B 从 MaaS 出口调用 Token:P15-P16。
  2. C 在 Dashboard 看经营总览:P22-P23。
  3. C 看租户 / 部门经营:P24-P25。
  4. C 看 FinOps 和资产回本:P26-P27。
  5. C 用 Copilot 问毛利、容量、SLA:P29-P33。
  6. 回到后台执行策略并在 Dashboard 验证结果:P17-P21、P28。

红队自检

本版完成后必须通过以下检查:

  • 旧版 sales-ppt-outline-v1.md 未覆盖。
  • 本文是产品功能增强版素材母稿,不是最终 PPTX。
  • 每页都有主对象、C 类细分、场景权重、功能归属、经营 / 治理问题。
  • C 类仍为主客户,地方智算中心约 60%,大型企业约 40%。
  • A/B 只作为 C 买单后的价值证明,不抢采购主线。
  • MaaS 只作为出口,Token Factory 仍是供给、经营、治理和优化系统。
  • Dashboard 被写成经营驾驶系统,不是监控大屏。
  • Copilot 被写成智能工作台,不是聊天机器人。
  • Copilot 的动作边界明确:分析、解释、建议、生成草案;高风险动作回后台。
  • 技术能力都转译为收入、成本、毛利、SLA、利用率、回本期、安全、治理效率或交付可复制性。
  • 强数字保留来源与状态,正式公开前需要可披露确认。