单体 HTML artifact · 销售拜访版 · 离线可打开

Token Factory 销售拜访版 PPT 大纲 v1

这是为高层销售拜访大纲做的一遍 review cockpit：先看叙事主线、Gate Dashboard 和三条 review 路径，再按章节 drill down。它不是最终 PPT，也不替代原始 Markdown。

状态v1 讨论稿

用途给市场团队和后续 vibe PPT / 其他 Agent 工具生产 PPT 使用

目标页数30 页

听众地方智算中心与大型企业高层领导，兼顾技术/运营/财务负责人

权重60% 地方智算中心，40% 大型企业内部 MaaS / Token 供给平台

边界本文只输出 PPT 大纲和内容草稿，不生成最终 PPT、不写官网文案、不做视觉设计

Source Hashbb446c9f67d9

Generated2026-05-14 06:35:52 UTC

一遍 review 的读法

按销售叙事先看骨架。默认先检查叙事骨干和 Gate Dashboard；需要打磨某页时，再展开完整字段看讲述逻辑、视觉建议和下一步引导。

为什么现在

两类 C

产品定位

经营闭环

技术可信

下一步

边界提醒

这个 HTML 是展示 artifact。版本维护、决策记录和后续增删改仍以 sales-ppt-outline-v1.md 为准。

30分页设计

6章节

60/40地方智算 / 大型企业

30含强数字页

Gate Dashboard

销售拜访版常驻红队边界

C Primary销售拜访主客户仍是 C，A/B 只是证明 C 买后能产生价值。

Executive First这是高层销售拜访版，不是产品手册、官网或技术白皮书。

60/40地方智算中心约 60%，大型企业约 40%。

MaaS BoundaryMaaS 是出口，Token Factory 是供给、经营、治理系统。

DashboardDashboard 按已有经营驾驶系统表达，不写成监控大屏。

CopilotCopilot 按已有智能工作台表达，不写成聊天机器人。

Disclosure强数字可进内部拜访稿，公开前需确认披露范围。

三条 review 路径

避免连续滚 30 页

Narrative Spine

P01-P05、P08、P11-P13、P18、P21-P23、P25、P28-P30。用于快速检查销售主线。

Executive Sales Cut

优先看可直接进入高层拜访稿的页卡。

Full Review

完整检查 30 页，适合市场团队二次加工前逐页核对。

章节地图

销售叙事从问题到下一步

01P01-P04 · 4 页开场与问题定义

02P05-P10 · 6 页两类 C 客户场景

03P11-P15 · 5 页Token Factory 定位

04P16-P21 · 6 页产品经营闭环

05P22-P27 · 6 页技术可信与经营结果

06P28-P30 · 3 页合作模式与下一步

Token Factory 不是模型 API 商店，也不是推理平台换名，而是帮助地方智算中心把 GPU 资源变成可售卖、可计量、可运营的 Token 产能，同时帮助大型企业把模型和算力能力变成可治理、可分账、可持续供给的内部 MaaS 操作系统。

销售拜访时要让高层领导相信三件事：

他们的问题不是“有没有 GPU / 模型”，而是“GPU 和模型能不能形成稳定 Token 供给与经营闭环”。
Token Factory 能把 MaaS 出口、管理后台、Dashboard、Copilot、推理优化、算电协同组织成一套经营系统。
DaoCloud 有资格做这件事：Kubernetes Top3、vLLM Top5、InferX 推理优化、异构硬件案例、Dashboard / Copilot 已有能力。

整套 PPT 不是产品功能介绍，而是一条高层销售拜访路径：

为什么现在需要 Token Factory。
地方智算中心和大型企业分别卡在哪里。
Token Factory 到底是什么，为什么不是 ToC MaaS。
Token Factory 如何把 GPU 资源组织成 Token 经营闭环。
DaoCloud 为什么能做成。
如何合作落地，下一步怎么推进。

30 页大纲卡片

默认摘要，按需展开完整字段

第一章：开场与问题定义

P01-P04 · 4 页

P01

Token Factory：把 GPU 变成可经营的 Token 产能

叙事骨干拜访可用数字需披露确认Gate

C 管理层开场定位地方智算中心 60%，大型企业 40%

Token Factory 不是一个工具，而是一套把 GPU 资源转化为可交付、可计量、可经营 Token 产能的系统。

地方 60% / 企业 40%

讲述逻辑：先定调，避免客户把后续内容理解成“模型 API 门户”或“推理平台换名”。

主标题：Token Factory
副标题：GPU 资源变现与内部供给的 MaaS 操作系统
三个关键词：供给、经营、治理

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心管理层、大型企业平台负责人
场景权重：地方智算中心 60%，大型企业 40%
销售作用：开场定位
一句话结论：Token Factory 不是一个工具，而是一套把 GPU 资源转化为可交付、可计量、可经营 Token 产能的系统。
讲述逻辑：先定调，避免客户把后续内容理解成“模型 API 门户”或“推理平台换名”。
页面内容：

- 主标题：Token Factory

- 副标题：GPU 资源变现与内部供给的 MaaS 操作系统

- 三个关键词：供给、经营、治理

- 两类客户：地方智算中心对外经营，大型企业内部供给

视觉建议：一张中心图，左侧是 GPU / NPU / DCU 资源，右侧是 Token API、企业应用、Agent、Copilot，中心是 Token Factory 工厂。
素材来源：HARD_GATES.md、source-prototype-materials.md
禁止表达：不要写成“最好的模型 API 平台”“开发者调用入口”。
下一步引导：让客户接受“今天谈的是经营系统，不是 API 门户”。

P02

AI 竞争正在从“有模型”转向“有稳定 Token 供给”

叙事骨干拜访可用数字需披露确认Gate

C 管理层建立时代背景地方智算中心 55%，大型企业 45%

模型能力正在变成基础能力，真正拉开差距的是稳定、低成本、可治理、可运营的 Token 供给体系。

地方 55% / 企业 45%

讲述逻辑：客户高层通常已经知道 AI 热，但需要把关注点从“模型”移动到“供给能力”。

模型越来越多，API 越来越标准化。
企业和平台真正要买的是持续服务质量。
Token 供给的竞争指标：成本、吞吐、SLA、治理、运营、交付。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心管理层、大型企业平台负责人
场景权重：地方智算中心 55%，大型企业 45%
销售作用：建立时代背景
一句话结论：模型能力正在变成基础能力，真正拉开差距的是稳定、低成本、可治理、可运营的 Token 供给体系。
讲述逻辑：客户高层通常已经知道 AI 热，但需要把关注点从“模型”移动到“供给能力”。
页面内容：

- 模型越来越多，API 越来越标准化。

- 企业和平台真正要买的是持续服务质量。

- Token 供给的竞争指标：成本、吞吐、SLA、治理、运营、交付。

视觉建议：从“模型竞争”到“Token 供给竞争”的横向迁移图。
素材来源：source-prototype-materials.md、inference-optimization-ppt-materials.md
禁止表达：不要做宏观 AI 行业长篇介绍。
下一步引导：引出“有资源不等于有供给”。

P03

有 GPU，不等于有产能；有产能，不等于有收入

叙事骨干拜访可用数字需披露确认Gate

C 管理层定义核心痛点地方智算中心 70%，大型企业 30%

GPU 是资产，Token 产能才是可交付能力；只有可计量、可结算、可治理，产能才会变成收入或内部价值。

地方 70% / 企业 30%

讲述逻辑：用三段断裂解释客户现状：资产到产能、产能到服务、服务到经营结果。

断点 1：GPU 在线但利用率、调度、模型匹配不稳定。
断点 2：模型能跑但没有 MaaS 出口、计量、租户、权限、SLA。
断点 3：有调用但没有经营指标、毛利、回本期、客户运营。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心管理者、C 财务、大型企业平台负责人
场景权重：地方智算中心 70%，大型企业 30%
销售作用：定义核心痛点
一句话结论：GPU 是资产，Token 产能才是可交付能力；只有可计量、可结算、可治理，产能才会变成收入或内部价值。
讲述逻辑：用三段断裂解释客户现状：资产到产能、产能到服务、服务到经营结果。
页面内容：

- 断点 1：GPU 在线但利用率、调度、模型匹配不稳定。

- 断点 2：模型能跑但没有 MaaS 出口、计量、租户、权限、SLA。

- 断点 3：有调用但没有经营指标、毛利、回本期、客户运营。

视觉建议：三段断裂链路图，断点用红色标出；下方给 Token Factory 修复链路。
素材来源：HARD_GATES.md、dashboard-html-materials.md
禁止表达：不要把地方智算中心简化成“缺运维工具”。
下一步引导：客户问题不是缺单点能力，而是缺闭环。

P04

C 类客户的共同命题：对外变现与内部供给，本质都需要经营闭环

叙事骨干拜访可用数字需披露确认Gate

C 管理层建立双场景框架地方智算中心 60%，大型企业 40%

地方智算中心要把资源变成外部收入，大型企业要把资源变成内部可治理供给，本质上都需要 Token Factory。

地方 60% / 企业 40%

讲述逻辑：明确两类 C 不是两个产品，而是同一套系统的两个经营目标。

地方智算中心：客户、套餐、计费、毛利、资产回本。
大型企业：部门、预算、应用、Agent、SLA、安全、合规。
共性：统一供给、计量、治理、经营、优化。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心、大型企业平台方
场景权重：地方智算中心 60%，大型企业 40%
销售作用：建立双场景框架
一句话结论：地方智算中心要把资源变成外部收入，大型企业要把资源变成内部可治理供给，本质上都需要 Token Factory。
讲述逻辑：明确两类 C 不是两个产品，而是同一套系统的两个经营目标。
页面内容：

- 地方智算中心：客户、套餐、计费、毛利、资产回本。

- 大型企业：部门、预算、应用、Agent、SLA、安全、合规。

- 共性：统一供给、计量、治理、经营、优化。

视觉建议：左右双场景对照，中间是共用的 Token Factory 能力栈。
素材来源：HARD_GATES.md、source-prototype-materials.md
禁止表达：不要把大型企业写成附录，也不要削弱地方智算中心第一优先级。
下一步引导：分别进入两类 C 场景。

---

# 第二章：两类 C 客户场景

第二章：两类 C 客户场景

P05-P10 · 6 页

P05

地方智算中心：从算力资产到区域 AI 服务商

叙事骨干拜访可用数字需披露确认Gate

C 管理层地方智算中心痛点页地方智算中心 100%，大型企业 0%

地方智算中心的升级方向不是继续卖裸算力，而是成为本区域可持续供给 AI 能力的 MaaS 运营方。

地方 100% / 企业 -%

讲述逻辑：从领导视角讲“资产怎么变生意”，而不是讲集群怎么管理。

资源侧：已有 GPU / NPU / 国产卡 / 机房 / 电力。
市场侧：本地企业、政府、产业客户需要可用 AI 能力。
缺口：客户承接、API 服务、计量计费、运营工具、SLA、成本控制。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心管理层、C 运营
场景权重：地方智算中心 100%，大型企业 0%
销售作用：地方智算中心痛点页
一句话结论：地方智算中心的升级方向不是继续卖裸算力，而是成为本区域可持续供给 AI 能力的 MaaS 运营方。
讲述逻辑：从领导视角讲“资产怎么变生意”，而不是讲集群怎么管理。
页面内容：

- 资源侧：已有 GPU / NPU / 国产卡 / 机房 / 电力。

- 市场侧：本地企业、政府、产业客户需要可用 AI 能力。

- 缺口：客户承接、API 服务、计量计费、运营工具、SLA、成本控制。

- Token Factory 作用：把算力资源组织成可售 Token 服务。

视觉建议：地方智算中心升级阶梯：资源中心 → 服务中心 → 运营中心 → 区域 AI 服务商。
素材来源：source-prototype-materials.md、copilot-html-materials.md
禁止表达：不要把它写成 IDC 机房运维方案。
下一步引导：进入地方智算中心经营闭环。

P06

地方智算中心的经营闭环：客户、套餐、用量、毛利、SLA 必须连起来

拜访可用数字需披露确认Gate

C 运营证明 Token Factory 是经营系统地方智算中心 100%，大型企业 0%

地方智算中心要经营 Token 生意，必须把客户、套餐、Token 用量、收入、毛利、SLA、算电协同放到同一套系统里。

地方 100% / 企业 -%

讲述逻辑：把老板原型中的运营型客户“初装费 + 运维费 + Token 分成”转成闭环。

客户获取：企业客户、开发者、AI 应用、Agent 生态。
售卖方式：套餐、API Key、模型服务、用量账单。
经营指标：ARPU、套餐消耗率、收入、毛利、续费。

展开完整字段和演示提示

主对象：C 运营
C 类细分：地方智算中心运营、C 财务、C 管理层
场景权重：地方智算中心 100%，大型企业 0%
销售作用：证明 Token Factory 是经营系统
一句话结论：地方智算中心要经营 Token 生意，必须把客户、套餐、Token 用量、收入、毛利、SLA、算电协同放到同一套系统里。
讲述逻辑：把老板原型中的运营型客户“初装费 + 运维费 + Token 分成”转成闭环。
页面内容：

- 客户获取：企业客户、开发者、AI 应用、Agent 生态。

- 售卖方式：套餐、API Key、模型服务、用量账单。

- 经营指标：ARPU、套餐消耗率、收入、毛利、续费。

- 供给保障：SLA、容量、功率、风险防护。

视觉建议：经营飞轮图：获客 → 接入 → 消费 → 计量 → 结算 → 毛利 → 运营动作。
素材来源：dashboard-html-materials.md、copilot-html-materials.md
禁止表达：不要只讲“计费模块”。
下一步引导：进入可量化指标。

P07

地方智算中心的关键指标：不是卡有多少，而是每张卡贡献多少

拜访可用数字需披露确认Gate

C 财务经营指标证明地方智算中心 90%，大型企业 10%

Token Factory 把 GPU 经营结果量化到吞吐、单位成本、毛利、单机收入、回本期和低效预警。

地方 90% / 企业 10%

讲述逻辑：用 Dashboard 和推理优化数字证明“经营可量化”。

Without / With Token Factory：总吞吐 +50.6%，单位 Token 成本 -29.1%，日均毛利 +62.9%。
单卡经营：H200 / DeepSeek 示例，单卡月收入 0.52 万 → 0.93 万，成本 0.68 万不变。
单机资产经营：H100/H800/A100/L40S 可看收入、毛利、回本期、低效预警。

展开完整字段和演示提示

主对象：C 财务
C 类细分：地方智算中心管理层、C 财务、C 运营
场景权重：地方智算中心 90%，大型企业 10%
销售作用：经营指标证明
一句话结论：Token Factory 把 GPU 经营结果量化到吞吐、单位成本、毛利、单机收入、回本期和低效预警。
讲述逻辑：用 Dashboard 和推理优化数字证明“经营可量化”。
页面内容：

- Without / With Token Factory：总吞吐 +50.6%，单位 Token 成本 -29.1%，日均毛利 +62.9%。

- 单卡经营：H200 / DeepSeek 示例，单卡月收入 0.52 万 → 0.93 万，成本 0.68 万不变。

- 单机资产经营：H100/H800/A100/L40S 可看收入、毛利、回本期、低效预警。

视觉建议：三层经营指标卡：平台级、单卡级、单机资产级。
素材来源：dashboard-html-materials.md、inference-optimization-ppt-materials.md
禁止表达：不要只讲 GPU 利用率，必须讲收入和毛利。
下一步引导：大型企业虽然不一定对外售卖，也需要同样的内部治理。

P08

大型企业：从分散 AI 调用到统一内部 MaaS

叙事骨干拜访可用数字需披露确认Gate

C 管理层大型企业场景定义地方智算中心 0%，大型企业 100%

大型企业建设 Token Factory，不是为了对外卖 API，而是为了把内部 AI 能力统一供给、统一治理、统一分摊。

地方 -% / 企业 100%

讲述逻辑：纠正 MaaS 只等于 ToC 的误解，强调大型企业同样是 C 类采购主体。

内部需求：Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。
当前问题：模型调用分散、预算不清、SLA 不稳、安全审计不足。
Token Factory 价值：统一模型服务、统一 API、统一配额、统一预算、统一治理。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：大型企业平台方、企业 IT / AI 平台负责人
场景权重：地方智算中心 0%，大型企业 100%
销售作用：大型企业场景定义
一句话结论：大型企业建设 Token Factory，不是为了对外卖 API，而是为了把内部 AI 能力统一供给、统一治理、统一分摊。
讲述逻辑：纠正 MaaS 只等于 ToC 的误解，强调大型企业同样是 C 类采购主体。
页面内容：

- 内部需求：Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。

- 当前问题：模型调用分散、预算不清、SLA 不稳、安全审计不足。

- Token Factory 价值：统一模型服务、统一 API、统一配额、统一预算、统一治理。

视觉建议：企业内部多应用接入统一 MaaS 的汇聚图。
素材来源：HARD_GATES.md、dashboard-html-materials.md、copilot-html-materials.md
禁止表达：不要把大型企业讲成地方智算中心的次要补充。
下一步引导：进入企业内部治理闭环。

P09

大型企业的内部治理闭环：预算、分摊、应用、SLA、安全必须可见

拜访可用数字需披露确认Gate

C 大型企业平台方大型企业价值证明地方智算中心 0%，大型企业 100%

企业内部 MaaS 如果不能统计、分摊、预算、审计和保障 SLA，就会变成新的成本黑洞。

地方 -% / 企业 100%

讲述逻辑：用 B 类使用管理证明 C 类大型企业采购价值。

活跃部门 23，应用 / Agent 156。
Showback 覆盖率 91.3%，关键业务保障率 99.5%。
部门消费排行：研发中心、智能营销、客服中心、数据平台等。

展开完整字段和演示提示

主对象：C 大型企业平台方
C 类细分：大型企业平台负责人、B 管理者、C 财务
场景权重：地方智算中心 0%，大型企业 100%
销售作用：大型企业价值证明
一句话结论：企业内部 MaaS 如果不能统计、分摊、预算、审计和保障 SLA，就会变成新的成本黑洞。
讲述逻辑：用 B 类使用管理证明 C 类大型企业采购价值。
页面内容：

- 活跃部门 23，应用 / Agent 156。

- Showback 覆盖率 91.3%，关键业务保障率 99.5%。

- 部门消费排行：研发中心、智能营销、客服中心、数据平台等。

- 客服中心 Copilot 业务价值评分 A+，月均节省人工成本约 ¥180K。

视觉建议：企业内部治理仪表盘对照：部门、应用、预算、SLA、安全。
素材来源：dashboard-html-materials.md
禁止表达：不要把 B 类当最终采购主线；它是 C 买单后的价值证明。
下一步引导：说明 A/B 如何共同证明 C 的平台价值。

P10

A/B 的价值证明：C 买了以后，谁会真正用起来

拜访可用数字需披露确认Gate

C 管理层下游价值闭环地方智算中心 50%，大型企业 50%

A 是 Token 能力的真实使用者，B 是企业内部使用与管理者；只有服务好 A/B，C 的采购才有持续价值。

地方 50% / 企业 50%

讲述逻辑：把用户定义纳入销售主线，但不让 A/B 抢 C 的主客户位置。

A：开发者、AI 应用、OpenClaw、Agent、终端用户。
B：部门、员工、项目、企业内部平台管理者。
地方智算中心：A/B 带来外部流量和收入。

展开完整字段和演示提示

主对象：C 管理层
辅助对象：A、B
C 类细分：地方智算中心、大型企业平台方
场景权重：地方智算中心 50%，大型企业 50%
销售作用：下游价值闭环
一句话结论：A 是 Token 能力的真实使用者，B 是企业内部使用与管理者；只有服务好 A/B，C 的采购才有持续价值。
讲述逻辑：把用户定义纳入销售主线，但不让 A/B 抢 C 的主客户位置。
页面内容：

- A：开发者、AI 应用、OpenClaw、Agent、终端用户。

- B：部门、员工、项目、企业内部平台管理者。

- 地方智算中心：A/B 带来外部流量和收入。

- 大型企业：A/B 带来内部使用效率和治理价值。

视觉建议：A/B/C/D 角色流转图，突出 C 是采购运营主体。
素材来源：HARD_GATES.md、source-prototype-materials.md
禁止表达：不要把 A 类终端体验写成主客户。
下一步引导：正式定义 Token Factory。

---

# 第三章：Token Factory 定位

第三章：Token Factory 定位

P11-P15 · 5 页

P11

Token Factory 是什么：GPU 资源变现与内部供给的 MaaS 操作系统

叙事骨干拜访可用数字需披露确认Gate

C 管理层产品定义地方智算中心 60%，大型企业 40%

Token Factory 是把 GPU、模型、推理、网关、计量、结算、Dashboard、Copilot 组织成持续 Token 供给能力的系统。

地方 60% / 企业 40%

讲述逻辑：把前面的痛点收束成产品定义。

地方智算中心：GPU 资源变现的 MaaS 操作系统。
大型企业：内部模型能力供给与治理的 MaaS 操作系统。
共性：供给、经营、治理、优化。

展开完整字段和演示提示

主对象：C 管理层
辅助对象：D
C 类细分：地方智算中心、大型企业平台方
场景权重：地方智算中心 60%，大型企业 40%
销售作用：产品定义
一句话结论：Token Factory 是把 GPU、模型、推理、网关、计量、结算、Dashboard、Copilot 组织成持续 Token 供给能力的系统。
讲述逻辑：把前面的痛点收束成产品定义。
页面内容：

- 地方智算中心：GPU 资源变现的 MaaS 操作系统。

- 大型企业：内部模型能力供给与治理的 MaaS 操作系统。

- 共性：供给、经营、治理、优化。

视觉建议：一句话定义 + 双场景副标题，不要堆模块图。
素材来源：HARD_GATES.md、source-prototype-materials.md
禁止表达：不要说“Token Factory 是一个推理平台”。
下一步引导：解释 MaaS 与 Token Factory 的关系。

P12

MaaS 是出口，Token Factory 是工厂

叙事骨干拜访可用数字需披露确认Gate

C 管理层避免 ToC MaaS 误读地方智算中心 60%，大型企业 40%

MaaS 负责把模型服务交付出去，Token Factory 负责背后的供给、调度、计量、治理、经营和优化。

地方 60% / 企业 40%

讲述逻辑：把“API/Console”和“生产经营系统”分开讲。

MaaS 出口：API、模型目录、Playground、Endpoint、用量账单。
工厂能力：算力调度、推理加速、AI 网关、租户管理、计量计费、Dashboard、Copilot、后台执行。
地方智算中心：对外售卖。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心运营、大型企业平台方
场景权重：地方智算中心 60%，大型企业 40%
销售作用：避免 ToC MaaS 误读
一句话结论：MaaS 负责把模型服务交付出去，Token Factory 负责背后的供给、调度、计量、治理、经营和优化。
讲述逻辑：把“API/Console”和“生产经营系统”分开讲。
页面内容：

- MaaS 出口：API、模型目录、Playground、Endpoint、用量账单。

- 工厂能力：算力调度、推理加速、AI 网关、租户管理、计量计费、Dashboard、Copilot、后台执行。

- 地方智算中心：对外售卖。

- 大型企业：内部供给。

视觉建议：冰山图，水面是 MaaS 出口，水下是 Token Factory 工厂能力。
素材来源：source-prototype-materials.md、copilot-html-materials.md
禁止表达：不要让 MaaS 变成全篇主角。
下一步引导：展示系统边界。

P13

一张图讲清系统边界：服务出口、控制面、驾驶舱、智能工作台

叙事骨干拜访可用数字需披露确认Gate

C 技术与管理层系统可信度地方智算中心 55%，大型企业 45%

Token Factory 由 MaaS 服务出口、管理后台控制面、Dashboard 经营驾驶、Copilot 智能工作台和底层基础设施共同形成闭环。

地方 55% / 企业 45%

讲述逻辑：系统边界要清楚，但不能变功能清单。

d.run/api：OpenAI-Compatible API。
d.run/console：MaaS 前台。
d.run/management：管理后台。

展开完整字段和演示提示

主对象：C 技术与管理层
C 类细分：地方智算中心技术负责人、大型企业平台负责人
场景权重：地方智算中心 55%，大型企业 45%
销售作用：系统可信度
一句话结论：Token Factory 由 MaaS 服务出口、管理后台控制面、Dashboard 经营驾驶、Copilot 智能工作台和底层基础设施共同形成闭环。
讲述逻辑：系统边界要清楚，但不能变功能清单。
页面内容：

- d.run/api：OpenAI-Compatible API。

- d.run/console：MaaS 前台。

- d.run/management：管理后台。

- d.run/copilot：智能工作台。

- Container / Observability：基础设施管理与可观测。

- Dashboard：经营驾驶系统。

视觉建议：分层架构图，顶部是 A/B 使用入口，中间是经营与治理，底部是算力与推理底座。
素材来源：source-prototype-materials.md
禁止表达：不要画成一个复杂菜单树。
下一步引导：从系统边界转入价值链。

P14

从资源到收入 / 内部价值：Token Factory 管的是完整价值链

拜访可用数字需披露确认Gate

C 管理层价值链定义地方智算中心 60%，大型企业 40%

Token Factory 把 GPU / NPU、模型、推理服务、Token、用户、部门、计量结算和治理指标串成一条可经营价值链。

地方 60% / 企业 40%

讲述逻辑：把 P13 的系统能力翻译成经营链路。

资源：GPU / NPU / DCU / 电力 / 网络 / 存储。
生产：模型服务、推理加速、KV Cache、调度、网关。
交付：MaaS API、应用、Agent、Copilot。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：地方智算中心管理层、大型企业平台方
场景权重：地方智算中心 60%，大型企业 40%
销售作用：价值链定义
一句话结论：Token Factory 把 GPU / NPU、模型、推理服务、Token、用户、部门、计量结算和治理指标串成一条可经营价值链。
讲述逻辑：把 P13 的系统能力翻译成经营链路。
页面内容：

- 资源：GPU / NPU / DCU / 电力 / 网络 / 存储。

- 生产：模型服务、推理加速、KV Cache、调度、网关。

- 交付：MaaS API、应用、Agent、Copilot。

- 经营：计量、账单、套餐、分成、预算、毛利。

- 治理：SLA、安全、审计、容量、算电协同。

视觉建议：从左到右的价值链，分外部经营和内部供给两条输出。
素材来源：dashboard-html-materials.md、inference-optimization-ppt-materials.md
禁止表达：不要只画技术架构。
下一步引导：回到 A/B/C/D 角色如何进入系统。

P15

四类用户如何进入同一套系统

拜访可用数字需披露确认Gate

C 管理层用户边界校准地方智算中心 55%，大型企业 45%

A 使用 Token，B 管理消费，C 采购并经营平台，D 证明 DaoCloud 的产品和资本价值。

地方 55% / 企业 45%

讲述逻辑：防止后续内容混淆对象。

A：通过 API / AI 应用 / OpenClaw / Agent 使用 Token。
B：看部门、预算、费用、应用、效率和治理。
C：建设并运营 Token 供给平台。

展开完整字段和演示提示

主对象：C 管理层
辅助对象：A、B、D
C 类细分：地方智算中心、大型企业平台方
场景权重：地方智算中心 55%，大型企业 45%
销售作用：用户边界校准
一句话结论：A 使用 Token，B 管理消费，C 采购并经营平台，D 证明 DaoCloud 的产品和资本价值。
讲述逻辑：防止后续内容混淆对象。
页面内容：

- A：通过 API / AI 应用 / OpenClaw / Agent 使用 Token。

- B：看部门、预算、费用、应用、效率和治理。

- C：建设并运营 Token 供给平台。

- D：DaoCloud 的技术、产品化、市场和投资叙事。

- 重点：当前销售主线服务 C。

视觉建议：四层角色图，C 位于采购运营中心，A/B 是价值证明，D 是可信背书。
素材来源：HARD_GATES.md
禁止表达：不要把四类用户画成同等优先级客户。
下一步引导：进入产品闭环。

---

# 第四章：产品经营闭环

第四章：产品经营闭环

P16-P21 · 6 页

P16

MaaS 服务出口：让 Token 可交付、可消费、可计量

数字需披露确认Gate

C 运营证明 C 买了以后能服务 A/B地方智算中心 65%，大型企业 35%

MaaS 出口让 Token 不停留在推理服务内部，而是能被客户、部门、应用和 Agent 真正消费。

地方 65% / 企业 35%

讲述逻辑：MaaS 作为出口，但不是主线全部。

API 门户、模型目录、Playground、Endpoint。
API Key、用量、配额、账单。
AI 应用、Agent、OpenClaw、Workflow 接入。

展开完整字段和演示提示

主对象：C 运营
辅助对象：A、B
C 类细分：地方智算中心运营、大型企业平台方
场景权重：地方智算中心 65%，大型企业 35%
销售作用：证明 C 买了以后能服务 A/B
一句话结论：MaaS 出口让 Token 不停留在推理服务内部，而是能被客户、部门、应用和 Agent 真正消费。
讲述逻辑：MaaS 作为出口，但不是主线全部。
页面内容：

- API 门户、模型目录、Playground、Endpoint。

- API Key、用量、配额、账单。

- AI 应用、Agent、OpenClaw、Workflow 接入。

- 地方智算中心：对外客户和生态接入。

- 大型企业：内部应用与部门接入。

视觉建议：入口流图：A/B 通过 API、Console、应用接入 Token Factory。
素材来源：source-prototype-materials.md
禁止表达：不要把这一页写成 ToC 开发者平台介绍。
下一步引导：交付后需要控制面治理。

P17

管理后台：经营优先的控制面

数字需披露确认Gate

C 运营证明可商用、可治理地方智算中心 60%，大型企业 40%

Token 服务要进入生产和经营，必须有租户、模型、配额、计量、分账、安全、审计和策略执行的统一控制面。

地方 60% / 企业 40%

讲述逻辑：后台不是技术菜单，而是 Token 生意/内部供给的执行层。

租户 / 工作区 / 部门。
模型与服务。
配额 / 策略 / 限流。

展开完整字段和演示提示

主对象：C 运营
C 类细分：C 运营、C 运维、C 财务、安全/合规
场景权重：地方智算中心 60%，大型企业 40%
销售作用：证明可商用、可治理
一句话结论：Token 服务要进入生产和经营，必须有租户、模型、配额、计量、分账、安全、审计和策略执行的统一控制面。
讲述逻辑：后台不是技术菜单，而是 Token 生意/内部供给的执行层。
页面内容：

- 租户 / 工作区 / 部门。

- 模型与服务。

- 配额 / 策略 / 限流。

- 用量 / 计费 / 分账。

- 审计 / 合规 / 安全。

- 集群 / GPU / 网络 / 存储 / 生命周期。

视觉建议：控制面九宫格，但每格标注经营含义。
素材来源：source-prototype-materials.md
禁止表达：不要写成普通后台菜单。
下一步引导：有控制面还不够，高层需要看经营结果。

P18

Dashboard：Token 经营驾驶系统，不是普通监控大屏

叙事骨干拜访可用数字需披露确认Gate

C 管理层证明经营可见地方智算中心 65%，大型企业 35%

Dashboard 把产能、收入、毛利、客户、资产、SLA、安全、算电协同放到一个经营视角里。

地方 65% / 企业 35%

讲述逻辑：先用高层经营总览，再解释不同角色视角。

经营价值：实时吞吐 2.41M Token/s，今日收入 ¥847.2K，今日毛利 ¥323.4K。
基线增益：总吞吐 +50.6%，单位 Token 成本 -29.1%，日均毛利 +62.9%。
价值归因：调度优化、KV Cache、模型匹配、算电协同、安全防护。

展开完整字段和演示提示

主对象：C 管理层
C 类细分：C 运营、C 财务、C 运维
场景权重：地方智算中心 65%，大型企业 35%
销售作用：证明经营可见
一句话结论：Dashboard 把产能、收入、毛利、客户、资产、SLA、安全、算电协同放到一个经营视角里。
讲述逻辑：先用高层经营总览，再解释不同角色视角。
页面内容：

- 经营价值：实时吞吐 2.41M Token/s，今日收入 ¥847.2K，今日毛利 ¥323.4K。

- 基线增益：总吞吐 +50.6%，单位 Token 成本 -29.1%，日均毛利 +62.9%。

- 价值归因：调度优化、KV Cache、模型匹配、算电协同、安全防护。

- 经营建议：套餐升级、低优先级任务调度、安全异常关注。

视觉建议：Dashboard 截图或仿真驾驶舱，叠加 3 个大指标卡。
素材来源：dashboard-html-materials.md
禁止表达：不要只说“监控指标更丰富”。
下一步引导：Dashboard 如何分别支撑地方智算和大型企业。

P19

Dashboard 连接两类经营对象：外部租户与内部部门

拜访可用数字需披露确认Gate

C 运营双场景能力证明地方智算中心 50%，大型企业 50%

同一套 Dashboard 可以让地方智算中心看租户经营，也可以让大型企业看部门、应用、Agent 和预算治理。

地方 50% / 企业 50%

讲述逻辑：把 Dashboard 从“功能页”转成“双场景经营证据”。

地方智算中心：活跃租户 47，月 Token 消费 3.82T，月收入 ¥846.7K，ARPU ¥18.0K。
租户机会：星辰科技套餐消耗率 92%，预计升级月增收 ¥45K。
大型企业：活跃部门 23，应用 / Agent 156，预算使用率 72.4%，单位业务成本 ¥4.11/M。

展开完整字段和演示提示

主对象：C 运营
辅助对象：B
C 类细分：地方智算中心运营、大型企业平台方
场景权重：地方智算中心 50%，大型企业 50%
销售作用：双场景能力证明
一句话结论：同一套 Dashboard 可以让地方智算中心看租户经营，也可以让大型企业看部门、应用、Agent 和预算治理。
讲述逻辑：把 Dashboard 从“功能页”转成“双场景经营证据”。
页面内容：

- 地方智算中心：活跃租户 47，月 Token 消费 3.82T，月收入 ¥846.7K，ARPU ¥18.0K。

- 租户机会：星辰科技套餐消耗率 92%，预计升级月增收 ¥45K。

- 大型企业：活跃部门 23，应用 / Agent 156，预算使用率 72.4%，单位业务成本 ¥4.11/M。

- B 价值：客服中心 Copilot 月均节省人工约 ¥180K。

视觉建议：左右对照页，左边租户经营，右边部门治理。
素材来源：dashboard-html-materials.md
禁止表达：不要让企业内部场景变成“顺便也能看”。
下一步引导：高层最关心资产和财务。

P20

FinOps 与资产经营：每台机器都要能回答“赚不赚钱、多久回本”

拜访可用数字需披露确认Gate

C 财务财务可信度地方智算中心 70%，大型企业 30%

Token Factory 把 GPU 从成本中心变成可核算资产，按机器看收入、毛利、回本期、低效预警。

地方 70% / 企业 30%

讲述逻辑：把采购决策拉到高层关心的 ROI 和资产回报。

本月累计收入 ¥11.82M，成本 ¥7.33M，毛利 ¥4.49M。
单位 Token 成本 ¥4.11/百万，单位收入 ¥6.66/百万，单位毛利 ¥2.55/百万。
单机资产：H100 高产资产，月毛利可达 ¥1.74M，回本期 10.7 月。

展开完整字段和演示提示

主对象：C 财务
C 类细分：地方智算中心财务/管理层、大型企业平台财务治理
场景权重：地方智算中心 70%，大型企业 30%
销售作用：财务可信度
一句话结论：Token Factory 把 GPU 从成本中心变成可核算资产，按机器看收入、毛利、回本期、低效预警。
讲述逻辑：把采购决策拉到高层关心的 ROI 和资产回报。
页面内容：

- 本月累计收入 ¥11.82M，成本 ¥7.33M，毛利 ¥4.49M。

- 单位 Token 成本 ¥4.11/百万，单位收入 ¥6.66/百万，单位毛利 ¥2.55/百万。

- 单机资产：H100 高产资产，月毛利可达 ¥1.74M，回本期 10.7 月。

- 低效预警：A100 / L40S 低效资产可被识别和优化。

视觉建议：资产矩阵图 + 一张“单机经营账本”。
素材来源：dashboard-html-materials.md
禁止表达：不要只放财务表格，要说明决策动作：扩容、迁移、优化、降本。
下一步引导：复杂经营需要智能工作台辅助。

P21

Copilot：不是聊天机器人，而是经营和运维的智能工作台

叙事骨干拜访可用数字需披露确认Gate

C 运营提升产品先进性与使用效率地方智算中心 55%，大型企业 45%

Copilot 让运营、运维和管理者用自然语言问毛利、容量、SLA、路由、预算、异常根因，并生成报告和行动草案。

地方 55% / 企业 45%

讲述逻辑：用场景问题，而不是功能按钮，讲 Copilot。

地方智算中心问题：毛利为什么下降？哪个租户侵蚀 SLA？今晚流量上涨 30% 谁先瓶颈？哪些资源已有经营闭环？
大型企业问题：年度 18 亿 Token 如何拆供给计划？哪个部门预算超支？老板摘要怎么写？成本上涨来自模型还是资源池？
动作边界：高风险结构性配置变更不在 Copilot 内直接执行，而是引导到管理后台完成。

展开完整字段和演示提示

主对象：C 运营
辅助对象：B
C 类细分：C 运营、C 运维、C 管理者、大型企业平台方
场景权重：地方智算中心 55%，大型企业 45%
销售作用：提升产品先进性与使用效率
一句话结论：Copilot 让运营、运维和管理者用自然语言问毛利、容量、SLA、路由、预算、异常根因，并生成报告和行动草案。
讲述逻辑：用场景问题，而不是功能按钮，讲 Copilot。
页面内容：

- 地方智算中心问题：毛利为什么下降？哪个租户侵蚀 SLA？今晚流量上涨 30% 谁先瓶颈？哪些资源已有经营闭环？

- 大型企业问题：年度 18 亿 Token 如何拆供给计划？哪个部门预算超支？老板摘要怎么写？成本上涨来自模型还是资源池？

- 动作边界：高风险结构性配置变更不在 Copilot 内直接执行，而是引导到管理后台完成。

视觉建议：Copilot 三栏界面示意：左会话、中分析、右 Inspector；旁边列 4 个典型问题气泡。
素材来源：copilot-html-materials.md
禁止表达：不要写成“智能客服”或“聊天框”。
下一步引导：从产品闭环进入 DaoCloud 为什么能做。

---

# 第五章：技术可信与经营结果

第五章：技术可信与经营结果

P22-P27 · 6 页

P22

DaoCloud 为什么能做：Kubernetes Top3 × vLLM Top5

叙事骨干拜访可用数字需披露确认Gate

D技术可信背书地方智算中心 55%，大型企业 45%

DaoCloud 的壁垒不是只懂云原生，也不是只懂推理引擎，而是把 Kubernetes 分布式系统能力和 vLLM 推理优化能力接起来。

地方 55% / 企业 45%

讲述逻辑：技术可信要服务采购信任，不做社区贡献排行榜展开。

Kubernetes Top3：调度、资源池化、队列、容错、Gateway、可观测。
vLLM Top5：PD 分离、KV Cache、Kernel、量化、推理引擎深度优化。
项目经验库：模型、硬件、上下文、压力、SLO 组合经验。

展开完整字段和演示提示

主对象：D
辅助对象：C 技术/管理层
C 类细分：地方智算中心技术负责人、大型企业平台负责人
场景权重：地方智算中心 55%，大型企业 45%
销售作用：技术可信背书
一句话结论：DaoCloud 的壁垒不是只懂云原生，也不是只懂推理引擎，而是把 Kubernetes 分布式系统能力和 vLLM 推理优化能力接起来。
讲述逻辑：技术可信要服务采购信任，不做社区贡献排行榜展开。
页面内容：

- Kubernetes Top3：调度、资源池化、队列、容错、Gateway、可观测。

- vLLM Top5：PD 分离、KV Cache、Kernel、量化、推理引擎深度优化。

- 项目经验库：模型、硬件、上下文、压力、SLO 组合经验。

视觉建议：双引擎图：Kubernetes 底座 + vLLM 推理引擎 → Token Factory 生产系统。
素材来源：inference-optimization-ppt-materials.md
禁止表达：不要只写“我们很懂技术”，必须写“所以能交付生产系统”。
下一步引导：技术首先要落到每张卡的经营结果。

P23

推理优化的经营本质：让每张 GPU 持续产出 Token

叙事骨干拜访可用数字需披露确认Gate

C 财务技术转译成经营价值地方智算中心 65%，大型企业 35%

推理优化不是“调快一点”，而是提高每张 GPU 的 Token 产出、收入、SLA 和资产周转效率。

地方 65% / 企业 35%

讲述逻辑：用单卡经营账本把技术页拉回高层关注。

示例：H200 / DeepSeek，输入 2 元/百万 Token，单卡月成本约 0.68 万。
优化前：2000 tok/s，50% 利用率，收入约 0.52 万/卡/月。
优化后：2400 tok/s，75% 利用率，收入约 0.93 万/卡/月。

展开完整字段和演示提示

主对象：C 财务
C 类细分：地方智算中心财务/管理层、大型企业平台负责人
场景权重：地方智算中心 65%，大型企业 35%
销售作用：技术转译成经营价值
一句话结论：推理优化不是“调快一点”，而是提高每张 GPU 的 Token 产出、收入、SLA 和资产周转效率。
讲述逻辑：用单卡经营账本把技术页拉回高层关注。
页面内容：

- 示例：H200 / DeepSeek，输入 2 元/百万 Token，单卡月成本约 0.68 万。

- 优化前：2000 tok/s，50% 利用率，收入约 0.52 万/卡/月。

- 优化后：2400 tok/s，75% 利用率，收入约 0.93 万/卡/月。

- 四个经营指标：吞吐、利用率、TTFT/TPOT、SLA。

视觉建议：单卡经营账本对比图，收入柱状图与成本线叠加。
素材来源：inference-optimization-ppt-materials.md
禁止表达：不要堆 Prefill / Decode 等细节。
下一步引导：推理优化需要生产闭环，而不是一次性调参。

P24

InferX：把推理优化收敛成生产闭环

数字需披露确认Gate

C 运维生产级交付可信地方智算中心 55%，大型企业 45%

InferX 交付的是“模型 + 硬件 + SLO”的生产化路径，而不是单个推理引擎或一次性调参。

地方 55% / 企业 45%

讲述逻辑：系统级能力解释为什么 DaoCloud 能持续优化。

模型部署：well-lit path / Helm / 模型服务。
算力调度：LWS / Kueue / DRA / HAMi。
推理加速：PD 分离、KV Kernel、量化。

展开完整字段和演示提示

主对象：C 运维
辅助对象：D
C 类细分：地方智算中心运维、大型企业平台技术负责人
场景权重：地方智算中心 55%，大型企业 45%
销售作用：生产级交付可信
一句话结论：InferX 交付的是“模型 + 硬件 + SLO”的生产化路径，而不是单个推理引擎或一次性调参。
讲述逻辑：系统级能力解释为什么 DaoCloud 能持续优化。
页面内容：

- 模型部署：well-lit path / Helm / 模型服务。

- 算力调度：LWS / Kueue / DRA / HAMi。

- 推理加速：PD 分离、KV Kernel、量化。

- 网关路由：限流、兜底、权重、鉴权。

- 观测闭环：SLO、成本、租户、调优回写。

视觉建议：生产闭环飞轮：部署 → 调度 → 加速 → 路由 → 观测 → Planner → 经验库。
素材来源：inference-optimization-ppt-materials.md
禁止表达：不要把缩写全展开成工程课。
下一步引导：用案例证明不是概念。

P25

五类案例证明：不同硬件都能转成可售 Token 产能

叙事骨干拜访可用数字需披露确认Gate

C 管理层案例可信度地方智算中心 65%，大型企业 35%

DaoCloud 的优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800，不依赖单一硬件路线。

地方 65% / 企业 35%

讲述逻辑：展示案例组合，但不做每个案例的技术细节。

H20 & R6KD：TTFT ↓97%，吞吐 ↑39x。
GB300 DeepSeek：混合吞吐较 H200 ↑20.8x。
MiniMax-M2.5：单节点 73,495 tokens/s。

展开完整字段和演示提示

主对象：C 管理层
辅助对象：D
C 类细分：地方智算中心、大型企业平台方
场景权重：地方智算中心 65%，大型企业 35%
销售作用：案例可信度
一句话结论：DaoCloud 的优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800，不依赖单一硬件路线。
讲述逻辑：展示案例组合，但不做每个案例的技术细节。
页面内容：

- H20 & R6KD：TTFT ↓97%，吞吐 ↑39x。

- GB300 DeepSeek：混合吞吐较 H200 ↑20.8x。

- MiniMax-M2.5：单节点 73,495 tokens/s。

- 海光 DCU Qwen3：吞吐 ↑49.5%，TPOT ↓50.3%。

- A800 通用基线：TPS ↑1.2x-2.1x，成本 ↓约 40%。

视觉建议：五张案例卡片矩阵，每张只放“硬件类型 / 优化动作 / 经营结果”。
素材来源：inference-optimization-ppt-materials.md
禁止表达：不要把推理优化 PPT 原样搬入。
下一步引导：落回地方智算中心最关心的异构资产。

P26

地方智算中心：把异构与国产算力变成可经营资产

拜访可用数字需披露确认Gate

C 地方智算中心地方智算中心技术落地证明地方智算中心 100%，大型企业 0%

地方智算中心的硬件往往异构、混部、包含国产芯片；DaoCloud 能把这些资产组织成可达 SLO 的 Token 产能。

地方 100% / 企业 -%

讲述逻辑：把技术案例对准地方智算中心资产现实。

H20 & R6KD：异构 PD 分离 + Weka GDS，TTFT ↓97%，吞吐 ↑39x。
海光 DCU Qwen3：NUMA + 算子融合 + AllReduce，吞吐 ↑49.5%，TPOT ↓50.3%。
A800 通用基线：成熟存量卡 TPS ↑1.2x-2.1x，成本 ↓约 40%。

展开完整字段和演示提示

主对象：C 地方智算中心
C 类细分：地方智算中心管理层、C 运维、C 财务
场景权重：地方智算中心 100%，大型企业 0%
销售作用：地方智算中心技术落地证明
一句话结论：地方智算中心的硬件往往异构、混部、包含国产芯片；DaoCloud 能把这些资产组织成可达 SLO 的 Token 产能。
讲述逻辑：把技术案例对准地方智算中心资产现实。
页面内容：

- H20 & R6KD：异构 PD 分离 + Weka GDS，TTFT ↓97%，吞吐 ↑39x。

- 海光 DCU Qwen3：NUMA + 算子融合 + AllReduce，吞吐 ↑49.5%，TPOT ↓50.3%。

- A800 通用基线：成熟存量卡 TPS ↑1.2x-2.1x，成本 ↓约 40%。

- 经营转译：保护既有投资，降低单位 Token 成本，提升可售产能。

视觉建议：异构资源池 → 统一 Token 产能池 → MaaS 出口。
素材来源：inference-optimization-ppt-materials.md
禁止表达：不要只讲国产适配，要讲经营结果。
下一步引导：大型企业则看内部 Agent/Copilot 规模化。

P27

大型企业：支撑内部 Copilot / Agent / Workflow 规模化使用

拜访可用数字需披露确认Gate

C 大型企业平台方大型企业技术落地证明地方智算中心 0%，大型企业 100%

大型企业内部 AI 不只是调用模型，还要支撑 Copilot、Agent、Workflow、Tool Call、Reasoning 的高并发和稳定体验。

地方 -% / 企业 100%

讲述逻辑：把技术案例对准企业内部 AI 平台需求。

MiniMax-M2.5：单节点 73,495 tokens/s。
P90 TTFT 270-490ms，P90 TPOT 19-35ms。
KV Cache：多轮对话、Agent ReAct、前缀命中降低成本。

展开完整字段和演示提示

主对象：C 大型企业平台方
辅助对象：B
C 类细分：大型企业平台负责人、B 管理者
场景权重：地方智算中心 0%，大型企业 100%
销售作用：大型企业技术落地证明
一句话结论：大型企业内部 AI 不只是调用模型，还要支撑 Copilot、Agent、Workflow、Tool Call、Reasoning 的高并发和稳定体验。
讲述逻辑：把技术案例对准企业内部 AI 平台需求。
页面内容：

- MiniMax-M2.5：单节点 73,495 tokens/s。

- P90 TTFT 270-490ms，P90 TPOT 19-35ms。

- KV Cache：多轮对话、Agent ReAct、前缀命中降低成本。

- AI 网关：Consumer 鉴权、模型授权、灰度、限流、熔断、审计和成本归因。

视觉建议：内部应用接入图：Copilot / Agent / Workflow / OpenClaw → AI 网关 → 推理底座 → Dashboard/Copilot 治理。
素材来源：inference-optimization-ppt-materials.md、copilot-html-materials.md
禁止表达：不要把大型企业技术诉求讲成对外售卖。
下一步引导：技术和产品最终要进入合作模式。

---

# 第六章：合作模式与下一步

第六章：合作模式与下一步

P28-P30 · 3 页

P28

地方智算中心合作模式：建设不是终点，经营增长才是目标

叙事骨干拜访可用数字需披露确认Gate

C 地方智算中心管理层商业合作模式地方智算中心 100%，大型企业 0%

地方智算中心不只是采购一套软件，而是与 DaoCloud 一起建立可运营、可结算、可增长的 Token 生意。

地方 100% / 企业 -%

讲述逻辑：从产品价值转入商业合作。

前期：初装费覆盖项目建设。
中期：运维费覆盖持续承接。
后期：Token 分成绑定经营结果。

展开完整字段和演示提示

主对象：C 地方智算中心管理层
C 类细分：地方智算中心管理层、C 运营、C 财务
场景权重：地方智算中心 100%，大型企业 0%
销售作用：商业合作模式
一句话结论：地方智算中心不只是采购一套软件，而是与 DaoCloud 一起建立可运营、可结算、可增长的 Token 生意。
讲述逻辑：从产品价值转入商业合作。
页面内容：

- 前期：初装费覆盖项目建设。

- 中期：运维费覆盖持续承接。

- 后期：Token 分成绑定经营结果。

- 样板项目：先跑通一个可计量、可结算、可复用的经营闭环。

- 合作目标：区域客户运营、套餐设计、持续收入增长。

视觉建议：三阶段合作路径：建设 → 运维 → 分成；下方是样板项目闭环。
素材来源：copilot-html-materials.md、source-prototype-materials.md
禁止表达：不要只写“买 License”。
下一步引导：大型企业落地模式不同。

P29

大型企业落地模式：建设内部 MaaS 和 AI 使用治理平台

叙事骨干拜访可用数字需披露确认Gate

C 大型企业平台方大型企业落地模式地方智算中心 0%，大型企业 100%

大型企业落地 Token Factory 的目标，是形成统一模型供给、部门预算、应用接入、SLA、安全审计和内部治理闭环。

地方 -% / 企业 100%

讲述逻辑：避免用地方智算中心的对外分成模式套大型企业。

统一模型服务和 API 接入。
内部应用 / Agent / Copilot / Workflow 接入。
年度 Token 供给计划：基础供给包 + 峰值弹性包 + 高优先级保障包。

展开完整字段和演示提示

主对象：C 大型企业平台方
辅助对象：B
C 类细分：大型企业平台负责人、C 财务、B 管理者
场景权重：地方智算中心 0%，大型企业 100%
销售作用：大型企业落地模式
一句话结论：大型企业落地 Token Factory 的目标，是形成统一模型供给、部门预算、应用接入、SLA、安全审计和内部治理闭环。
讲述逻辑：避免用地方智算中心的对外分成模式套大型企业。
页面内容：

- 统一模型服务和 API 接入。

- 内部应用 / Agent / Copilot / Workflow 接入。

- 年度 Token 供给计划：基础供给包 + 峰值弹性包 + 高优先级保障包。

- 部门预算、Showback / Chargeback、权限审计。

- 老板摘要和管理报表。

视觉建议：企业内部供给闭环：需求计划 → 统一供给 → 部门消费 → 预算分摊 → SLA 保障 → 管理报告。
素材来源：copilot-html-materials.md、dashboard-html-materials.md
禁止表达：不要讲 Token 分成作为大型企业主模式。
下一步引导：把两类客户都推进到可验证下一步。

P30

下一步：从经营测算到样板落地

叙事骨干拜访可用数字需披露确认Gate

C 决策层推进下一步地方智算中心 60%，大型企业 40%

下一步不是泛聊产品，而是共同完成资源盘点、场景选择、SLO 定义、PoC、经营测算和领导决策材料。

地方 60% / 企业 40%

讲述逻辑：把销售拜访落到具体推进动作。

资源盘点：GPU / NPU / DCU、模型、网络、存储、电力、现有平台。
场景选择：地方智算中心选外部客户与套餐样板；大型企业选内部部门和应用样板。
SLO 定义：TTFT、TPOT、吞吐、成本、SLA、安全、预算。

展开完整字段和演示提示

主对象：C 决策层
C 类细分：地方智算中心管理层、大型企业平台负责人
场景权重：地方智算中心 60%，大型企业 40%
销售作用：推进下一步
一句话结论：下一步不是泛聊产品，而是共同完成资源盘点、场景选择、SLO 定义、PoC、经营测算和领导决策材料。
讲述逻辑：把销售拜访落到具体推进动作。
页面内容：

- 资源盘点：GPU / NPU / DCU、模型、网络、存储、电力、现有平台。

- 场景选择：地方智算中心选外部客户与套餐样板；大型企业选内部部门和应用样板。

- SLO 定义：TTFT、TPOT、吞吐、成本、SLA、安全、预算。

- PoC：跑基线与搜索，交付可安装、可验证的部署路径。

- 经营测算：收入、成本、毛利、回本期、预算分摊、治理效率。

- 决策材料：领导汇报版、技术评估版、合作模式草案。

视觉建议：90 天推进路线图，分 4 步：盘点 → 样板 → 测算 → 决策。
素材来源：inference-optimization-ppt-materials.md、HARD_GATES.md
禁止表达：不要在最后只放“谢谢”或泛泛联系方式。
下一步引导：要求客户确认一个样板场景和一组资源数据。

---

全局素材映射

地方智算中心 60% 主线素材

GPU 资源变现、客户获取、套餐、API、计量计费、收入、毛利、资产回本。
Dashboard：经营价值、业务经营、FinOps、单机资产、生产运营、资源成本、算电协同。
Copilot：经营闭环判断、毛利归因、容量规划、租户侵蚀 SLA、老板摘要。
技术案例：H20 & R6KD、海光 DCU、A800、GB300。
合作模式：初装费 + 运维费 + Token 分成，先做样板闭环。

大型企业 40% 主线素材

内部 MaaS、统一模型供给、应用 / Agent / Copilot / Workflow 接入。
Dashboard：部门、应用、Agent、预算、Showback / Chargeback、关键业务保障。
Copilot：年度 Token 供给计划、预算/成本问题、老板摘要、模型路由建议。
技术案例：MiniMax-M2.5、AI 网关、KV Cache、A800、GB300。
落地模式：基础供给包 + 峰值弹性包 + 高优先级保障包，内部预算分摊和治理闭环。

D 类技术与投资叙事素材

Kubernetes Top3。
vLLM Top5。
InferX 生产闭环。
五类推理优化案例。
Dashboard / Copilot / MaaS 已有产品能力。
DaoCloud 能把复杂 Token Factory 运营系统产品化并卖给 C 类客户。

红队自检

本 v1 大纲已按以下门禁设计：

C 类是第一客户，A/B 只用于证明 C 买后能产生价值。
PPT 约 30 页，不低于 25 页。
地方智算中心主线约 60%，大型企业主线约 40%。
Dashboard / Copilot 均按已有能力表达。
技术先进性均转译为经营结果。
MaaS 只作为服务出口，Token Factory 才是供给、经营、治理系统。
当前只输出 PPT 大纲，不生成最终 PPT、不写官网文案。

仍需用户下一轮确认：

30 页结构是否接受，是否需要压缩到 25-28 页。
第 27 页大型企业技术落地是否放在技术章节，还是移动到大型企业章节附近。
是否需要单独增加“官网版可复用模块”附录，或保持 PPT-only。
“Token Factory：GPU 资源变现与内部供给的 MaaS 操作系统”是否作为 v1 主标题继续使用。

Generated from sales-ppt-outline-v1.md. Self-contained review artifact, not final PPT. Source SHA256: bb446c9f67d9.