单体 HTML artifact · 销售拜访版 · 离线可打开

Token Factory 销售拜访版 PPT 大纲 v1

这是为高层销售拜访大纲做的一遍 review cockpit:先看叙事主线、Gate Dashboard 和三条 review 路径,再按章节 drill down。它不是最终 PPT,也不替代原始 Markdown。

状态v1 讨论稿
用途给市场团队和后续 vibe PPT / 其他 Agent 工具生产 PPT 使用
目标页数30 页
听众地方智算中心与大型企业高层领导,兼顾技术/运营/财务负责人
权重60% 地方智算中心,40% 大型企业内部 MaaS / Token 供给平台
边界本文只输出 PPT 大纲和内容草稿,不生成最终 PPT、不写官网文案、不做视觉设计
Source Hashbb446c9f67d9
Generated2026-05-14 06:35:52 UTC

一遍 review 的读法

按销售叙事先看骨架。默认先检查叙事骨干和 Gate Dashboard;需要打磨某页时,再展开完整字段看讲述逻辑、视觉建议和下一步引导。

为什么现在
两类 C
产品定位
经营闭环
技术可信
下一步

边界提醒

这个 HTML 是展示 artifact。版本维护、决策记录和后续增删改仍以 sales-ppt-outline-v1.md 为准。

30分页设计
6章节
60/40地方智算 / 大型企业
30含强数字页

Gate Dashboard

销售拜访版常驻红队边界
C Primary销售拜访主客户仍是 C,A/B 只是证明 C 买后能产生价值。
Executive First这是高层销售拜访版,不是产品手册、官网或技术白皮书。
60/40地方智算中心约 60%,大型企业约 40%。
MaaS BoundaryMaaS 是出口,Token Factory 是供给、经营、治理系统。
DashboardDashboard 按已有经营驾驶系统表达,不写成监控大屏。
CopilotCopilot 按已有智能工作台表达,不写成聊天机器人。
Disclosure强数字可进内部拜访稿,公开前需确认披露范围。

三条 review 路径

避免连续滚 30 页

Narrative Spine

P01-P05、P08、P11-P13、P18、P21-P23、P25、P28-P30。用于快速检查销售主线。

Executive Sales Cut

优先看可直接进入高层拜访稿的页卡。

Full Review

完整检查 30 页,适合市场团队二次加工前逐页核对。

章节地图

销售叙事从问题到下一步
01P01-P04 · 4 页开场与问题定义
02P05-P10 · 6 页两类 C 客户场景
03P11-P15 · 5 页Token Factory 定位
04P16-P21 · 6 页产品经营闭环
05P22-P27 · 6 页技术可信与经营结果
06P28-P30 · 3 页合作模式与下一步

Token Factory 不是模型 API 商店,也不是推理平台换名,而是帮助地方智算中心把 GPU 资源变成可售卖、可计量、可运营的 Token 产能,同时帮助大型企业把模型和算力能力变成可治理、可分账、可持续供给的内部 MaaS 操作系统。

销售拜访时要让高层领导相信三件事:

  • 他们的问题不是“有没有 GPU / 模型”,而是“GPU 和模型能不能形成稳定 Token 供给与经营闭环”。
  • Token Factory 能把 MaaS 出口、管理后台、Dashboard、Copilot、推理优化、算电协同组织成一套经营系统。
  • DaoCloud 有资格做这件事:Kubernetes Top3、vLLM Top5、InferX 推理优化、异构硬件案例、Dashboard / Copilot 已有能力。

整套 PPT 不是产品功能介绍,而是一条高层销售拜访路径:

  1. 为什么现在需要 Token Factory。
  2. 地方智算中心和大型企业分别卡在哪里。
  3. Token Factory 到底是什么,为什么不是 ToC MaaS。
  4. Token Factory 如何把 GPU 资源组织成 Token 经营闭环。
  5. DaoCloud 为什么能做成。
  6. 如何合作落地,下一步怎么推进。

30 页大纲卡片

默认摘要,按需展开完整字段

第一章:开场与问题定义

P01-P04 · 4 页
P01

Token Factory:把 GPU 变成可经营的 Token 产能

叙事骨干拜访可用数字需披露确认Gate
C 管理层开场定位地方智算中心 60%,大型企业 40%

Token Factory 不是一个工具,而是一套把 GPU 资源转化为可交付、可计量、可经营 Token 产能的系统。

地方 60% / 企业 40%

讲述逻辑:先定调,避免客户把后续内容理解成“模型 API 门户”或“推理平台换名”。

  • 主标题:Token Factory
  • 副标题:GPU 资源变现与内部供给的 MaaS 操作系统
  • 三个关键词:供给、经营、治理
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业平台负责人
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:开场定位
  • 一句话结论:Token Factory 不是一个工具,而是一套把 GPU 资源转化为可交付、可计量、可经营 Token 产能的系统。
  • 讲述逻辑:先定调,避免客户把后续内容理解成“模型 API 门户”或“推理平台换名”。
  • 页面内容:

- 主标题:Token Factory

- 副标题:GPU 资源变现与内部供给的 MaaS 操作系统

- 三个关键词:供给、经营、治理

- 两类客户:地方智算中心对外经营,大型企业内部供给

  • 视觉建议:一张中心图,左侧是 GPU / NPU / DCU 资源,右侧是 Token API、企业应用、Agent、Copilot,中心是 Token Factory 工厂。
  • 素材来源:HARD_GATES.mdsource-prototype-materials.md
  • 禁止表达:不要写成“最好的模型 API 平台”“开发者调用入口”。
  • 下一步引导:让客户接受“今天谈的是经营系统,不是 API 门户”。
P02

AI 竞争正在从“有模型”转向“有稳定 Token 供给”

叙事骨干拜访可用数字需披露确认Gate
C 管理层建立时代背景地方智算中心 55%,大型企业 45%

模型能力正在变成基础能力,真正拉开差距的是稳定、低成本、可治理、可运营的 Token 供给体系。

地方 55% / 企业 45%

讲述逻辑:客户高层通常已经知道 AI 热,但需要把关注点从“模型”移动到“供给能力”。

  • 模型越来越多,API 越来越标准化。
  • 企业和平台真正要买的是持续服务质量。
  • Token 供给的竞争指标:成本、吞吐、SLA、治理、运营、交付。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业平台负责人
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:建立时代背景
  • 一句话结论:模型能力正在变成基础能力,真正拉开差距的是稳定、低成本、可治理、可运营的 Token 供给体系。
  • 讲述逻辑:客户高层通常已经知道 AI 热,但需要把关注点从“模型”移动到“供给能力”。
  • 页面内容:

- 模型越来越多,API 越来越标准化。

- 企业和平台真正要买的是持续服务质量。

- Token 供给的竞争指标:成本、吞吐、SLA、治理、运营、交付。

  • 视觉建议:从“模型竞争”到“Token 供给竞争”的横向迁移图。
  • 素材来源:source-prototype-materials.mdinference-optimization-ppt-materials.md
  • 禁止表达:不要做宏观 AI 行业长篇介绍。
  • 下一步引导:引出“有资源不等于有供给”。
P03

有 GPU,不等于有产能;有产能,不等于有收入

叙事骨干拜访可用数字需披露确认Gate
C 管理层定义核心痛点地方智算中心 70%,大型企业 30%

GPU 是资产,Token 产能才是可交付能力;只有可计量、可结算、可治理,产能才会变成收入或内部价值。

地方 70% / 企业 30%

讲述逻辑:用三段断裂解释客户现状:资产到产能、产能到服务、服务到经营结果。

  • 断点 1:GPU 在线但利用率、调度、模型匹配不稳定。
  • 断点 2:模型能跑但没有 MaaS 出口、计量、租户、权限、SLA。
  • 断点 3:有调用但没有经营指标、毛利、回本期、客户运营。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理者、C 财务、大型企业平台负责人
  • 场景权重:地方智算中心 70%,大型企业 30%
  • 销售作用:定义核心痛点
  • 一句话结论:GPU 是资产,Token 产能才是可交付能力;只有可计量、可结算、可治理,产能才会变成收入或内部价值。
  • 讲述逻辑:用三段断裂解释客户现状:资产到产能、产能到服务、服务到经营结果。
  • 页面内容:

- 断点 1:GPU 在线但利用率、调度、模型匹配不稳定。

- 断点 2:模型能跑但没有 MaaS 出口、计量、租户、权限、SLA。

- 断点 3:有调用但没有经营指标、毛利、回本期、客户运营。

  • 视觉建议:三段断裂链路图,断点用红色标出;下方给 Token Factory 修复链路。
  • 素材来源:HARD_GATES.mddashboard-html-materials.md
  • 禁止表达:不要把地方智算中心简化成“缺运维工具”。
  • 下一步引导:客户问题不是缺单点能力,而是缺闭环。
P04

C 类客户的共同命题:对外变现与内部供给,本质都需要经营闭环

叙事骨干拜访可用数字需披露确认Gate
C 管理层建立双场景框架地方智算中心 60%,大型企业 40%

地方智算中心要把资源变成外部收入,大型企业要把资源变成内部可治理供给,本质上都需要 Token Factory。

地方 60% / 企业 40%

讲述逻辑:明确两类 C 不是两个产品,而是同一套系统的两个经营目标。

  • 地方智算中心:客户、套餐、计费、毛利、资产回本。
  • 大型企业:部门、预算、应用、Agent、SLA、安全、合规。
  • 共性:统一供给、计量、治理、经营、优化。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:建立双场景框架
  • 一句话结论:地方智算中心要把资源变成外部收入,大型企业要把资源变成内部可治理供给,本质上都需要 Token Factory。
  • 讲述逻辑:明确两类 C 不是两个产品,而是同一套系统的两个经营目标。
  • 页面内容:

- 地方智算中心:客户、套餐、计费、毛利、资产回本。

- 大型企业:部门、预算、应用、Agent、SLA、安全、合规。

- 共性:统一供给、计量、治理、经营、优化。

  • 视觉建议:左右双场景对照,中间是共用的 Token Factory 能力栈。
  • 素材来源:HARD_GATES.mdsource-prototype-materials.md
  • 禁止表达:不要把大型企业写成附录,也不要削弱地方智算中心第一优先级。
  • 下一步引导:分别进入两类 C 场景。

---

# 第二章:两类 C 客户场景

第二章:两类 C 客户场景

P05-P10 · 6 页
P05

地方智算中心:从算力资产到区域 AI 服务商

叙事骨干拜访可用数字需披露确认Gate
C 管理层地方智算中心痛点页地方智算中心 100%,大型企业 0%

地方智算中心的升级方向不是继续卖裸算力,而是成为本区域可持续供给 AI 能力的 MaaS 运营方。

地方 100% / 企业 -%

讲述逻辑:从领导视角讲“资产怎么变生意”,而不是讲集群怎么管理。

  • 资源侧:已有 GPU / NPU / 国产卡 / 机房 / 电力。
  • 市场侧:本地企业、政府、产业客户需要可用 AI 能力。
  • 缺口:客户承接、API 服务、计量计费、运营工具、SLA、成本控制。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、C 运营
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 销售作用:地方智算中心痛点页
  • 一句话结论:地方智算中心的升级方向不是继续卖裸算力,而是成为本区域可持续供给 AI 能力的 MaaS 运营方。
  • 讲述逻辑:从领导视角讲“资产怎么变生意”,而不是讲集群怎么管理。
  • 页面内容:

- 资源侧:已有 GPU / NPU / 国产卡 / 机房 / 电力。

- 市场侧:本地企业、政府、产业客户需要可用 AI 能力。

- 缺口:客户承接、API 服务、计量计费、运营工具、SLA、成本控制。

- Token Factory 作用:把算力资源组织成可售 Token 服务。

  • 视觉建议:地方智算中心升级阶梯:资源中心 → 服务中心 → 运营中心 → 区域 AI 服务商。
  • 素材来源:source-prototype-materials.mdcopilot-html-materials.md
  • 禁止表达:不要把它写成 IDC 机房运维方案。
  • 下一步引导:进入地方智算中心经营闭环。
P06

地方智算中心的经营闭环:客户、套餐、用量、毛利、SLA 必须连起来

拜访可用数字需披露确认Gate
C 运营证明 Token Factory 是经营系统地方智算中心 100%,大型企业 0%

地方智算中心要经营 Token 生意,必须把客户、套餐、Token 用量、收入、毛利、SLA、算电协同放到同一套系统里。

地方 100% / 企业 -%

讲述逻辑:把老板原型中的运营型客户“初装费 + 运维费 + Token 分成”转成闭环。

  • 客户获取:企业客户、开发者、AI 应用、Agent 生态。
  • 售卖方式:套餐、API Key、模型服务、用量账单。
  • 经营指标:ARPU、套餐消耗率、收入、毛利、续费。
展开完整字段和演示提示
  • 主对象:C 运营
  • C 类细分:地方智算中心运营、C 财务、C 管理层
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 销售作用:证明 Token Factory 是经营系统
  • 一句话结论:地方智算中心要经营 Token 生意,必须把客户、套餐、Token 用量、收入、毛利、SLA、算电协同放到同一套系统里。
  • 讲述逻辑:把老板原型中的运营型客户“初装费 + 运维费 + Token 分成”转成闭环。
  • 页面内容:

- 客户获取:企业客户、开发者、AI 应用、Agent 生态。

- 售卖方式:套餐、API Key、模型服务、用量账单。

- 经营指标:ARPU、套餐消耗率、收入、毛利、续费。

- 供给保障:SLA、容量、功率、风险防护。

  • 视觉建议:经营飞轮图:获客 → 接入 → 消费 → 计量 → 结算 → 毛利 → 运营动作。
  • 素材来源:dashboard-html-materials.mdcopilot-html-materials.md
  • 禁止表达:不要只讲“计费模块”。
  • 下一步引导:进入可量化指标。
P07

地方智算中心的关键指标:不是卡有多少,而是每张卡贡献多少

拜访可用数字需披露确认Gate
C 财务经营指标证明地方智算中心 90%,大型企业 10%

Token Factory 把 GPU 经营结果量化到吞吐、单位成本、毛利、单机收入、回本期和低效预警。

地方 90% / 企业 10%

讲述逻辑:用 Dashboard 和推理优化数字证明“经营可量化”。

  • Without / With Token Factory:总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。
  • 单卡经营:H200 / DeepSeek 示例,单卡月收入 0.52 万 → 0.93 万,成本 0.68 万不变。
  • 单机资产经营:H100/H800/A100/L40S 可看收入、毛利、回本期、低效预警。
展开完整字段和演示提示
  • 主对象:C 财务
  • C 类细分:地方智算中心管理层、C 财务、C 运营
  • 场景权重:地方智算中心 90%,大型企业 10%
  • 销售作用:经营指标证明
  • 一句话结论:Token Factory 把 GPU 经营结果量化到吞吐、单位成本、毛利、单机收入、回本期和低效预警。
  • 讲述逻辑:用 Dashboard 和推理优化数字证明“经营可量化”。
  • 页面内容:

- Without / With Token Factory:总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。

- 单卡经营:H200 / DeepSeek 示例,单卡月收入 0.52 万 → 0.93 万,成本 0.68 万不变。

- 单机资产经营:H100/H800/A100/L40S 可看收入、毛利、回本期、低效预警。

  • 视觉建议:三层经营指标卡:平台级、单卡级、单机资产级。
  • 素材来源:dashboard-html-materials.mdinference-optimization-ppt-materials.md
  • 禁止表达:不要只讲 GPU 利用率,必须讲收入和毛利。
  • 下一步引导:大型企业虽然不一定对外售卖,也需要同样的内部治理。
P08

大型企业:从分散 AI 调用到统一内部 MaaS

叙事骨干拜访可用数字需披露确认Gate
C 管理层大型企业场景定义地方智算中心 0%,大型企业 100%

大型企业建设 Token Factory,不是为了对外卖 API,而是为了把内部 AI 能力统一供给、统一治理、统一分摊。

地方 -% / 企业 100%

讲述逻辑:纠正 MaaS 只等于 ToC 的误解,强调大型企业同样是 C 类采购主体。

  • 内部需求:Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。
  • 当前问题:模型调用分散、预算不清、SLA 不稳、安全审计不足。
  • Token Factory 价值:统一模型服务、统一 API、统一配额、统一预算、统一治理。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:大型企业平台方、企业 IT / AI 平台负责人
  • 场景权重:地方智算中心 0%,大型企业 100%
  • 销售作用:大型企业场景定义
  • 一句话结论:大型企业建设 Token Factory,不是为了对外卖 API,而是为了把内部 AI 能力统一供给、统一治理、统一分摊。
  • 讲述逻辑:纠正 MaaS 只等于 ToC 的误解,强调大型企业同样是 C 类采购主体。
  • 页面内容:

- 内部需求:Copilot、Agent、Workflow、OpenClaw、知识助手、业务应用。

- 当前问题:模型调用分散、预算不清、SLA 不稳、安全审计不足。

- Token Factory 价值:统一模型服务、统一 API、统一配额、统一预算、统一治理。

  • 视觉建议:企业内部多应用接入统一 MaaS 的汇聚图。
  • 素材来源:HARD_GATES.mddashboard-html-materials.mdcopilot-html-materials.md
  • 禁止表达:不要把大型企业讲成地方智算中心的次要补充。
  • 下一步引导:进入企业内部治理闭环。
P09

大型企业的内部治理闭环:预算、分摊、应用、SLA、安全必须可见

拜访可用数字需披露确认Gate
C 大型企业平台方大型企业价值证明地方智算中心 0%,大型企业 100%

企业内部 MaaS 如果不能统计、分摊、预算、审计和保障 SLA,就会变成新的成本黑洞。

地方 -% / 企业 100%

讲述逻辑:用 B 类使用管理证明 C 类大型企业采购价值。

  • 活跃部门 23,应用 / Agent 156。
  • Showback 覆盖率 91.3%,关键业务保障率 99.5%。
  • 部门消费排行:研发中心、智能营销、客服中心、数据平台等。
展开完整字段和演示提示
  • 主对象:C 大型企业平台方
  • C 类细分:大型企业平台负责人、B 管理者、C 财务
  • 场景权重:地方智算中心 0%,大型企业 100%
  • 销售作用:大型企业价值证明
  • 一句话结论:企业内部 MaaS 如果不能统计、分摊、预算、审计和保障 SLA,就会变成新的成本黑洞。
  • 讲述逻辑:用 B 类使用管理证明 C 类大型企业采购价值。
  • 页面内容:

- 活跃部门 23,应用 / Agent 156。

- Showback 覆盖率 91.3%,关键业务保障率 99.5%。

- 部门消费排行:研发中心、智能营销、客服中心、数据平台等。

- 客服中心 Copilot 业务价值评分 A+,月均节省人工成本约 ¥180K。

  • 视觉建议:企业内部治理仪表盘对照:部门、应用、预算、SLA、安全。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要把 B 类当最终采购主线;它是 C 买单后的价值证明。
  • 下一步引导:说明 A/B 如何共同证明 C 的平台价值。
P10

A/B 的价值证明:C 买了以后,谁会真正用起来

拜访可用数字需披露确认Gate
C 管理层下游价值闭环地方智算中心 50%,大型企业 50%

A 是 Token 能力的真实使用者,B 是企业内部使用与管理者;只有服务好 A/B,C 的采购才有持续价值。

地方 50% / 企业 50%

讲述逻辑:把用户定义纳入销售主线,但不让 A/B 抢 C 的主客户位置。

  • A:开发者、AI 应用、OpenClaw、Agent、终端用户。
  • B:部门、员工、项目、企业内部平台管理者。
  • 地方智算中心:A/B 带来外部流量和收入。
展开完整字段和演示提示
  • 主对象:C 管理层
  • 辅助对象:A、B
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 销售作用:下游价值闭环
  • 一句话结论:A 是 Token 能力的真实使用者,B 是企业内部使用与管理者;只有服务好 A/B,C 的采购才有持续价值。
  • 讲述逻辑:把用户定义纳入销售主线,但不让 A/B 抢 C 的主客户位置。
  • 页面内容:

- A:开发者、AI 应用、OpenClaw、Agent、终端用户。

- B:部门、员工、项目、企业内部平台管理者。

- 地方智算中心:A/B 带来外部流量和收入。

- 大型企业:A/B 带来内部使用效率和治理价值。

  • 视觉建议:A/B/C/D 角色流转图,突出 C 是采购运营主体。
  • 素材来源:HARD_GATES.mdsource-prototype-materials.md
  • 禁止表达:不要把 A 类终端体验写成主客户。
  • 下一步引导:正式定义 Token Factory。

---

# 第三章:Token Factory 定位

第三章:Token Factory 定位

P11-P15 · 5 页
P11

Token Factory 是什么:GPU 资源变现与内部供给的 MaaS 操作系统

叙事骨干拜访可用数字需披露确认Gate
C 管理层产品定义地方智算中心 60%,大型企业 40%

Token Factory 是把 GPU、模型、推理、网关、计量、结算、Dashboard、Copilot 组织成持续 Token 供给能力的系统。

地方 60% / 企业 40%

讲述逻辑:把前面的痛点收束成产品定义。

  • 地方智算中心:GPU 资源变现的 MaaS 操作系统。
  • 大型企业:内部模型能力供给与治理的 MaaS 操作系统。
  • 共性:供给、经营、治理、优化。
展开完整字段和演示提示
  • 主对象:C 管理层
  • 辅助对象:D
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:产品定义
  • 一句话结论:Token Factory 是把 GPU、模型、推理、网关、计量、结算、Dashboard、Copilot 组织成持续 Token 供给能力的系统。
  • 讲述逻辑:把前面的痛点收束成产品定义。
  • 页面内容:

- 地方智算中心:GPU 资源变现的 MaaS 操作系统。

- 大型企业:内部模型能力供给与治理的 MaaS 操作系统。

- 共性:供给、经营、治理、优化。

  • 视觉建议:一句话定义 + 双场景副标题,不要堆模块图。
  • 素材来源:HARD_GATES.mdsource-prototype-materials.md
  • 禁止表达:不要说“Token Factory 是一个推理平台”。
  • 下一步引导:解释 MaaS 与 Token Factory 的关系。
P12

MaaS 是出口,Token Factory 是工厂

叙事骨干拜访可用数字需披露确认Gate
C 管理层避免 ToC MaaS 误读地方智算中心 60%,大型企业 40%

MaaS 负责把模型服务交付出去,Token Factory 负责背后的供给、调度、计量、治理、经营和优化。

地方 60% / 企业 40%

讲述逻辑:把“API/Console”和“生产经营系统”分开讲。

  • MaaS 出口:API、模型目录、Playground、Endpoint、用量账单。
  • 工厂能力:算力调度、推理加速、AI 网关、租户管理、计量计费、Dashboard、Copilot、后台执行。
  • 地方智算中心:对外售卖。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:避免 ToC MaaS 误读
  • 一句话结论:MaaS 负责把模型服务交付出去,Token Factory 负责背后的供给、调度、计量、治理、经营和优化。
  • 讲述逻辑:把“API/Console”和“生产经营系统”分开讲。
  • 页面内容:

- MaaS 出口:API、模型目录、Playground、Endpoint、用量账单。

- 工厂能力:算力调度、推理加速、AI 网关、租户管理、计量计费、Dashboard、Copilot、后台执行。

- 地方智算中心:对外售卖。

- 大型企业:内部供给。

  • 视觉建议:冰山图,水面是 MaaS 出口,水下是 Token Factory 工厂能力。
  • 素材来源:source-prototype-materials.mdcopilot-html-materials.md
  • 禁止表达:不要让 MaaS 变成全篇主角。
  • 下一步引导:展示系统边界。
P13

一张图讲清系统边界:服务出口、控制面、驾驶舱、智能工作台

叙事骨干拜访可用数字需披露确认Gate
C 技术与管理层系统可信度地方智算中心 55%,大型企业 45%

Token Factory 由 MaaS 服务出口、管理后台控制面、Dashboard 经营驾驶、Copilot 智能工作台和底层基础设施共同形成闭环。

地方 55% / 企业 45%

讲述逻辑:系统边界要清楚,但不能变功能清单。

  • d.run/api:OpenAI-Compatible API。
  • d.run/console:MaaS 前台。
  • d.run/management:管理后台。
展开完整字段和演示提示
  • 主对象:C 技术与管理层
  • C 类细分:地方智算中心技术负责人、大型企业平台负责人
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:系统可信度
  • 一句话结论:Token Factory 由 MaaS 服务出口、管理后台控制面、Dashboard 经营驾驶、Copilot 智能工作台和底层基础设施共同形成闭环。
  • 讲述逻辑:系统边界要清楚,但不能变功能清单。
  • 页面内容:

- d.run/api:OpenAI-Compatible API。

- d.run/console:MaaS 前台。

- d.run/management:管理后台。

- d.run/copilot:智能工作台。

- Container / Observability:基础设施管理与可观测。

- Dashboard:经营驾驶系统。

  • 视觉建议:分层架构图,顶部是 A/B 使用入口,中间是经营与治理,底部是算力与推理底座。
  • 素材来源:source-prototype-materials.md
  • 禁止表达:不要画成一个复杂菜单树。
  • 下一步引导:从系统边界转入价值链。
P14

从资源到收入 / 内部价值:Token Factory 管的是完整价值链

拜访可用数字需披露确认Gate
C 管理层价值链定义地方智算中心 60%,大型企业 40%

Token Factory 把 GPU / NPU、模型、推理服务、Token、用户、部门、计量结算和治理指标串成一条可经营价值链。

地方 60% / 企业 40%

讲述逻辑:把 P13 的系统能力翻译成经营链路。

  • 资源:GPU / NPU / DCU / 电力 / 网络 / 存储。
  • 生产:模型服务、推理加速、KV Cache、调度、网关。
  • 交付:MaaS API、应用、Agent、Copilot。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:地方智算中心管理层、大型企业平台方
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:价值链定义
  • 一句话结论:Token Factory 把 GPU / NPU、模型、推理服务、Token、用户、部门、计量结算和治理指标串成一条可经营价值链。
  • 讲述逻辑:把 P13 的系统能力翻译成经营链路。
  • 页面内容:

- 资源:GPU / NPU / DCU / 电力 / 网络 / 存储。

- 生产:模型服务、推理加速、KV Cache、调度、网关。

- 交付:MaaS API、应用、Agent、Copilot。

- 经营:计量、账单、套餐、分成、预算、毛利。

- 治理:SLA、安全、审计、容量、算电协同。

  • 视觉建议:从左到右的价值链,分外部经营和内部供给两条输出。
  • 素材来源:dashboard-html-materials.mdinference-optimization-ppt-materials.md
  • 禁止表达:不要只画技术架构。
  • 下一步引导:回到 A/B/C/D 角色如何进入系统。
P15

四类用户如何进入同一套系统

拜访可用数字需披露确认Gate
C 管理层用户边界校准地方智算中心 55%,大型企业 45%

A 使用 Token,B 管理消费,C 采购并经营平台,D 证明 DaoCloud 的产品和资本价值。

地方 55% / 企业 45%

讲述逻辑:防止后续内容混淆对象。

  • A:通过 API / AI 应用 / OpenClaw / Agent 使用 Token。
  • B:看部门、预算、费用、应用、效率和治理。
  • C:建设并运营 Token 供给平台。
展开完整字段和演示提示
  • 主对象:C 管理层
  • 辅助对象:A、B、D
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:用户边界校准
  • 一句话结论:A 使用 Token,B 管理消费,C 采购并经营平台,D 证明 DaoCloud 的产品和资本价值。
  • 讲述逻辑:防止后续内容混淆对象。
  • 页面内容:

- A:通过 API / AI 应用 / OpenClaw / Agent 使用 Token。

- B:看部门、预算、费用、应用、效率和治理。

- C:建设并运营 Token 供给平台。

- D:DaoCloud 的技术、产品化、市场和投资叙事。

- 重点:当前销售主线服务 C。

  • 视觉建议:四层角色图,C 位于采购运营中心,A/B 是价值证明,D 是可信背书。
  • 素材来源:HARD_GATES.md
  • 禁止表达:不要把四类用户画成同等优先级客户。
  • 下一步引导:进入产品闭环。

---

# 第四章:产品经营闭环

第四章:产品经营闭环

P16-P21 · 6 页
P16

MaaS 服务出口:让 Token 可交付、可消费、可计量

数字需披露确认Gate
C 运营证明 C 买了以后能服务 A/B地方智算中心 65%,大型企业 35%

MaaS 出口让 Token 不停留在推理服务内部,而是能被客户、部门、应用和 Agent 真正消费。

地方 65% / 企业 35%

讲述逻辑:MaaS 作为出口,但不是主线全部。

  • API 门户、模型目录、Playground、Endpoint。
  • API Key、用量、配额、账单。
  • AI 应用、Agent、OpenClaw、Workflow 接入。
展开完整字段和演示提示
  • 主对象:C 运营
  • 辅助对象:A、B
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 销售作用:证明 C 买了以后能服务 A/B
  • 一句话结论:MaaS 出口让 Token 不停留在推理服务内部,而是能被客户、部门、应用和 Agent 真正消费。
  • 讲述逻辑:MaaS 作为出口,但不是主线全部。
  • 页面内容:

- API 门户、模型目录、Playground、Endpoint。

- API Key、用量、配额、账单。

- AI 应用、Agent、OpenClaw、Workflow 接入。

- 地方智算中心:对外客户和生态接入。

- 大型企业:内部应用与部门接入。

  • 视觉建议:入口流图:A/B 通过 API、Console、应用接入 Token Factory。
  • 素材来源:source-prototype-materials.md
  • 禁止表达:不要把这一页写成 ToC 开发者平台介绍。
  • 下一步引导:交付后需要控制面治理。
P17

管理后台:经营优先的控制面

数字需披露确认Gate
C 运营证明可商用、可治理地方智算中心 60%,大型企业 40%

Token 服务要进入生产和经营,必须有租户、模型、配额、计量、分账、安全、审计和策略执行的统一控制面。

地方 60% / 企业 40%

讲述逻辑:后台不是技术菜单,而是 Token 生意/内部供给的执行层。

  • 租户 / 工作区 / 部门。
  • 模型与服务。
  • 配额 / 策略 / 限流。
展开完整字段和演示提示
  • 主对象:C 运营
  • C 类细分:C 运营、C 运维、C 财务、安全/合规
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:证明可商用、可治理
  • 一句话结论:Token 服务要进入生产和经营,必须有租户、模型、配额、计量、分账、安全、审计和策略执行的统一控制面。
  • 讲述逻辑:后台不是技术菜单,而是 Token 生意/内部供给的执行层。
  • 页面内容:

- 租户 / 工作区 / 部门。

- 模型与服务。

- 配额 / 策略 / 限流。

- 用量 / 计费 / 分账。

- 审计 / 合规 / 安全。

- 集群 / GPU / 网络 / 存储 / 生命周期。

  • 视觉建议:控制面九宫格,但每格标注经营含义。
  • 素材来源:source-prototype-materials.md
  • 禁止表达:不要写成普通后台菜单。
  • 下一步引导:有控制面还不够,高层需要看经营结果。
P18

Dashboard:Token 经营驾驶系统,不是普通监控大屏

叙事骨干拜访可用数字需披露确认Gate
C 管理层证明经营可见地方智算中心 65%,大型企业 35%

Dashboard 把产能、收入、毛利、客户、资产、SLA、安全、算电协同放到一个经营视角里。

地方 65% / 企业 35%

讲述逻辑:先用高层经营总览,再解释不同角色视角。

  • 经营价值:实时吞吐 2.41M Token/s,今日收入 ¥847.2K,今日毛利 ¥323.4K。
  • 基线增益:总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。
  • 价值归因:调度优化、KV Cache、模型匹配、算电协同、安全防护。
展开完整字段和演示提示
  • 主对象:C 管理层
  • C 类细分:C 运营、C 财务、C 运维
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 销售作用:证明经营可见
  • 一句话结论:Dashboard 把产能、收入、毛利、客户、资产、SLA、安全、算电协同放到一个经营视角里。
  • 讲述逻辑:先用高层经营总览,再解释不同角色视角。
  • 页面内容:

- 经营价值:实时吞吐 2.41M Token/s,今日收入 ¥847.2K,今日毛利 ¥323.4K。

- 基线增益:总吞吐 +50.6%,单位 Token 成本 -29.1%,日均毛利 +62.9%。

- 价值归因:调度优化、KV Cache、模型匹配、算电协同、安全防护。

- 经营建议:套餐升级、低优先级任务调度、安全异常关注。

  • 视觉建议:Dashboard 截图或仿真驾驶舱,叠加 3 个大指标卡。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要只说“监控指标更丰富”。
  • 下一步引导:Dashboard 如何分别支撑地方智算和大型企业。
P19

Dashboard 连接两类经营对象:外部租户与内部部门

拜访可用数字需披露确认Gate
C 运营双场景能力证明地方智算中心 50%,大型企业 50%

同一套 Dashboard 可以让地方智算中心看租户经营,也可以让大型企业看部门、应用、Agent 和预算治理。

地方 50% / 企业 50%

讲述逻辑:把 Dashboard 从“功能页”转成“双场景经营证据”。

  • 地方智算中心:活跃租户 47,月 Token 消费 3.82T,月收入 ¥846.7K,ARPU ¥18.0K。
  • 租户机会:星辰科技套餐消耗率 92%,预计升级月增收 ¥45K。
  • 大型企业:活跃部门 23,应用 / Agent 156,预算使用率 72.4%,单位业务成本 ¥4.11/M。
展开完整字段和演示提示
  • 主对象:C 运营
  • 辅助对象:B
  • C 类细分:地方智算中心运营、大型企业平台方
  • 场景权重:地方智算中心 50%,大型企业 50%
  • 销售作用:双场景能力证明
  • 一句话结论:同一套 Dashboard 可以让地方智算中心看租户经营,也可以让大型企业看部门、应用、Agent 和预算治理。
  • 讲述逻辑:把 Dashboard 从“功能页”转成“双场景经营证据”。
  • 页面内容:

- 地方智算中心:活跃租户 47,月 Token 消费 3.82T,月收入 ¥846.7K,ARPU ¥18.0K。

- 租户机会:星辰科技套餐消耗率 92%,预计升级月增收 ¥45K。

- 大型企业:活跃部门 23,应用 / Agent 156,预算使用率 72.4%,单位业务成本 ¥4.11/M。

- B 价值:客服中心 Copilot 月均节省人工约 ¥180K。

  • 视觉建议:左右对照页,左边租户经营,右边部门治理。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要让企业内部场景变成“顺便也能看”。
  • 下一步引导:高层最关心资产和财务。
P20

FinOps 与资产经营:每台机器都要能回答“赚不赚钱、多久回本”

拜访可用数字需披露确认Gate
C 财务财务可信度地方智算中心 70%,大型企业 30%

Token Factory 把 GPU 从成本中心变成可核算资产,按机器看收入、毛利、回本期、低效预警。

地方 70% / 企业 30%

讲述逻辑:把采购决策拉到高层关心的 ROI 和资产回报。

  • 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。
  • 单位 Token 成本 ¥4.11/百万,单位收入 ¥6.66/百万,单位毛利 ¥2.55/百万。
  • 单机资产:H100 高产资产,月毛利可达 ¥1.74M,回本期 10.7 月。
展开完整字段和演示提示
  • 主对象:C 财务
  • C 类细分:地方智算中心财务/管理层、大型企业平台财务治理
  • 场景权重:地方智算中心 70%,大型企业 30%
  • 销售作用:财务可信度
  • 一句话结论:Token Factory 把 GPU 从成本中心变成可核算资产,按机器看收入、毛利、回本期、低效预警。
  • 讲述逻辑:把采购决策拉到高层关心的 ROI 和资产回报。
  • 页面内容:

- 本月累计收入 ¥11.82M,成本 ¥7.33M,毛利 ¥4.49M。

- 单位 Token 成本 ¥4.11/百万,单位收入 ¥6.66/百万,单位毛利 ¥2.55/百万。

- 单机资产:H100 高产资产,月毛利可达 ¥1.74M,回本期 10.7 月。

- 低效预警:A100 / L40S 低效资产可被识别和优化。

  • 视觉建议:资产矩阵图 + 一张“单机经营账本”。
  • 素材来源:dashboard-html-materials.md
  • 禁止表达:不要只放财务表格,要说明决策动作:扩容、迁移、优化、降本。
  • 下一步引导:复杂经营需要智能工作台辅助。
P21

Copilot:不是聊天机器人,而是经营和运维的智能工作台

叙事骨干拜访可用数字需披露确认Gate
C 运营提升产品先进性与使用效率地方智算中心 55%,大型企业 45%

Copilot 让运营、运维和管理者用自然语言问毛利、容量、SLA、路由、预算、异常根因,并生成报告和行动草案。

地方 55% / 企业 45%

讲述逻辑:用场景问题,而不是功能按钮,讲 Copilot。

  • 地方智算中心问题:毛利为什么下降?哪个租户侵蚀 SLA?今晚流量上涨 30% 谁先瓶颈?哪些资源已有经营闭环?
  • 大型企业问题:年度 18 亿 Token 如何拆供给计划?哪个部门预算超支?老板摘要怎么写?成本上涨来自模型还是资源池?
  • 动作边界:高风险结构性配置变更不在 Copilot 内直接执行,而是引导到管理后台完成。
展开完整字段和演示提示
  • 主对象:C 运营
  • 辅助对象:B
  • C 类细分:C 运营、C 运维、C 管理者、大型企业平台方
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:提升产品先进性与使用效率
  • 一句话结论:Copilot 让运营、运维和管理者用自然语言问毛利、容量、SLA、路由、预算、异常根因,并生成报告和行动草案。
  • 讲述逻辑:用场景问题,而不是功能按钮,讲 Copilot。
  • 页面内容:

- 地方智算中心问题:毛利为什么下降?哪个租户侵蚀 SLA?今晚流量上涨 30% 谁先瓶颈?哪些资源已有经营闭环?

- 大型企业问题:年度 18 亿 Token 如何拆供给计划?哪个部门预算超支?老板摘要怎么写?成本上涨来自模型还是资源池?

- 动作边界:高风险结构性配置变更不在 Copilot 内直接执行,而是引导到管理后台完成。

  • 视觉建议:Copilot 三栏界面示意:左会话、中分析、右 Inspector;旁边列 4 个典型问题气泡。
  • 素材来源:copilot-html-materials.md
  • 禁止表达:不要写成“智能客服”或“聊天框”。
  • 下一步引导:从产品闭环进入 DaoCloud 为什么能做。

---

# 第五章:技术可信与经营结果

第五章:技术可信与经营结果

P22-P27 · 6 页
P22

DaoCloud 为什么能做:Kubernetes Top3 × vLLM Top5

叙事骨干拜访可用数字需披露确认Gate
D技术可信背书地方智算中心 55%,大型企业 45%

DaoCloud 的壁垒不是只懂云原生,也不是只懂推理引擎,而是把 Kubernetes 分布式系统能力和 vLLM 推理优化能力接起来。

地方 55% / 企业 45%

讲述逻辑:技术可信要服务采购信任,不做社区贡献排行榜展开。

  • Kubernetes Top3:调度、资源池化、队列、容错、Gateway、可观测。
  • vLLM Top5:PD 分离、KV Cache、Kernel、量化、推理引擎深度优化。
  • 项目经验库:模型、硬件、上下文、压力、SLO 组合经验。
展开完整字段和演示提示
  • 主对象:D
  • 辅助对象:C 技术/管理层
  • C 类细分:地方智算中心技术负责人、大型企业平台负责人
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:技术可信背书
  • 一句话结论:DaoCloud 的壁垒不是只懂云原生,也不是只懂推理引擎,而是把 Kubernetes 分布式系统能力和 vLLM 推理优化能力接起来。
  • 讲述逻辑:技术可信要服务采购信任,不做社区贡献排行榜展开。
  • 页面内容:

- Kubernetes Top3:调度、资源池化、队列、容错、Gateway、可观测。

- vLLM Top5:PD 分离、KV Cache、Kernel、量化、推理引擎深度优化。

- 项目经验库:模型、硬件、上下文、压力、SLO 组合经验。

  • 视觉建议:双引擎图:Kubernetes 底座 + vLLM 推理引擎 → Token Factory 生产系统。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要只写“我们很懂技术”,必须写“所以能交付生产系统”。
  • 下一步引导:技术首先要落到每张卡的经营结果。
P23

推理优化的经营本质:让每张 GPU 持续产出 Token

叙事骨干拜访可用数字需披露确认Gate
C 财务技术转译成经营价值地方智算中心 65%,大型企业 35%

推理优化不是“调快一点”,而是提高每张 GPU 的 Token 产出、收入、SLA 和资产周转效率。

地方 65% / 企业 35%

讲述逻辑:用单卡经营账本把技术页拉回高层关注。

  • 示例:H200 / DeepSeek,输入 2 元/百万 Token,单卡月成本约 0.68 万。
  • 优化前:2000 tok/s,50% 利用率,收入约 0.52 万/卡/月。
  • 优化后:2400 tok/s,75% 利用率,收入约 0.93 万/卡/月。
展开完整字段和演示提示
  • 主对象:C 财务
  • C 类细分:地方智算中心财务/管理层、大型企业平台负责人
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 销售作用:技术转译成经营价值
  • 一句话结论:推理优化不是“调快一点”,而是提高每张 GPU 的 Token 产出、收入、SLA 和资产周转效率。
  • 讲述逻辑:用单卡经营账本把技术页拉回高层关注。
  • 页面内容:

- 示例:H200 / DeepSeek,输入 2 元/百万 Token,单卡月成本约 0.68 万。

- 优化前:2000 tok/s,50% 利用率,收入约 0.52 万/卡/月。

- 优化后:2400 tok/s,75% 利用率,收入约 0.93 万/卡/月。

- 四个经营指标:吞吐、利用率、TTFT/TPOT、SLA。

  • 视觉建议:单卡经营账本对比图,收入柱状图与成本线叠加。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要堆 Prefill / Decode 等细节。
  • 下一步引导:推理优化需要生产闭环,而不是一次性调参。
P24

InferX:把推理优化收敛成生产闭环

数字需披露确认Gate
C 运维生产级交付可信地方智算中心 55%,大型企业 45%

InferX 交付的是“模型 + 硬件 + SLO”的生产化路径,而不是单个推理引擎或一次性调参。

地方 55% / 企业 45%

讲述逻辑:系统级能力解释为什么 DaoCloud 能持续优化。

  • 模型部署:well-lit path / Helm / 模型服务。
  • 算力调度:LWS / Kueue / DRA / HAMi。
  • 推理加速:PD 分离、KV Kernel、量化。
展开完整字段和演示提示
  • 主对象:C 运维
  • 辅助对象:D
  • C 类细分:地方智算中心运维、大型企业平台技术负责人
  • 场景权重:地方智算中心 55%,大型企业 45%
  • 销售作用:生产级交付可信
  • 一句话结论:InferX 交付的是“模型 + 硬件 + SLO”的生产化路径,而不是单个推理引擎或一次性调参。
  • 讲述逻辑:系统级能力解释为什么 DaoCloud 能持续优化。
  • 页面内容:

- 模型部署:well-lit path / Helm / 模型服务。

- 算力调度:LWS / Kueue / DRA / HAMi。

- 推理加速:PD 分离、KV Kernel、量化。

- 网关路由:限流、兜底、权重、鉴权。

- 观测闭环:SLO、成本、租户、调优回写。

  • 视觉建议:生产闭环飞轮:部署 → 调度 → 加速 → 路由 → 观测 → Planner → 经验库。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要把缩写全展开成工程课。
  • 下一步引导:用案例证明不是概念。
P25

五类案例证明:不同硬件都能转成可售 Token 产能

叙事骨干拜访可用数字需披露确认Gate
C 管理层案例可信度地方智算中心 65%,大型企业 35%

DaoCloud 的优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800,不依赖单一硬件路线。

地方 65% / 企业 35%

讲述逻辑:展示案例组合,但不做每个案例的技术细节。

  • H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。
  • GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。
  • MiniMax-M2.5:单节点 73,495 tokens/s。
展开完整字段和演示提示
  • 主对象:C 管理层
  • 辅助对象:D
  • C 类细分:地方智算中心、大型企业平台方
  • 场景权重:地方智算中心 65%,大型企业 35%
  • 销售作用:案例可信度
  • 一句话结论:DaoCloud 的优化能力覆盖 NVIDIA 新架构、异构集群、国产 DCU 和成熟 A800,不依赖单一硬件路线。
  • 讲述逻辑:展示案例组合,但不做每个案例的技术细节。
  • 页面内容:

- H20 & R6KD:TTFT ↓97%,吞吐 ↑39x。

- GB300 DeepSeek:混合吞吐较 H200 ↑20.8x。

- MiniMax-M2.5:单节点 73,495 tokens/s。

- 海光 DCU Qwen3:吞吐 ↑49.5%,TPOT ↓50.3%。

- A800 通用基线:TPS ↑1.2x-2.1x,成本 ↓约 40%。

  • 视觉建议:五张案例卡片矩阵,每张只放“硬件类型 / 优化动作 / 经营结果”。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要把推理优化 PPT 原样搬入。
  • 下一步引导:落回地方智算中心最关心的异构资产。
P26

地方智算中心:把异构与国产算力变成可经营资产

拜访可用数字需披露确认Gate
C 地方智算中心地方智算中心技术落地证明地方智算中心 100%,大型企业 0%

地方智算中心的硬件往往异构、混部、包含国产芯片;DaoCloud 能把这些资产组织成可达 SLO 的 Token 产能。

地方 100% / 企业 -%

讲述逻辑:把技术案例对准地方智算中心资产现实。

  • H20 & R6KD:异构 PD 分离 + Weka GDS,TTFT ↓97%,吞吐 ↑39x。
  • 海光 DCU Qwen3:NUMA + 算子融合 + AllReduce,吞吐 ↑49.5%,TPOT ↓50.3%。
  • A800 通用基线:成熟存量卡 TPS ↑1.2x-2.1x,成本 ↓约 40%。
展开完整字段和演示提示
  • 主对象:C 地方智算中心
  • C 类细分:地方智算中心管理层、C 运维、C 财务
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 销售作用:地方智算中心技术落地证明
  • 一句话结论:地方智算中心的硬件往往异构、混部、包含国产芯片;DaoCloud 能把这些资产组织成可达 SLO 的 Token 产能。
  • 讲述逻辑:把技术案例对准地方智算中心资产现实。
  • 页面内容:

- H20 & R6KD:异构 PD 分离 + Weka GDS,TTFT ↓97%,吞吐 ↑39x。

- 海光 DCU Qwen3:NUMA + 算子融合 + AllReduce,吞吐 ↑49.5%,TPOT ↓50.3%。

- A800 通用基线:成熟存量卡 TPS ↑1.2x-2.1x,成本 ↓约 40%。

- 经营转译:保护既有投资,降低单位 Token 成本,提升可售产能。

  • 视觉建议:异构资源池 → 统一 Token 产能池 → MaaS 出口。
  • 素材来源:inference-optimization-ppt-materials.md
  • 禁止表达:不要只讲国产适配,要讲经营结果。
  • 下一步引导:大型企业则看内部 Agent/Copilot 规模化。
P27

大型企业:支撑内部 Copilot / Agent / Workflow 规模化使用

拜访可用数字需披露确认Gate
C 大型企业平台方大型企业技术落地证明地方智算中心 0%,大型企业 100%

大型企业内部 AI 不只是调用模型,还要支撑 Copilot、Agent、Workflow、Tool Call、Reasoning 的高并发和稳定体验。

地方 -% / 企业 100%

讲述逻辑:把技术案例对准企业内部 AI 平台需求。

  • MiniMax-M2.5:单节点 73,495 tokens/s。
  • P90 TTFT 270-490ms,P90 TPOT 19-35ms。
  • KV Cache:多轮对话、Agent ReAct、前缀命中降低成本。
展开完整字段和演示提示
  • 主对象:C 大型企业平台方
  • 辅助对象:B
  • C 类细分:大型企业平台负责人、B 管理者
  • 场景权重:地方智算中心 0%,大型企业 100%
  • 销售作用:大型企业技术落地证明
  • 一句话结论:大型企业内部 AI 不只是调用模型,还要支撑 Copilot、Agent、Workflow、Tool Call、Reasoning 的高并发和稳定体验。
  • 讲述逻辑:把技术案例对准企业内部 AI 平台需求。
  • 页面内容:

- MiniMax-M2.5:单节点 73,495 tokens/s。

- P90 TTFT 270-490ms,P90 TPOT 19-35ms。

- KV Cache:多轮对话、Agent ReAct、前缀命中降低成本。

- AI 网关:Consumer 鉴权、模型授权、灰度、限流、熔断、审计和成本归因。

  • 视觉建议:内部应用接入图:Copilot / Agent / Workflow / OpenClaw → AI 网关 → 推理底座 → Dashboard/Copilot 治理。
  • 素材来源:inference-optimization-ppt-materials.mdcopilot-html-materials.md
  • 禁止表达:不要把大型企业技术诉求讲成对外售卖。
  • 下一步引导:技术和产品最终要进入合作模式。

---

# 第六章:合作模式与下一步

第六章:合作模式与下一步

P28-P30 · 3 页
P28

地方智算中心合作模式:建设不是终点,经营增长才是目标

叙事骨干拜访可用数字需披露确认Gate
C 地方智算中心管理层商业合作模式地方智算中心 100%,大型企业 0%

地方智算中心不只是采购一套软件,而是与 DaoCloud 一起建立可运营、可结算、可增长的 Token 生意。

地方 100% / 企业 -%

讲述逻辑:从产品价值转入商业合作。

  • 前期:初装费覆盖项目建设。
  • 中期:运维费覆盖持续承接。
  • 后期:Token 分成绑定经营结果。
展开完整字段和演示提示
  • 主对象:C 地方智算中心管理层
  • C 类细分:地方智算中心管理层、C 运营、C 财务
  • 场景权重:地方智算中心 100%,大型企业 0%
  • 销售作用:商业合作模式
  • 一句话结论:地方智算中心不只是采购一套软件,而是与 DaoCloud 一起建立可运营、可结算、可增长的 Token 生意。
  • 讲述逻辑:从产品价值转入商业合作。
  • 页面内容:

- 前期:初装费覆盖项目建设。

- 中期:运维费覆盖持续承接。

- 后期:Token 分成绑定经营结果。

- 样板项目:先跑通一个可计量、可结算、可复用的经营闭环。

- 合作目标:区域客户运营、套餐设计、持续收入增长。

  • 视觉建议:三阶段合作路径:建设 → 运维 → 分成;下方是样板项目闭环。
  • 素材来源:copilot-html-materials.mdsource-prototype-materials.md
  • 禁止表达:不要只写“买 License”。
  • 下一步引导:大型企业落地模式不同。
P29

大型企业落地模式:建设内部 MaaS 和 AI 使用治理平台

叙事骨干拜访可用数字需披露确认Gate
C 大型企业平台方大型企业落地模式地方智算中心 0%,大型企业 100%

大型企业落地 Token Factory 的目标,是形成统一模型供给、部门预算、应用接入、SLA、安全审计和内部治理闭环。

地方 -% / 企业 100%

讲述逻辑:避免用地方智算中心的对外分成模式套大型企业。

  • 统一模型服务和 API 接入。
  • 内部应用 / Agent / Copilot / Workflow 接入。
  • 年度 Token 供给计划:基础供给包 + 峰值弹性包 + 高优先级保障包。
展开完整字段和演示提示
  • 主对象:C 大型企业平台方
  • 辅助对象:B
  • C 类细分:大型企业平台负责人、C 财务、B 管理者
  • 场景权重:地方智算中心 0%,大型企业 100%
  • 销售作用:大型企业落地模式
  • 一句话结论:大型企业落地 Token Factory 的目标,是形成统一模型供给、部门预算、应用接入、SLA、安全审计和内部治理闭环。
  • 讲述逻辑:避免用地方智算中心的对外分成模式套大型企业。
  • 页面内容:

- 统一模型服务和 API 接入。

- 内部应用 / Agent / Copilot / Workflow 接入。

- 年度 Token 供给计划:基础供给包 + 峰值弹性包 + 高优先级保障包。

- 部门预算、Showback / Chargeback、权限审计。

- 老板摘要和管理报表。

  • 视觉建议:企业内部供给闭环:需求计划 → 统一供给 → 部门消费 → 预算分摊 → SLA 保障 → 管理报告。
  • 素材来源:copilot-html-materials.mddashboard-html-materials.md
  • 禁止表达:不要讲 Token 分成作为大型企业主模式。
  • 下一步引导:把两类客户都推进到可验证下一步。
P30

下一步:从经营测算到样板落地

叙事骨干拜访可用数字需披露确认Gate
C 决策层推进下一步地方智算中心 60%,大型企业 40%

下一步不是泛聊产品,而是共同完成资源盘点、场景选择、SLO 定义、PoC、经营测算和领导决策材料。

地方 60% / 企业 40%

讲述逻辑:把销售拜访落到具体推进动作。

  • 资源盘点:GPU / NPU / DCU、模型、网络、存储、电力、现有平台。
  • 场景选择:地方智算中心选外部客户与套餐样板;大型企业选内部部门和应用样板。
  • SLO 定义:TTFT、TPOT、吞吐、成本、SLA、安全、预算。
展开完整字段和演示提示
  • 主对象:C 决策层
  • C 类细分:地方智算中心管理层、大型企业平台负责人
  • 场景权重:地方智算中心 60%,大型企业 40%
  • 销售作用:推进下一步
  • 一句话结论:下一步不是泛聊产品,而是共同完成资源盘点、场景选择、SLO 定义、PoC、经营测算和领导决策材料。
  • 讲述逻辑:把销售拜访落到具体推进动作。
  • 页面内容:

- 资源盘点:GPU / NPU / DCU、模型、网络、存储、电力、现有平台。

- 场景选择:地方智算中心选外部客户与套餐样板;大型企业选内部部门和应用样板。

- SLO 定义:TTFT、TPOT、吞吐、成本、SLA、安全、预算。

- PoC:跑基线与搜索,交付可安装、可验证的部署路径。

- 经营测算:收入、成本、毛利、回本期、预算分摊、治理效率。

- 决策材料:领导汇报版、技术评估版、合作模式草案。

  • 视觉建议:90 天推进路线图,分 4 步:盘点 → 样板 → 测算 → 决策。
  • 素材来源:inference-optimization-ppt-materials.mdHARD_GATES.md
  • 禁止表达:不要在最后只放“谢谢”或泛泛联系方式。
  • 下一步引导:要求客户确认一个样板场景和一组资源数据。

---

全局素材映射

地方智算中心 60% 主线素材

  • GPU 资源变现、客户获取、套餐、API、计量计费、收入、毛利、资产回本。
  • Dashboard:经营价值、业务经营、FinOps、单机资产、生产运营、资源成本、算电协同。
  • Copilot:经营闭环判断、毛利归因、容量规划、租户侵蚀 SLA、老板摘要。
  • 技术案例:H20 & R6KD、海光 DCU、A800、GB300。
  • 合作模式:初装费 + 运维费 + Token 分成,先做样板闭环。

大型企业 40% 主线素材

  • 内部 MaaS、统一模型供给、应用 / Agent / Copilot / Workflow 接入。
  • Dashboard:部门、应用、Agent、预算、Showback / Chargeback、关键业务保障。
  • Copilot:年度 Token 供给计划、预算/成本问题、老板摘要、模型路由建议。
  • 技术案例:MiniMax-M2.5、AI 网关、KV Cache、A800、GB300。
  • 落地模式:基础供给包 + 峰值弹性包 + 高优先级保障包,内部预算分摊和治理闭环。

D 类技术与投资叙事素材

  • Kubernetes Top3。
  • vLLM Top5。
  • InferX 生产闭环。
  • 五类推理优化案例。
  • Dashboard / Copilot / MaaS 已有产品能力。
  • DaoCloud 能把复杂 Token Factory 运营系统产品化并卖给 C 类客户。

红队自检

本 v1 大纲已按以下门禁设计:

  • C 类是第一客户,A/B 只用于证明 C 买后能产生价值。
  • PPT 约 30 页,不低于 25 页。
  • 地方智算中心主线约 60%,大型企业主线约 40%。
  • Dashboard / Copilot 均按已有能力表达。
  • 技术先进性均转译为经营结果。
  • MaaS 只作为服务出口,Token Factory 才是供给、经营、治理系统。
  • 当前只输出 PPT 大纲,不生成最终 PPT、不写官网文案。

仍需用户下一轮确认:

  • 30 页结构是否接受,是否需要压缩到 25-28 页。
  • 第 27 页大型企业技术落地是否放在技术章节,还是移动到大型企业章节附近。
  • 是否需要单独增加“官网版可复用模块”附录,或保持 PPT-only。
  • “Token Factory:GPU 资源变现与内部供给的 MaaS 操作系统”是否作为 v1 主标题继续使用。