GPU Compute Plans

00 · 决策矩阵与对比总表

00 · 决策矩阵与对比总表

一页看懂三条路线,给管理层做投资决策用。

三条路线一览

维度A. 卖算力 IaaSB. 卖 Token MaaSC. 混合(推荐)
商业模式按卡时/卡月租用按 token / 请求计费底层共池,双产品线
主要客户训练团队、科研、渲染、加密AI 应用开发者、SaaS两类客户都覆盖
毛利率20–35%50–70%综合 35–55%
上线周期2–3 个月1–2 个月1 个月 B + 2 个月 A
技术密度运维密集模型工程密集双向都要有人
客户粘性低(价格战)中高(API 集成)中高
议价能力中强
规模效应电价 + 空置率推理效率 + KV 缓存命中空置卡自动灌 MaaS
主要风险空置率、电费波动模型迭代、token 定价战调度复杂度
主要护城河供应链 + 长约客户推理工程 + 模型速度弹性调度 + 客户组合
合规要求中(挖矿/滥用识别)高(生成式内容、备案)

快速决策树

                 有闲置卡吗?

             是 ────┴──── 否(继续买卡再看)

         客户结构如何?

    ┌─────────┼─────────┐
    │         │         │
 大 B 训练  应用开发者  两者都有
    │         │         │
  Plan A    Plan B    Plan C ← 90% 情况下推荐

三个"必须选"的关键判断

1. 电价是不是 <0.35 元/度?

  • 是 → Plan A 有利润空间,值得深耕 IaaS
  • 否 → 只做 Plan B,把算力当"生产资料"消耗掉

2. 有没有 30 天内能吃下所有算力的大客户?

  • 有 → 先做 Plan A,白名单大客户上量
  • 没有 → 先做 Plan B,靠 API 快速起量、避免空置

3. 团队里有推理优化的人吗?

  • 有 → Plan B / C 有竞争力
  • 没有 → Plan A + 采购成熟 MaaS SaaS 转售

结论与建议

同时启动 A + B,但节奏错开:

时间Plan A(IaaS)Plan B(MaaS)
Week 1-2硬件盘点、机房验收3 模型选型 + vLLM 部署
Week 3-4计费系统对接OpenAI 兼容 API 上线
Week 5-8白名单大客户上量10 个开发者内测 + 定价
Week 9-12自助注册台多引擎切换 + prefix cache
Q2K8s 容器化模型市场
Q3跨区域微调托管

混合模式的关键设计

  • 底层 K8s 池化所有 GPU
  • MaaS 常驻高优先级(保 SLA)
  • 客户 IaaS 请求进来 → 现从 MaaS 侧腾空 → 30 分钟内交付
  • MaaS 侧的模型可以做低价"抢占实例"版(客户容忍 30 分钟中断即打 4 折)

关键数据(后续需要补齐)

  • 卡型明细(H800/H100/A800/A100/4090/L40S 各多少张)
  • 单机配置(CPU/内存/NVMe/网卡)
  • 网络(IB 还是 RoCE,带宽?跨机延迟?)
  • 机房位置 + 电价 + PUE
  • 目标客户画像(有没有种子客户?)
  • 团队人力(运维 / 推理工程 / 前端 / 计费 各几人)
  • 初始预算 & 期望回本周期

项目方补完这些后,可将方案中的假设替换为实际数据,重新算一遍单机经济模型。

On this page