GPU Compute Plans
04 场景演算

场景 S1 · 100 GPU 初创起步

场景 S1 · 100 GPU 初创起步

假设:某创业公司拿到一批 100 张 H800(12-13 台 8 卡机),电价 0.35 元,团队 8 人。

一、硬件盘点

  • 12 台 8×H800:96 卡
  • 1 台 4×H800 + 4×L40S:混合小机器
  • 网络:ConnectX-7 400G IB
  • 机房:北京 T3+ IDC,独立 20 个机柜
  • 电费:0.35 元/度(含制冷 PUE 1.35)

二、月度成本(单机 8×H800 基准)

单机月成本12 台合计
硬件折旧(240 万/5 年)40,000480,000
电费(6kW × 24h × 30d × 0.35 × 1.35)2,04124,494
机柜托管(3000 元/柜)3,00036,000
带宽(100Mbps + 溢价)3,00036,000
IDC 服务费5006,000
团队人力分摊(8 人 × 3 万)20,000240,000
月总成本~68,541~822,494

保本线:全部 12 台机器月收入 ≥ 82.2 万,即单机月收入 ≥ 6.9 万。

三、三条路线对比

Plan A 独占卖算力

  • 单机满租 ≈ 20 万/月(35 元/卡时 × 8 卡 × 24h × 30d)
  • 空置率 40%(新平台常态)→ 单机月收入 ≈ 12 万
  • 12 台合计:144 万/月,毛利 ≈ 43%
  • 风险:出租率不稳,新客户拓展慢

Plan B 全跑 MaaS

  • 单机有效吞吐 ≈ 4,800 tok/s(7B/14B 小模型 + 高 batch 混合负载)
  • 单机月营收 6-15 万(v1 到 v2,看模型 + KV cache 命中)
  • 12 台合计:72-180 万/月,v2 状态下毛利约 15-35%
  • 风险:token 定价战、需要工程团队

Plan C 混合模式(推荐)

  • 4 台跑保障 MaaS(Plan B P1)
  • 5 台 Plan A 长租(P0,60% 出租率)
  • 3 台抢占实例池(P2,双向流转)
  • 12 台合计预估
    • Plan A 长租:5 台 × 12 万 = 60 万
    • MaaS 保障:4 台 × 6 万 = 24 万
    • 抢占池:3 台 × 4 万 = 12 万
    • 合计 96.0 万/月,当前成本下毛利 ≈ 17%

四、8 周落地计划

Plan APlan B
W1-2机房验收、组网、装机选 3 个模型(DeepSeek-V3、Qwen3、GLM)
W3-4MAAS 装机 + 监控vLLM 部署 + OpenAI 兼容 API
W5-6计费 + 门户 v1Token 计费 + 限流 + 5 内测客户
W7-8接 3 个白名单客户正式上线,全网可注册

五、团队分工(8 人配比建议)

  • 1 CEO / 商务:拉客户、融资
  • 2 SRE / 运维:机房、K8s、监控
  • 2 后端:门户、计费、API
  • 1 推理工程:vLLM 调优、量化、Cache
  • 1 前端:控制台
  • 1 客服 + 内容:技术文档、开发者关系

六、6 个月目标

  • IaaS 侧:8 个长租客户,出租率 ≥ 60%
  • MaaS 侧:200 个付费开发者,月度活跃 API 客户 ≥ 50
  • 月收入:≥ 160 万
  • 毛利:≥ 40%
  • 客户 NPS:≥ 30

七、关键假设与敏感度

乐观假设

  • 60 天内拿到 3 个长租大客户 → 单机收入拉到 15 万+/月
  • MaaS 侧发展 500 付费开发者 → 单机 MaaS 拉到 1.5 万/月

悲观假设

  • 长租客户拉不到(大厂价格战)→ 全跑 MaaS,收入拦腰
  • 团队推理调优跟不上 → MaaS 毛利仅 30%

敏感度

  • 电价每升 0.05 元 → 单机成本 +292,全月 -0.35 万
  • 卡型换成国产(华为昇腾) → 折旧降 30%,但客户面窄
  • 出租率提升 10 pct → 全月收入 +12 万

八、退出选项

如果 6 个月后:

  • 长租客户 < 3 家、MaaS 付费 < 100 个 → 转售算力给大厂 / 云厂商
  • MaaS 亏损 → 专注 IaaS 长租,砍 MaaS 团队
  • 卡贬值加速 → 考虑租赁给同行、卖二手回款

九、给创始人的具体建议

  1. 别买第二批卡,把这 100 张先跑出正现金流
  2. 先做 Plan B:3 个模型 + OpenAI 兼容 API,6 周上线
  3. Plan A 主动找 3 个种子长租客户:签 6-12 个月合同,先锁基础盘
  4. 不要打价格战:Plan B 官方价 -20%、Plan A 白名单陪跑,用服务差异化
  5. 社区先建起来:早期用 100 万 token 免费额度换开发者
  6. 每周对齐单机经济:不看总收入,只看"单机日营收/成本比"
  7. 6 个月里保留 30% 弹药:卡断供、价格战、客户跑路都是常态

On this page