GPU Compute Plans
04 场景演算

场景 S2 · 500 GPU 中型混合卡池

场景 S2 · 500 GPU 中型混合卡池

假设:500 张卡(H800 × 200、A800 × 100、L40S × 100、4090 × 100),单机房,2 年目标。

一、硬件盘点

卡型数量单机布局用途
H800 80G20025 台 8 卡大模型推理 + 长租
A800 80G10012-13 台 8 卡训练客户
L40S 48G10012-13 台 8 卡视觉 / 中等模型
4090 24G10025 台 4 卡中小客户 / 抢占实例

网络:H800/A800 走 IB 400G;L40S/4090 走 100G RoCE

二、月成本估算

月成本
硬件折旧~180 万
电费(含 PUE 1.4)~14 万
机柜(60 柜)~18 万
带宽 + IDC 服务~15 万
团队(20 人 × 3 万)~60 万
合计~287 万/月

三、目标收入结构(Plan C 混合,12 个月后)

产品线卡型月营收目标毛利率
IaaS 长租大 B100 H800 + 60 A800200 万45%
IaaS 抢占竞价60 4090 + 40 H80060 万30%
MaaS 保障 API60 H800 + 40 L40S240 万55%
MaaS 抢占 API60 L40S + 40 409060 万40%
合计500560 万~49%

保本判断:月成本 287 万 < 月营收 560 万,年利润 ≈ 3280 万

四、卡型分配决策逻辑

  • H800:满足高毛利订单 → MaaS + 高端长租
  • A800:训练客户主力 → 长租
  • L40S:视觉 + 中型 LLM → MaaS 常驻
  • 4090:抢占实例 / 小客户 → 弹性池

五、12 个月路线图

季度里程碑
Q1Plan A v1 + Plan B v1 上线;100 卡试运营
Q2300 卡满载;Plan A v2 K8s 化
Q3500 卡满载;Plan B v2 多引擎
Q4Plan C 完整调度上线,毛利拉到 45%+

六、团队 20 人配比

  • CEO / COO / CTO:3
  • 商务 / 运营:3
  • SRE:4
  • 后端 / 计费 / 平台:4
  • 推理工程 / 训练调优:3
  • 前端 / UX:2
  • 客服 / 技术支持:1

七、关键风险

风险应对
大 B 客户拖延付款强预付 + 合规审查
大厂降价 30%差异化服务 + 深度定制
卡型价格倒挂(H800 二手价格跌)3 年内不动 H800,只跑满
团队被挖角期权 + 阶段奖金
电价上涨与 IDC 锁 3 年协议
GPU 断供与供应链建立备胎

八、竞争定位

在国内二线阵营(非 BAT)里差异化:

  • 场景聚焦:不做全能,只吃"大模型推理 + 训练咨询"两块
  • 国产替代:A800/H800 供应有限时,主推华为昇腾 / 寒武纪备用
  • 陪跑服务:白手套帮客户调 vLLM / DeepSpeed,附加咨询
  • 合规牌:数据不出机房,医疗 / 金融 / 政务客户友好
  • 社区:主办北京 AI 开发者 meetup、赞助开源模型(DeepSeek/Qwen 生态位)

On this page