GPU Compute Plans
04 场景演算

场景 S3 · 1000 GPU 跨区域规模化

场景 S3 · 1000 GPU 跨区域规模化

假设:1000 GPU,两地三中心(北京、上海、深圳),成为区域头部。

一、硬件分布

机房H800A800L40S4090合计
北京3001005050500
上海1001005050300
深圳5010050-200
合计4503001501001000
  • 跨机房专线:10Gbps × 2 冗余
  • 每机房 SLA 独立签约
  • 电价:北京 0.4、上海 0.55、深圳 0.5(含 PUE)

二、月成本

月成本
硬件折旧~360 万
电费(三地加权)~306 万
机柜租金~40 万
跨机房专线~5 万
带宽 + IDC 服务~30 万
团队(60 人)~200 万
合计~941 万/月

三、目标收入(Plan C,18 个月后)

产品线月营收毛利率
IaaS 长租(大 B)500 万45%
IaaS 抢占竞价150 万30%
MaaS 保障 API600 万55%
MaaS 抢占 API100 万40%
私有部署(金融/政务)100 万60%
合计1450 万/月~35%

年营收目标 1.7 亿+,净利润 6000 万+

四、跨区域架构要点

全球控制面(Region 无关)

  • 账号、订单、门户、鉴权
  • 部署在中立云(如阿里云 / AWS 全球)
  • 与 Region 数据面完全解耦

Region 数据面(每个机房独立)

  • Kubernetes 集群
  • 本地存储 + 计费日志
  • 独立 SRE 团队

跨 Region 关键决策

  1. 客户订单归属 Region A → 请求就近路由到 A
  2. Plan A 客户资源不跨 Region 迁移(数据本地性 + 合规)
  3. Plan B API 请求可跨 Region 负载均衡(无状态)
  4. 全球控制面出问题 → Region 数据面继续可用(Degrade Mode)

五、团队 60 人

  • 高管:CEO / COO / CTO / CFO / CMO:5
  • 商务 / 销售:10(分行业:AI / 金融 / 政务 / 制造)
  • SRE / 运维:15(三地分派)
  • 后端 / 平台工程:10
  • 推理工程 / 训练支持:8
  • 前端 / UX:5
  • 数据 / 算法(内部提效):3
  • 客服 / 技术支持:4

六、24 个月路线图

季度里程碑
Q1北京 500 卡满载,v1 上线
Q2上海机房上线,v2 K8s 化
Q3深圳机房上线,Karmada 多集群
Q4Plan C 完整调度 + 抢占市场
Q5-Q6私有部署产品化,接第一个政务大单
Q7-Q8出海:香港 / 新加坡 Region

七、竞争定位

  • 区域头部:华东 / 华南 / 华北都有据点,服务快
  • 不打全能牌:只做大模型 + AI 训练 + 推理,不做通用云
  • 金融政务本地化:数据不出省、审计合规
  • 国产化选项:昇腾 / 寒武纪备用池
  • 生态贡献:赞助开源大模型(Qwen/DeepSeek/GLM),拿"官方推理伙伴"资质

八、风险 & 应对

风险应对
卡供应中断与英伟达经销商 + 国产厂商双备胎
价格战差异化服务 + 长约锁客
跨机房网络故障每 Region 独立可用 + 演练
合规监管提前布局备案 + 内容审核
人才流失期权池 15%、区域负责人合伙人化
大客户流失Top 10 合计 < 40% 营收

九、退出选项

到达 1000 卡规模后,一般有 3 条退出路径:

  1. 被大厂并购:阿里/腾讯/华为对二线卡池收购,估值 3-5 亿
  2. 战略上市:科创板 / 港股,估值 8-15 亿
  3. 持续融资,自我造血:不上市,追求年 30% 现金流增长

十、关键财务指标(Q8 目标)

  • ARR:≥ 2 亿元
  • 毛利率:≥ 45%
  • 客户数:≥ 1000(IaaS)+ 20000(MaaS)
  • 平均单卡月营收:≥ 15,000 元
  • 平均出租率(含抢占):≥ 85%
  • 客户留存:≥ 80%
  • NPS:≥ 40

On this page