04 场景演算

场景 S2 · 500 GPU 中型混合卡池

场景 S2 · 500 GPU 中型混合卡池

假设：500 张卡（H800 × 200、A800 × 100、L40S × 100、4090 × 100），单机房，2 年目标。

一、硬件盘点

卡型	数量	单机布局	用途
H800 80G	200	25 台 8 卡	大模型推理 + 长租
A800 80G	100	12-13 台 8 卡	训练客户
L40S 48G	100	12-13 台 8 卡	视觉 / 中等模型
4090 24G	100	25 台 4 卡	中小客户 / 抢占实例

网络：H800/A800 走 IB 400G；L40S/4090 走 100G RoCE

二、月成本估算

项	月成本
硬件折旧	~180 万
电费（含 PUE 1.4）	~14 万
机柜（60 柜）	~18 万
带宽 + IDC 服务	~15 万
团队（20 人 × 3 万）	~60 万
合计	~287 万/月

三、目标收入结构（Plan C 混合，12 个月后）

产品线	卡型	月营收目标	毛利率
IaaS 长租大 B	100 H800 + 60 A800	200 万	45%
IaaS 抢占竞价	60 4090 + 40 H800	60 万	30%
MaaS 保障 API	60 H800 + 40 L40S	240 万	55%
MaaS 抢占 API	60 L40S + 40 4090	60 万	40%
合计	500	560 万	~49%

保本判断：月成本 287 万 < 月营收 560 万，年利润 ≈ 3280 万

四、卡型分配决策逻辑

H800：满足高毛利订单 → MaaS + 高端长租
A800：训练客户主力 → 长租
L40S：视觉 + 中型 LLM → MaaS 常驻
4090：抢占实例 / 小客户 → 弹性池

五、12 个月路线图

季度	里程碑
Q1	Plan A v1 + Plan B v1 上线；100 卡试运营
Q2	300 卡满载；Plan A v2 K8s 化
Q3	500 卡满载；Plan B v2 多引擎
Q4	Plan C 完整调度上线，毛利拉到 45%+

六、团队 20 人配比

CEO / COO / CTO：3
商务 / 运营：3
SRE：4
后端 / 计费 / 平台：4
推理工程 / 训练调优：3
前端 / UX：2
客服 / 技术支持：1

七、关键风险

风险	应对
大 B 客户拖延付款	强预付 + 合规审查
大厂降价 30%	差异化服务 + 深度定制
卡型价格倒挂（H800 二手价格跌）	3 年内不动 H800，只跑满
团队被挖角	期权 + 阶段奖金
电价上涨	与 IDC 锁 3 年协议
GPU 断供	与供应链建立备胎

八、竞争定位

在国内二线阵营（非 BAT）里差异化：

场景聚焦：不做全能，只吃"大模型推理 + 训练咨询"两块
国产替代：A800/H800 供应有限时，主推华为昇腾 / 寒武纪备用
陪跑服务：白手套帮客户调 vLLM / DeepSpeed，附加咨询
合规牌：数据不出机房，医疗 / 金融 / 政务客户友好
社区：主办北京 AI 开发者 meetup、赞助开源模型（DeepSeek/Qwen 生态位）

场景 S1 · 100 GPU 初创起步

Previous Page

场景 S3 · 1000 GPU 跨区域规模化

Next Page

On this page

场景 S2 · 500 GPU 中型混合卡池一、硬件盘点二、月成本估算三、目标收入结构（Plan C 混合，12 个月后）四、卡型分配决策逻辑五、12 个月路线图六、团队 20 人配比七、关键风险八、竞争定位