05 成本模型
单机经济模型
单机经济模型
用来对齐单卡 / 单机的成本和收益,跑数字用的。
一、单机成本拆解模型
标准假设:单机 8×H800 80G,Ubuntu 22.04,2×Xeon 8480+ CPU + 2TB DDR5 + NVMe 存储 + ConnectX-7 网卡。
硬件成本
- 整机采购价:240 万人民币(含 GPU × 8 + 服务器 + 网卡 + 税费 + 供应链溢价)
- 注意:此处的「整机采购价」是全包落地价,高于裸卡批量采购价;若与外部裸卡报价对比,需加 30–80% 平台/服务/税费溢价。
- 折旧年限:5 年(每年 48 万,每月 4 万)
- 参数化:
monthly_hw = purchase_price / 60
电费
- 满载功耗:6 kW
- PUE:1.35(好机房)~1.6(一般机房)
- 电价:
p_kwh(元/度) - 参数化:
monthly_elec = 6 * 24 * 30 * p_kwh * PUE - 示例:
- 张家口(0.35, PUE 1.3):6 × 720 × 0.35 × 1.3 = 1,966 → 1.97 万/月
- 北京(0.4, PUE 1.35):6 × 720 × 0.4 × 1.35 = 2,333 → 2.33 万/月
- 上海(0.55, PUE 1.5):6 × 720 × 0.55 × 1.5 = 3,564 → 3.56 万/月
- 新加坡(1.2, PUE 1.5):6 × 720 × 1.2 × 1.5 = 7,776 → 7.78 万/月
机柜租金
- 单柜月租:2000-5000 元(含 IDC 服务)
- 8 卡机占 6-8U → 通常单柜可放 3-5 台
- 分摊:500-1500 元/机
带宽
- 100 Mbps 独享:2000-3000 元/月
- 1 Gbps 独享:8000-15000 元/月
- 参数化:
monthly_bw
人力分摊
- 团队 10 人 × 3 万 / 100 台机器 = 3000 元/机
- 参数化:
team_size * salary / total_machines
汇总(不同机房)
按 月成本 = 采购价/60 + 电费 + 机柜 + 带宽 + 运维分摊 计算:
| 机房 | 电价 | 月成本 |
|---|---|---|
| 张家口 | 0.35 | ≈ 6.6 万 |
| 内蒙古 | 0.30 | ≈ 6.4 万 |
| 北京 | 0.40 | ≈ 6.9 万 |
| 上海 | 0.55 | ≈ 8.2 万 |
| 深圳 | 0.50 | ≈ 7.5 万 |
| 新加坡 | 1.2 | ≈ 12.7 万 |
二、单机营收模型
Plan A 长租
- 单价:30-40 元/卡时(H800,2026 市场价)
- 满租月收入:8 卡 × 24 × 30 × 35 = 20.16 万/月
- 出租率 60%:12.1 万/月
- 出租率 80%:16.1 万/月
Plan A 抢占实例
- 单价:10-15 元/卡时(3-4 折)
- 满载:8 × 24 × 30 × 12 = 6.9 万/月
Plan B token 计费(vLLM,混合模型负载)
- 235B 大模型保守吞吐:≈ 每卡 60 tok/s,8 卡合计 480 tok/s
- 生产环境 7B/14B 小模型 + 高 batch 混合负载有效吞吐:≈ 每卡 600 tok/s,8 卡合计 4,800 tok/s
- 月生成 tokens:4,800 × 86400 × 30 ≈ 124 亿
- 均价(input + output 加权)≈ ¥5 / M tokens
- 月理论满载:124 亿 × 5 ÷ 100 = 6.2 万/月
- KV Cache 命中提升 40% 后:8.7 万/月
- 多客户共享 system prompt:11 万/月
- v2 混合策略极限:15-19 万/月
Plan B 抢占(异步批处理)
- 单价:0.3-0.5 × 保障价
- 月理论:0.3-0.5 万/月
三、单机毛利表(三种模式)
假设北京机房(月成本 6.9 万):
| 模式 | 满载月营收 | 实际(80%) | 毛利率 |
|---|---|---|---|
| Plan A 独占 | 20.2 万 | 16.1 万 | 66% |
| Plan A 独占(60% 出租) | 12.1 万 | 9.7 万 | 43% |
| Plan B v2 | 19 万 | 15 万 | 118% |
| Plan C 混合(P0 4/8卡 + MaaS 4/8卡) | 11 万 | 8.8 万 | 37% |
四、单卡月毛利汇总
| 卡型 | 单卡月成本 | 单卡目标营收 | 目标毛利率 |
|---|---|---|---|
| H800 80G | 6,400 元 | 15,000-25,000 | 55-70% |
| A800 80G | 5,100 元 | 12,000-18,000 | 55-70% |
| L40S 48G | 3,150 元 | 6,000-10,000 | 45-65% |
| 4090 24G | 3,550 元 | 3,500-5,500 | 0-35% |
| H100 80G | 9,000 元 | 25,000-35,000 | 60-75% |
五、Break-Even 分析
多久能回本?
假设整机 240 万,月毛利:
| 情境 | 月毛利 | 回本月数 |
|---|---|---|
| Plan A 满租 | 13.3 万 | 18.0 月 |
| Plan A 60% 出租 | 5.2 万 | 46.2 月 |
| Plan B v2 | -5.0 万 | 无法回本 |
| Plan C 混合 | 4.1 万 | 58.5 月 |
关键结论:按北京机房单机约 6.9 万/月成本,Plan A 满租约 18 个月回本;在 ¥5/M 且 480 tok/s 条件下纯 Plan B 无法覆盖单机成本,必须依赖更高溢价、更大吞吐或 Plan C 混合摊薄成本。
六、敏感度分析
电价每上涨 0.05 元 → 单机月成本 +0.03 万,Plan A 满租回本延迟约 0.04 个月
出租率每提高 10% → 单机月收入 +2.0 万,年利润 +24 万
KV Cache 命中率每提高 10% → Plan B 有效吞吐 +15%
卡型从 H800 换成 4090 → 单卡成本降 65%,但客户面窄,只能做小模型 MaaS
七、决策建议(针对不同月成本容忍度)
- 成本敏感(月成本 < 6 万/机) → 内蒙古、张家口机房,先做 Plan A 长租
- 平衡型(6-8 万/机) → Plan C 混合,追求 60% 综合毛利
- 高端型(>8 万/机) → 只做 Plan B 高毛利模型,不碰长租低毛利业务
- 海外(>10 万/机) → 卖溢价服务(合规、SLA、白手套),毛利率必须 ≥ 55%