GPU Compute Plans
02 路线B 卖Token

Plan B · v3 · Marketplace 版本

Plan B · v3 · Marketplace 版本

目标:从"卖 token"进化为"AI 平台生态"。
时间:v2 稳定后 6-12 个月。

1. 相比 v2 的关键升级

维度v2v3
模型来源平台上架客户上架 + 分成
应用形态纯 API+ 托管应用 / Agent / RAG
定价平台定价平台 + 客户自定价
生态开发者开发者 + ISV + 终端用户
微调单模型 LoRA全流程微调市场
数据数据集市场
多模态文/图/音/视频

2. 生态定位

从"云厂商"转向"AI 中间层平台":

  应用层 ←── 终端用户

  产品层 ←── ISV / AI 创业公司(在平台上发布应用)

  模型层 ←── 平台自营 + 社区上传(分成)

  基础设施 ←── 平台自持算力

3. 核心新功能

3.1 模型市场

  • 任何开发者可上传自己的模型(LoRA / 全量 / 蒸馏版)
  • 平台自动审核 + 部署
  • 定价:作者定 base + 平台加成 20%
  • 分成:作者 60% / 平台 40%
  • 榜单:每周 Top 10、按类型分类

3.2 微调工作室

  • 无代码微调 UI
  • 支持 LoRA、QLoRA、DPO、RLHF
  • 训练数据集上传(客户私有 or 从数据市场买)
  • 训完自动上架成客户私有模型
  • 训练成本按 GPU 时长扣(可用抢占实例省钱)

3.3 数据市场

  • 平台预置:CommonCrawl、Wikipedia、代码数据集
  • 客户可上传自己的数据集卖给别人(分成)
  • 平台负责合规审核 + 去 PII

3.4 Agent / RAG 托管

  • 一键部署 LangGraph / AutoGen / Dify
  • 内置工具库:搜索、代码执行、SQL、爬虫
  • 客户只交 prompt + 工具选择,平台负责调度

3.5 应用商店(App Store 模式)

  • 开发者可在平台上发布 AI 应用
  • 用户扫码 / 一键使用
  • 应用收入平台分 30%

4. 架构演进

                      终端用户

                    ┌─────▼──────┐
                    │  应用层     │  ← 客户开发的 AI 应用
                    │  (Web/App)  │
                    └─────┬──────┘

                    ┌─────▼──────┐
                    │  Agent 引擎 │  ← 平台托管
                    │  RAG 服务   │
                    └─────┬──────┘

                    ┌─────▼──────┐
                    │  模型市场   │  ← 平台 + 社区模型
                    │  (10000+)   │
                    └─────┬──────┘

                    ┌─────▼──────┐
                    │  推理平台   │  ← v1/v2 演进而来
                    │  (v2 内容)  │
                    └─────┬──────┘

                    ┌─────▼──────┐
                    │  自持算力   │
                    └────────────┘

5. 关键难点

难点应对
社区模型安全每个模型跑沙箱 + 自动扫描后门
分成结算按 token 精细计费 → 每月自动打款
合规上架模型需实名 + 内容审核
模型爆炸式增长冷模型下架、按 QPS 分级
训练资源紧张微调任务默认走抢占实例
Agent 安全工具调用沙箱、外网访问白名单

6. 里程碑

季度交付
Q1模型市场(自营 + 首批签约作者)
Q2无代码微调工作室
Q3Agent / RAG 托管
Q4应用商店 + 分成结算 + 多模态扩展

7. 商业指标(v3 时应有)

  • 平台入驻模型数:1000+
  • 月活开发者:5000+
  • 生态 GMV:占平台总收入 30% 以上
  • 平台自营 vs 分销:50/50 目标
  • 模型分类:文本 / 代码 / 视觉 / 音频 / 多模态 齐全

8. 竞品对标

玩家定位我方差异化
Hugging Face全球最大模型社区只推不训,我方训 + 推 + 分成
Together.ai高性能推理类似定位
Replicate应用友好UI 更好
SiliconFlow国内头部追赶 + 生态差异
阿里百炼大厂中立第三方

关键判断:v3 是否真的能做出生态取决于 v1/v2 阶段的开发者社区体量,如果开发者不到 1 万,v3 不要做,专注 v2。

9. 风险清单

  • 合规红线:AI 生成内容管理办法收紧,可能整个模型市场被砍
  • 恶意模型:后门、Prompt 越狱、数据窃取
  • 收入结构失衡:如果生态跑不起来,白投入大量运营成本
  • 抄袭 / 侵权:客户上传模型是否有版权
  • 平台责任:客户模型作恶,平台可能连带

10. 核心判断

v3 不建议早做

原因:

  1. 模型市场本质是"用户量游戏",没到 5 万开发者规模的时候,社区活不起来
  2. 分成模式对小平台不利,作者会跑去 HF
  3. v2 阶段的推理优化、抢占实例、批量 API 已经能做出 60% 毛利
  4. v3 应该是"营收到 5000 万/年 + 开发者过万"再启动的方向

v2 阶段就应该做的 v3 铺垫

  • API 里预留模型市场字段(作者、版本、许可证)
  • 计费系统预留分成账目
  • 开发者社区先运营起来(论坛、meetup、大 V 合作)

On this page