具身公司里后端-平台-数据闭环的位置
一句话速记
具身公司组织架构通常分算法(VLA / 控制 / 感知)+ 硬件 + 后端/平台三大块。后端工程师的核心战场是”数据闭环”——把真机/仿真采集到的数据、模型版本、训练 pipeline、灰度发布、可观测、A/B 串成回路,让算法迭代能跑得快又安全。这就是平台型工程师在具身行业的差异化定位:不是替代算法工程师,而是让算法工程师 10 倍生产力。岗位价值不输算法岗,且经验高度可迁移。
通俗解释(5 分钟版)
具身公司的典型组织(约 50-200 人规模):
┌─────────────────────────────────────────────────┐
│ CEO / CTO │
└─────────────────────────────────────────────────┘
│ │ │
┌──────────┴──┐ ┌──────┴──────┐ ┌──┴──────────┐
│ 算法团队 │ │ 硬件团队 │ │ 平台/后端 │
│ │ │ │ │ │
│ - VLA / VLM │ │ - 整机集成 │ │ - 数据平台 │
│ - 控制 │ │ - 电机/电池 │ │ - 训练 infra │
│ - 感知 │ │ - 标定 │ │ - 部署/OTA │
│ - 仿真 │ │ - 测试 │ │ - 监控/QA │
│ - 数据采集 │ │ │ │ - Agent app │
└──────────────┘ └──────────────┘ └──────────────┘
算法/硬件大家都好理解。后端/平台到底在干什么?看 5 大块:
1)数据闭环:
- 真机和仿真生成大量数据(视频、关节、力、奖励、失败 log)
- 怎么存?怎么标注?怎么版本化?怎么过滤无用数据?
- 这是后端最大战场——数据没好好管,算法每天都在垃圾里训练
2)训练 infra:
- 数千次仿真并行调度(GPU 集群)
- 训练任务排队、checkpoint、断点续训
- 实验追踪、超参管理(wandb / mlflow)
- 模型 registry:哪个 v3.7 是 winner?
3)部署 / OTA:
- 把模型推到几十/几百台机器人
- 灰度:先 5% → 30% → 100%
- 回滚:有问题立刻能撤
- 不同机器人不同 hardware → 不同模型版本
4)可观测 / 监控:
- 真机日志收集(带宽贵、要压缩、要选择性上传)
- 故障告警(机器人摔了、电池低、规划失败)
- 行为分析:哪些任务成功率最低、哪些场景失败最多
5)上层 Agent app:
- LangGraph / LangChain 写的对话/任务规划 Agent
- 调用底层 skill API(具身公司自家定义)
- Web/App 控制台、远程操控
- B 端客户系统对接(医院/工厂/家庭)
关键洞察:这些工作和大模型应用平台的工作是高度相似的。
关键细节 / 数学直觉
1)后端工程师在具身公司的 6 类典型岗位
岗位 核心工作
──────────────────────────────────────────
① 数据平台工程师 真机数据收集/存储/标注/筛选
② 训练平台工程师 训练任务调度、GPU 集群、实验追踪
③ 部署/OTA 工程师 模型/固件下发、灰度、回滚
④ Agent 平台工程师 LangGraph 对话/任务规划应用
⑤ 可观测/监控工程师 日志收集、告警、性能分析
⑥ 仿真平台工程师 Isaac Lab/MuJoCo 调度、Sim2Real 工具链
最高价值:①②④——这三类工作对算法迭代速度影响最大。
2)数据闭环的”价值链”——这是核心战场
真机/仿真采集
│
▼
┌────────────────┐
│ 数据收集层 │ ← 远程操控(teleop)/ 自主探索
│ - 多模态 │
│ - 时戳同步 │
│ - 带宽控制 │
└────────────────┘
│
▼
┌────────────────┐
│ 数据清洗 + 标注│ ← 规则过滤 + LLM 自动标注 + 人工
│ - 质检 │
│ - 失败 case │
│ - 标注 schema │
└────────────────┘
│
▼
┌────────────────┐
│ 数据集版本管理 │ ← LakeFS / DVC / 自研
│ - 版本号 │
│ - 来源 trace │
│ - 可回放 │
└────────────────┘
│
▼
┌────────────────┐
│ 训练 pipeline │ ← 多卡多机 / SLURM / Ray
│ - 数据加载 │
│ - 分布式 │
│ - 评估 │
└────────────────┘
│
▼
┌────────────────┐
│ 模型 registry │ ← MLFlow / 自研
│ - 版本号 │
│ - 元数据 │
│ - 性能指标 │
└────────────────┘
│
▼
┌────────────────┐
│ 灰度部署 │ ← OTA、5%/30%/100%
│ - 健康检查 │
│ - 回滚 │
└────────────────┘
│
▼
┌────────────────┐
│ 真机监控 │ ← 失败 case 回流到数据收集层
│ - 失败上报 │ ───────┐
│ - 性能分析 │ │
└────────────────┘ │
│ 闭环
▼
(回到"数据收集层"——真机失败 case 直接进下一轮训练)
核心理念:真机失败 case 是最贵的数据——它们必须回流到数据集,否则模型永远学不会处理这些 case。
3)后端在具身公司里的”差异化武器”
把过去的应用平台经验直接对位过来:
过去做的 具身里对应的
────────────────────────────────────────────────
异步任务平台 仿真训练任务调度
消息队列 / Kafka 真机日志收集 + 数据 pipeline
Prompt 版本化 模型版本化 + skill 版本化
Badcase 闭环 真机失败 case → 训练数据
灰度 / 回执协议 OTA 灰度部署 / 模型回滚
监控 / SLO 真机健康监控 + 任务成功率
数据集 / 评测 Agent + skill 评测,模型 regression
结论:80% 的能力可迁移——剩下 20% 是新东西(Sim2Real、机器人协议、ROS 基础认知)。
4)Agent 平台工程师的具体工作
这是和过去最像的岗位:
# 大脑层 Agent,用 LangGraph 写
class HouseholdAgent:
"""家庭服务机器人的对话 Agent"""
@node
def parse_intent(self, state):
# LLM 解析用户语音/文字意图
intent = llm.parse(state.user_input)
return {"intent": intent}
@node
def plan_tasks(self, state):
# 把意图拆成 skill 序列
plan = llm.plan(state.intent, available_skills)
return {"plan": plan}
@node
def execute_skill(self, state):
# 调用机器人底层 skill API
result = robot_client.execute(state.current_skill)
return {"observation": result}
@node
def reflect(self, state):
# 失败时反思 / 重新规划
if state.observation.failed:
return {"plan": llm.replan(state)}
return {}
# 边:execute → reflect → execute(循环)
# reflect → end(成功)这就是后端工程师能立刻上手的部分——和大模型应用平台高度相似。
5)一个具身公司”数据闭环”成熟度自检
level 0: 真机数据收集靠手动 → 全靠人记 USB 拷
level 1: 自动收集,但没标注 → 数据多但用不上
level 2: 自动标注 + 版本管理 → 能复现训练
level 3: 失败 case 回流 → 真机失败 1 周内进训练数据
level 4: A/B + 灰度 + 自动回滚 → 上线流程完全自动
level 5: 数据 → 训练 → 部署 → 监控 → 数据,完全自动闭环
国内具身公司当前主流位置:level 1-2,有少数到 level 3。level 4-5 = 平台型后端的差异化机会。
6)转岗时如何讲清自己的价值
❌ 错位讲法:"我会写 Python 后端"
→ 算法岗位的人会觉得不够
✅ 正确讲法:
"我做过大模型应用平台的数据闭环——
Prompt 版本化、Badcase 闭环、灰度部署、回执协议。
这些能力在具身公司里对应的就是模型/skill 版本化、
真机失败 case 回流、OTA 灰度。我能把你们当前 level 1-2 的
数据闭环升级到 level 3-4。"
→ 这是**典型的「能力可迁移 + 行业理解」组合拳**
7)和算法岗的关系:合作不是替代
算法岗:训模型、调超参、设计 reward function、研究 paper
后端岗:让算法跑得快、跑得稳、跑得多——算法的 10x 生产力
没有平台,算法工程师 50% 时间花在数据/调度/部署上;有了平台,专心训模型。
延伸追问
- Q: 后端转去具身,会不会工资降了 / 没成长空间? → 不会。① 头部具身公司给后端薪资和大厂 LLM 应用持平甚至高 ② 早期公司 + 平台从 0 到 1,成长空间比纯应用大 ③ 算法+硬件+后端三角架构里,平台是粘合剂,话语权不弱。
- Q: 不懂控制论 / SLAM 能进具身公司做后端吗? → 能。算法、控制由专门的算法/控制团队负责,平台/后端只需要”能聊、能对接 API”,不需要会自己实现。要补的是:能听懂 ROS 是什么、机器人坐标系是什么、PID 是什么——这些 1-2 周可以上手讲清楚。
- Q: 具身公司后端 vs 自动驾驶公司后端有什么差别? → 思路高度相似:都是”算法迭代闭环 + 数据平台 + 部署监控”。差别在 ① 自动驾驶数据规模更大(PB 级)② 具身环境更杂、scenario 更多 ③ 自动驾驶有大量监管/合规、具身相对自由。自动驾驶平台经验完全可迁移到具身。
- Q: 具身的”产品形态”是什么?后端能做什么 to-C 应用? → 当前 to-B 为主(工厂、康养、医院);to-C 还在早期。后端工程师可做:① 远程操控控制台 ② 任务编排 web/app(家庭场景”和机器人对话”)③ B 端客户系统(保险、医院数据接口)。Agent 应用层是后端最直接的发力点。
我的记法
- 具身公司组织:算法 + 硬件 + 平台/后端——平台不可或缺
- 后端核心战场:数据闭环——真机数据 → 训练 → 模型 → 部署 → 监控 → 数据
- 6 大岗位:数据/训练/部署/Agent/监控/仿真平台
- 数据闭环成熟度 5 级——level 3-4 是后端的差异化机会
- 后端价值 = 算法工程师的 10x 生产力放大器
- 80% 能力可迁移(异步任务/灰度/版本管理/Badcase 闭环 → 都对应得上)
- 转岗讲法:用”应用平台经验对位具身数据闭环”,不要只说”会写 Python 后端”
- 一句话:「具身公司缺的不是算法,是把算法跑稳跑快的平台——这就是我的位置」
状态
- 已背速记
- 能讲通俗版
- 能答追问
- 看 2-3 家具身公司的招聘 JD(后端/平台岗),对位自己
参考资料
- Figure / 1X / Tesla Bot / Unitree / 智元 / 银河通用 招聘页 — 看后端 JD 长什么样
- 自动驾驶平台分享:Tesla / Waymo / Cruise 系统架构 — 思路高度相似
- 大模型应用平台经验在具身行业的迁移性分析 — 自己复盘