具身智能高频面试题库 · Embodied-AI Interview QA Bank

§1八卷目录

一面常考的入门概念，覆盖三块基础——深度学习侧的梯度、归一化、Transformer；强化学习侧的 MDP、贝尔曼方程、Q-learning；机器人学侧的坐标变换、雅可比矩阵与控制频率。建议作为知识盲区自查的起点。

强化学习主流算法的设计取舍与对比——在线策略与值函数方法（PPO、SAC、TD3、DDPG）的设计动机；离线 RL（CQL、IQL 等）对分布外动作高估的处理思路；以及 RLHF、DPO / GRPO 在大模型对齐中的角色。技术深度高于卷一，是二面、三面考察"为什么这么设计"的主要范围。

VOL · 03 VLA / 模仿学习 77 题

具身智能 2024-2026 的核心研究方向——主流视觉-语言-动作模型（OpenVLA、RT-2、π 系列、GR00T-N1）的架构与差别；动作生成方式（Diffusion Policy、ACT、Flow Matching）的对比；模仿学习从行为克隆到 DAgger 的演进；近期补充数据链路、时间同步、真机排障与 LoRA / PEFT 等项目拷打题。VLA 算法岗的必考范围。

VOL · 04 世界模型 / Sim2Real 31 题

覆盖两类紧密相关的命题——世界模型（Dreamer 系列、TD-MPC2、V-JEPA 2）的设计思路及其在策略学习中的角色；以及仿真到真机的迁移路径，包括域随机化、教师-学生蒸馏，以及 Isaac Lab、MuJoCo、Genesis 等仿真平台的取舍。近两年人形与四足公司面试的重点方向。

VOL · 05 工程落地 47 题

从算法走向产品的工程命题——VLA 在 Jetson Orin 等边缘平台的实时推理部署；分布式训练框架（FSDP / ZeRO）的选型；teleop 数据采集流程；DROID、Ego4D 等公开数据集的定位与差别。末节为开放题与系统设计，例如"在一年周期内组建团队交付一台家务机器人"的方案规划。

VOL · 06 腿足机器人控制 / 全身控制 / 遥操作 58 题

人形与四足机器人运动控制的核心面——底层是浮动基座动力学、Convex MPC 与全身控制（WBC / TSID）等经典最优控制框架；中间层是 RL-based locomotion 的主流策略（Walk These Ways、ASAP 等）；上层是 Apple Vision Pro 遥操作链路与 sim-to-real 迁移路径。人形与四足公司（宇树、智元、Figure、1X 等）的核心考察范围。

VOL · 07 3D 感知 / SLAM / VLN / 零样本 ObjectNav / Embodied VLM 67 题

具身导航与感知方向的算法岗核心面——底层覆盖 3D 表示（点云 / 深度估计 / NeRF / 3DGS）与 SLAM 状态估计（ORB-SLAM3、VINS-Fusion、因子图）；上层延伸到语言条件下的导航与交互——指令跟随的 VLN、零样本 ObjectNav，以及 CLIP / SAM 等视觉基础模型在具身场景中的接入方式。VLN / 导航研究方向的算法岗专用。

VOL · 08 通用工程：LeetCode 高频 + 系统设计 40 题

脱离具身主题的通用工程卷，覆盖一面 coding 与 senior 面 system design 两类常考题型——LeetCode 高频 30 题（链表、滑动窗口、动态规划、LRU 等 CodeTop 头部题）、ML 系统设计（VLA 训练 / 推理服务、RLHF 数据 pipeline）、机器人系统设计（perception-planning-control 全栈、多传感器融合、双臂 ROS 2 架构）。具身 / 自动驾驶 / VLA 岗均会考察。

§2标签速查

L1 必会 · 一面常考 · 基础概念题

L2 进阶 · 二面常考 · 技术深度题

L3 顶级 lab · 开放 / 系统设计 / 前沿判断

🔥×12 该题在公开面经中被合并统计了 12 次（同义题归并后）

补充近期集中出现但未满三源频次证据的题，不伪造频次

§3使用方式

每卷 HTML 默认 全部折叠——只看题目；点击题目展开答案。
手机端原生支持折叠（HTML5 <details>，零 JS），公交地铁也能刷。
建议按 L1 → L2 → L3 的顺序刷；同等级内按频次从高到低。
答案 ≤350 字，便于背诵；超长的拆"答 / 关键对比 / 易错"三段。
每题答案都经过另一组独立 AI 二次审查后发布，减少单一模型的事实错误。