秋招冲刺向 · 题目来自公开面经
覆盖具身智能算法岗的 7 个核心方向:通识基础、RL 算法、VLA / 模仿学习、世界模型 / Sim2Real、工程落地、腿足机器人运动控制 / 全身控制 / 遥操作、3D 感知 / SLAM / VLN / 零样本 ObjectNav / Embodied VLM。 题目来自牛客、知乎、小红书、一亩三分地等公开面经,同义题合并后频次 ≥3 才入卷。 每题答案经独立审查后发布。
一面常考的入门概念,覆盖三块基础——深度学习侧的梯度、归一化、Transformer;强化学习侧的 MDP、贝尔曼方程、Q-learning;机器人学侧的坐标变换、雅可比矩阵与控制频率。建议作为知识盲区自查的起点。
强化学习主流算法的设计取舍与对比——在线策略与值函数方法(PPO、SAC、TD3、DDPG)的设计动机;离线 RL(CQL、IQL 等)对分布外动作高估的处理思路;以及 RLHF、DPO / GRPO 在大模型对齐中的角色。技术深度高于卷一,是二面、三面考察"为什么这么设计"的主要范围。
具身智能 2024-2026 的核心研究方向——主流视觉-语言-动作模型(OpenVLA、RT-2、π 系列、GR00T-N1)的架构与差别;动作生成方式(Diffusion Policy、ACT、Flow Matching)的对比;模仿学习从行为克隆到 DAgger 的演进。VLA 算法岗的必考范围。
覆盖两类紧密相关的命题——世界模型(Dreamer 系列、TD-MPC2、V-JEPA 2)的设计思路及其在策略学习中的角色;以及仿真到真机的迁移路径,包括域随机化、教师-学生蒸馏,以及 Isaac Lab、MuJoCo、Genesis 等仿真平台的取舍。近两年人形与四足公司面试的重点方向。
从算法走向产品的工程命题——VLA 在 Jetson Orin 等边缘平台的实时推理部署;分布式训练框架(FSDP / ZeRO)的选型;teleop 数据采集流程;DROID、Ego4D 等公开数据集的定位与差别。末节为开放题与系统设计,例如"在一年周期内组建团队交付一台家务机器人"的方案规划。
人形与四足机器人运动控制的核心面——底层是浮动基座动力学、Convex MPC 与全身控制(WBC / TSID)等经典最优控制框架;中间层是 RL-based locomotion 的主流策略(Walk These Ways、ASAP 等);上层是 Apple Vision Pro 遥操作链路与 sim-to-real 迁移路径。人形与四足公司(宇树、智元、Figure、1X 等)的核心考察范围。
具身导航与感知方向的算法岗核心面——底层覆盖 3D 表示(点云 / 深度估计 / NeRF / 3DGS)与 SLAM 状态估计(ORB-SLAM3、VINS-Fusion、因子图);上层延伸到语言条件下的导航与交互——指令跟随的 VLN、零样本 ObjectNav,以及 CLIP / SAM 等视觉基础模型在具身场景中的接入方式。VLN / 导航研究方向的算法岗专用。
脱离具身主题的通用工程卷,覆盖一面 coding 与 senior 面 system design 两类常考题型——LeetCode 高频 30 题(链表、滑动窗口、动态规划、LRU 等 CodeTop 头部题)、ML 系统设计(VLA 训练 / 推理服务、RLHF 数据 pipeline)、机器人系统设计(perception-planning-control 全栈、多传感器融合、双臂 ROS 2 架构)。具身 / 自动驾驶 / VLA 岗均会考察。
<details>