Paper Survey之——基于真实机器人的VLN

    2025-09-30

    之前博客对VLN进行调研。但VLN领域工作实在太多了,NLP、CV、Robotics领域的学者们纷纷加入,只能介绍小量代表性工作。 本博文针对VLN领域带有机器人实操的几篇工作进行调研,跟之前博客为了了解整个领域不同的是:本博文希望调研业内(学术界)VLN落地的方案及做法。

    业界主流的人形机器人运动控制调研

    2025-09-19

    本博文对业内主流机器人上下肢运动控制方案进行调研。 上下肢分开控制/全身控制,强化学习/传统运动/VLA。

    主流的机器人公司有:智元机器人、银河通用、星动纪元、埃斯顿、宇树科技、优必选、特斯拉 Optimus、Figure AI、Apptronik、Agility Robotics、小鹏IRON、小米 CyberOne、广汽 ...

    Read More

    Paper Survey之——Awesome Vision-Language-Action (VLA)

    2025-09-19

    本博客对VLA(Vision-Language-Action)进行调研整理。

    在VLA模型出现之前,机器人技术和人工智能主要分布在彼此割裂的几个子领域:

    • 视觉系统能够“看”并识别图像。传统的CV可以通过CNN来识别物体或者进行分类,但是并不能理解语言、也没有将视觉转换为action的能力。 Read More

    论文阅读笔记之——《Vision-language-action models: Concepts, progress, applications and challenges》

    2025-09-15

    之前博客对VLN及基于VLN的相关survey进行了调研学习。 VLA,Vision-Language-Action其跟VLN有很多共通之处,甚至本质上讲,两者只是数据集、任务类型不一样。或者说VLN是VLA的更一步。但是从网络发展、底层逻辑都是非常相似的。更有甚者,有些基于VLN的工作则是直接把VLN任务分为:VLA+locomotion ...

    Read More

    思岚Hermes PRO MAX移动底盘

    2025-09-14

    本博文基于思岚的赫尔墨斯 Hermes PRO MAX移动底盘的技术文档做个基本的了解。 本博文仅供本人学习记录用~

    地盘硬件部分

    底盘采用的主控方案为RK3588(8核,4 * Cortex A76+4 * Cortex A55。主频2.4G),4G内...

    Read More

    Paper Survey——CLIP on VLN

    2025-09-11

    2022年OpenAI发布的CLIP模型,大大提升了模型的跨模态理解能力,实习了视觉与语言的统一,也给VLN带来新的突破————零样本学习的能力使得机器人无需依赖人工标注,即可理解自然语言指令并执行高效导航。

    本博文针对基于CLIP的VLN几篇论文对其进展进行调研。

    本博文仅供本人...

    Read More