论文阅读及复现笔记之——《NaVILA: Legged Robot Vision-Language-Action Model for Navigation》
引言
本博文对RSS2025的VLN工作进...
本博文对RSS2025的VLN工作进...
当前基于learning的机器人控制算法中,十亿参数级别的视觉-语言-动作(VLA)模型虽具备出色的泛化能力,但推理延迟过高成为瓶颈——传统VLA模型,无法满足动态任务(如抓取运动物体)的实时性需求。
此前博客曾对高效VLA做过调研,包括Read More
对于大多数激光雷达而言,尽管激光的发射和接收速度很快,但构成点云的每个点并非...
本博文通过python脚本实现订阅ros2的多个...
动作视觉语言(Vision-Lang...
首先查看CPU架构,通过下面代码中的 传统SLAM算法一般都是运行在CPU...
之前博客对VLN进行调研。但VLN领域工作实在太多了,NLP、CV、Robotics领域的学者们纷纷加入,只能介绍小量代表性工作。
本博文针对VLN领域带有机器人实操的几篇工作进行调研,跟之前博客为了了解整个领域不同的是:本博文希望调研业内(学术界)VLN落地的方案及做法。 本文是波士顿动力24年arvix的工作,关注Instruction Following,通过LLM大模型与传统的SLAM导航相结合的方式让具身导航智能体学会指令跟随。
本博文为论文阅读笔记,仅供本人学习记录用~ 相关博客/资源list: 本博文对综述论文《Sensing, Social, and Motion Intelligence in Embodied Navigation: A Comprehensive Survey》阅读记录。
该论文对具身导航(Embodied Navigation (EN))中的感知智能、社会智能和运动智能全面综述。
将具身导航过程分解为五个关...
雷达点云去除运动失真/LiDAR Undistoration
基于python的ros2 topic订阅与时间同步
论文阅读笔记之——《Efficient Vision-Language-Action Models for Embodied Manipulation: A Systematic Survey》
引言
conda安装与各类命令记录
Read More
论文调研之——硬件加速SLAM系统
引言
Paper Survey之——基于真实机器人的VLN
论文阅读笔记之——《Zero-shot Object-Centric Instruction Following: Integrating Foundation Models with Traditional Navigation》
论文阅读笔记之——《Sensing, Social, and Motion Intelligence in Embodied Navigation: A Comprehensive Survey》