南阳市网站建设_网站建设公司_Spring_seo优化
2025/12/17 10:17:41 网站建设 项目流程

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关内容需要分享,欢迎文末联系我们。

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model
论文:https://arxiv.org/pdf/2510.10274
主页:https://thu-air-dream.github.io/X-VLA/
Code:https://github.com/2toinf/X-VLA
Model:https://huggingface.co/collections/2toINF/x-vla
Data:https://huggingface.co/datasets/Facebear/XVLA-Soft-Fold

直播信息

时间

2025年12月16日(周二)19:00

主题

X-VLA重磅开源,全面刷新机器人基准性能记录

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播

主讲嘉宾

郑金亮
清华大学智能产业研究院(AIR)博士三年级

清华大学智能产业研究院(AIR)博士三年级。研究方向为计算机视觉与具身智能。以第一,共一作者发表ICML, NeurIPS, CVPR等多篇顶会论文,曾获ICML 2024 MFM- EAI workshop杰出论文奖,IROS2025 AGI World challenge冠军。担任NeurIPS, CVPR, ICLR, ICML等学术期刊及会议审稿人。

直播大纲

X-VLA是一种高扩展、简洁的通用视觉-语言-动作(VLA)模型,它通过为每个机器人平台引入实体特定的可学习软提示(Soft Prompts)来有效解决跨实体、异构机器人数据的学习难题。X-VLA是首个实现120min无辅助自主叠衣任务的全开源模型(公开数据、代码与参数),以仅0.9B的参数量在五大权威仿真基准上全面刷新性能纪录,同时,基于X-VLA的解决方案在IROS-AGIBOT World Challenge上大放异彩,夺得冠军。总体而言,X-VLA为具身智能领域提供了一个性能强劲、完全开源的新基线与技术范式。

  1. 背景介绍

  2. X-VLA结构设计

  3. 预训练方法

  4. 后训练方法

  5. 未来展望

参与方式

:3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮,为大家着重分享相关领域的核心内容。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:宣传工作,则不予通过。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询