南阳市网站建设_网站建设公司_Spring_seo优化-新竹县网站建设公司

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮，为大家着重分享相关领域的核心内容。如果您有相关内容需要分享，欢迎文末联系我们。

X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model
论文:https://arxiv.org/pdf/2510.10274
主页:https://thu-air-dream.github.io/X-VLA/
Code:https://github.com/2toinf/X-VLA
Model:https://huggingface.co/collections/2toINF/x-vla
Data:https://huggingface.co/datasets/Facebear/XVLA-Soft-Fold

直播信息

时间

2025年12月16日(周二)19：00

主题

X-VLA重磅开源，全面刷新机器人基准性能记录

直播平台

3D视觉工坊视频号

点击按钮预约直播

3D视觉工坊哔哩哔哩也将同步直播

主讲嘉宾

郑金亮
清华大学智能产业研究院(AIR)博士三年级

清华大学智能产业研究院(AIR)博士三年级。研究方向为计算机视觉与具身智能。以第一，共一作者发表ICML, NeurIPS, CVPR等多篇顶会论文，曾获ICML 2024 MFM- EAI workshop杰出论文奖，IROS2025 AGI World challenge冠军。担任NeurIPS, CVPR, ICLR, ICML等学术期刊及会议审稿人。

直播大纲

X-VLA是一种高扩展、简洁的通用视觉-语言-动作（VLA）模型，它通过为每个机器人平台引入实体特定的可学习软提示（Soft Prompts）来有效解决跨实体、异构机器人数据的学习难题。X-VLA是首个实现120min无辅助自主叠衣任务的全开源模型（公开数据、代码与参数），以仅0.9B的参数量在五大权威仿真基准上全面刷新性能纪录，同时，基于X-VLA的解决方案在IROS-AGIBOT World Challenge上大放异彩，夺得冠军。总体而言，X-VLA为具身智能领域提供了一个性能强劲、完全开源的新基线与技术范式。

背景介绍
X-VLA结构设计
预训练方法
后训练方法
未来展望

参与方式

注：3D视觉工坊很荣幸邀请到了清华大学智能产业研究院(AIR)博士三年级郑金亮，为大家着重分享相关领域的核心内容。如果您有相关工作需要分享，欢迎联系微信：cv3d009，请备注：宣传工作，则不予通过。

南阳市网站建设_网站建设公司_Spring_seo优化

直播信息

主讲嘉宾

直播大纲

参与方式

热门文章

文章分类

标签云

需要专业的网站建设服务？

南阳市网站建设_网站建设公司_Spring_seo优化

直播信息

主讲嘉宾

直播大纲

参与方式

热门文章

文章分类

标签云

相关文章

湖北省自建房设计公司权威评测排行榜：6大维度打分，5星企业全解析 - 苏木2025

4K@60fps 摄像头，到底要几条 MIPI CSI-2 LANE？

springboot基于Java的连锁商务酒店管理系统(源码+lw+部署文档+讲解等)

需要专业的网站建设服务？