讲座主题:视觉-语言-动作模型(VLA)的原理与应用
讲座时间:2026年4月22日13:00
讲座地点:实训楼A113室
讲座对象:信息工程学院师生
主讲人简介:张威,信息工程学院教师,博士,2024年毕业于同济大学软件学院,研究方向为可信系统与软件、大模型故障传播分析与诊断等。曾就职于上交所技术有限责任公司,参与上海证券交易系统的开发与维护等工作。
讲座摘要:随着人工智能技术的快速发展,机器人系统正在从“感知环境”逐步走向“理解任务并自主执行操作”。视觉-语言-动作模型(Vision-Language-Action, VLA)是一类将视觉感知、语言理解与动作决策统一起来的新型智能模型,能够使机器人根据图像信息和自然语言指令完成抓取、搬运、操作等复杂任务。本报告围绕VLA的基本概念、核心组成和典型工作流程展开介绍。