信息工程学院

科研动态
当前位置: 网站首页 >>  学科科研 >>  科研动态 >>  正文
“数智启新・研思共进”系列学术沙龙活动之一——视觉-语言-动作模型(VLA)的原理与应用
发布人:刘立 | 发布日期:2026年04月20日 10:51 | 点击数:

讲座主题:视觉-语言-动作模型(VLA)的原理与应用

讲座时间:2026年4月22日13:00

讲座地点:实训楼A113室

讲座对象:信息工程学院师生

主讲人简介:张威,信息工程学院教师,博士,2024年毕业于同济大学软件学院,研究方向为可信系统与软件、大模型故障传播分析与诊断等。曾就职于上交所技术有限责任公司,参与上海证券交易系统的开发与维护等工作。

讲座摘要:随着人工智能技术的快速发展,机器人系统正在从“感知环境”逐步走向“理解任务并自主执行操作”。视觉-语言-动作模型(Vision-Language-Action, VLA)是一类将视觉感知、语言理解与动作决策统一起来的新型智能模型,能够使机器人根据图像信息和自然语言指令完成抓取、搬运、操作等复杂任务。本报告围绕VLA的基本概念、核心组成和典型工作流程展开介绍。