编译/VR陀螺
近日,苹果在其Machine Learning Research博客上发表了一项新研究,题为 《EMBridge:通过跨模态表征学习增强肌电信号的手势泛化能力》。该研究将于今年4月在ICLR 2026大会上展示。
研究人员介绍了他们如何训练AI模型识别手势,即便这些特定手势从未出现在原始数据集中。
为实现这一目标,他们开发了EMBridge,这是一个跨模态表征学习框架,用于弥合肌电信号(EMG)与姿态(pose)之间的模态差异。
肌电图(EMG,Electromyography) 用于测量肌肉收缩时产生的电活动。其实际应用覆盖医学诊断与康复理疗、假肢控制等,近年来在可穿戴设备、AR/VR 系统中被广泛探索。
例如,Meta的雷朋智能眼镜就采用了EMG技术,通过一款名为Neural Band的腕戴设备,解读肌肉信号以操控眼镜功能。
但在苹果这项研究中,用于训练的EMG信号并非来自腕戴设备。研究团队使用了两个数据集:
不难看出,EMBridge 技术未来很可能用于Apple Watch或其他可穿戴设备,实现对 Apple Vision Pro、Mac、iPhone以及传闻中的苹果智能眼镜等设备的操控。从全新交互方式到无障碍功能增强,其应用潜力巨大。
当然,研究本身并未提及任何具体苹果新品或应用,但明确指出:本框架的一个潜在实际应用是可穿戴人机交互。在 VR/AR、假肢控制等场景中,腕戴设备需要持续从EMG信号中推断手势,以驱动虚拟形象或机械手。
什么是 EMBridge?EMBridge 是研究人员用来弥合真实肌电肌肉信号与结构化手部姿态数据之间鸿沟的方案。
模型采用跨模态框架训练:

研究人员总结道,EMBridge是首个实现可穿戴EMG信号零样本手势分类的跨模态表征学习框架,展现了在可穿戴设备上进行真实场景手势识别的潜力。
为减少因相似手势被当作负样本导致的训练误差,团队让模型学会识别姿态相近的手部构型,为其生成软目标,而非完全当作无关类别。这让模型的表征空间更有序,提升了对从未见过的手势的泛化能力。

来源:9to5mac
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息