文/VR陀螺 豌豆
在投融资热度超高的AI领域,是科技巨头和资本角逐的主要战场。根据Crunchbase数据,2025年第一季度全球创业公司融资总额达到1140亿美元,较2024年第四季度的960亿美元环比增长17%,同比增长54%,创下自2022年第二季度以来的最强单季表现。
上半年的一笔巨额融资就来自Meta,其豪掷143亿美元拿下Scale AI的49%股权,然后继续持续发力,大肆网罗人才、收购企业,在行业内掀起一阵波澜。这些交易都将成为影响Meta的AI业务和智能眼镜产品生态的关键拼图。
从近两个月Meta几起投融资事件来看,大部分事件都集中于AI语音领域。得益于大模型能力的提升,AI语音与终端设备的连接更为紧密,产品形态也更加多样化,AI语音功能已融入到AI玩具、智能音箱、AI眼镜等等,应用场景潜力巨大。
针对Meta的2025年第一季度财报,其首席执行官马克·扎克伯格表示:“我们在重要的一年里取得了良好的开端,我们的社区持续发展,业务表现也非常出色。我们在AI眼镜和Meta AI方面取得了良好的进展,目前其月活跃用户已接近10亿。”
Meta正在推动通过音视频交互增强AI和XR体验的未来,以应对谷歌等竞争对手,这里简单梳理了Meta近两个月的动向:
Meta希望重新开始改变AI部门运营策略,先靠“砸钱”紧急弥补短板。甚至将AI部门进行全面重组,成立“超级智能实验室”,该部门将致力于开发超越人类能力的AI系统,其研发方向将直接影响XR产品的多模态升级,扎克伯格将此举描述为“人类新时代的开始”。新成立的部门由数据标签初创公司Scale AI前首席执行官Alexandr Wang领导。
Meta对AI的投入,最终目的都是为了实现商业化,而Meta AI商业化项目中最为成功的一类AI产品就是智能眼镜Ray-Ban Meta。
站在用户的角度来看,最关注的是功能体验,唤醒这些功能的关键在于AI语音的交互能力。为使AI助手进一步实现“更懂情绪、听懂人话、反应更快”等功能,AI语音正逐步发展为连接智能设备决策的关键枢纽,Meta选择在AI语音这一领域加大布局力度也就更加合乎逻辑。
AI语音
若Meta要进一步提高AI智能眼镜的用户体验,就需要解决延迟和语音合成质量问题,这正是语音交互中最容易让用户察觉到“不自然”的痛点。据了解,若交互式音频通话的延迟上限在约150-200毫秒的范围内,意味着这样的延迟几乎不会被人耳察觉,能保持自然通话体验,超过则会影响用户体验。
Ray-Ban Meta Wayfarer测试报告,图源:中国信通院泰尔终端实验室
以Meta收购的AI语音公司PlayAI则是对语音技术的补位:它支持使用30多种语言和当地口音进行交流,拥有200多种逼真的AI语音,其语音合成延迟压缩到了130毫秒以内。其依赖于定制的低延迟大型语言模型,这些模型在包含数千小时人类语音的海量数据集上进行训练,涵盖播客、故事讲述、旁白和商务对话等多种风格。从技术能力来看,PlayAI的核心优势体现在开发者无需先训练自己的模型即可创建强大的语音应用程序。
虽然收购事件财务条款尚未披露,有业内人士估计这笔收购价值接近2亿美元。
PlayAI的Dialog文本转语音模型
收购PlayAI是Meta人才争夺战略中的重要布局,优化Meta AI语音能力的可靠度、自然度,并解决延迟问题。更关键的是填补了该公司在“AI+XR”领域核心能力的短板,例如强化Meta社交应用《Horizon World》的沉浸式体验、AI智能眼镜的交互能力和音频内容创作。显然,声音已经成为AI设备交互的核心,唯有语音交互足够“类人”,才能支撑更广泛的场景落地。
AI文生视频
除语音交互外,视频能力同样是提升体验的关键。Meta也有意在AI视频领域更进一步,外媒报道,Meta正与Pika Labs进行深入谈判,交易或涉及部分股权转让、技术整合,甚至核心团队并入Meta。
Pika成立不久后就凭借一段“马斯克穿太空服飞上天”的动画在社交媒体上爆红。后来Pika迅速完成多轮融资,累计募集超1.3亿美元,估值近5亿美元,其核心技术在于通过文字生成逼真短视频并支持风格化编辑,为视频生成适配的音效、对口型等等,降低了创作门槛。
Pika宣传视频片段
Pika在用户体验和社区运营方面更符合Meta对AI内容平台的想象,Meta正将文生视频功能作为提高超级智能的重要一环。
如果将Pika产品融入到Meta已有项目,例如Horizon Worlds桌面编辑器上线的两项AI功能:创作助手(Creator Assistant)和风格参考(Style Reference),将进一步提升内容生成效率,提高用户的沉浸式体验。或是设想用户通过语音指令向AI眼镜提出需求时,带显示的AI眼镜/AR眼镜可以实时生成对用户面前的画面生成相应的操作演示视频等等。
对专注于娱乐、社交业务的Meta而言,AI音视频技术是占领短视频和虚拟空间的阵地的关键。一连串收购动作的背后,Meta AI的多模态理解能力将更贴合真实生活场景,进而强化其在AI+XR领域的技术壁垒。
从密集的AI语音布局到与EssilorLuxottica的深度绑定,将智能眼镜业务推向AI交互终端核心。数日前,Meta与合作伙伴EssilorLuxottica各自发布了2025年Q2季度财报。这两份成绩单将成为继续加深双方合作的重要锚点:
Meta元宇宙部门Reality Labs,Q2营收为3.7亿美元,同比增长5%,支出49亿美元,亏损达45.3亿美元,亏损低于市场预期的48亿美元。增长主要来自Ray-Ban Meta智能眼镜;EssilorLuxottica公司在第二季度收入增长7.3%,营收达到71.8亿欧元(约合83.6亿美元),Ray-Ban Meta AI眼镜的销量在上半年销售额同比增长超过200%。
作为传统光学巨头,EssilorLuxottica以精密光学技术、全球品牌效应和零售渠道网络,为Meta的技术落地提供了“最后一公里”的支撑,推动了整个智能眼镜品类在消费端的渗透率,为传统制造业的智能化转型提供了范本,这份支持已经体现在上述双方财报之中。
对Meta而言,Ray-Ban Meta是验证AI+XR路径可行性的重要凭证,PlayAI提升AI语音能力、EssilorLuxottica的品牌矩阵、Scale AI的数据能力,Meta正站在AI之上搭建一条从技术底层到设备终端的全新链路,以语音为核心交互的入口,AI智能眼镜将更快地在医疗、教育和工业等垂直场景实现转化。
AI+XR产品的落地离不开跨界协同,需要与传统行业的场景经验、渠道资源融合,Meta现在的亏损与投入仍是“必要成本”,Meta的首席技术官Andrew Bosworth就预告下半年的Connect 2025会有“重大的可穿戴设备发布”。
预告很大可能指向爆料中提到的Meta Celeste(代号Hypernova),这将是Meta首款带显示屏的AI眼镜,配备肌电手环,手环代号为Ceres。若在Ray-Ban Meta智能眼镜的核心功能“听、说、拍”的基础上增加“看”的能力,Meta有必要为智能眼镜增强音视频加大投入。还有另一款与EssilorLuxottica合作推出的新款Oakley Meta Sphaera智能眼镜也可能在下半年亮相。
Meta的CEO扎克伯格曾在2025年Q2季度财报之际的电话会议提到:“我认为,未来,如果你没有配备AI或某种与AI互动的眼镜,那么与你共事或竞争的人相比,你的认知劣势可能相当明显。所以我认为这是一个非常基本的形态因素。它有很多不同的版本。目前,我们正在打造一些我认为很时尚的眼镜,但并不专注于显示屏。我认为显示屏方面有很多不同的东西值得探索。”
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息