作者 |辰纹
来源 | 洞见新研社
从Google Glass到Vision Pro,人类对智能眼镜的探索有进展,但都不算成功,直至Ray-Ban Meta的出现,这才让行业对智能眼镜重燃信心,从去年开始,随着AI大模型应用的深入,智能眼镜又有了新的故事可说。
今年下半年,百度和国内头部智能眼镜商Rokid发布搭载AI能力的智能眼镜,在百度和Rokid之外,小米和苹果也在被传将入局智能眼镜研发,与此同时,OPPO、vivo、华为、腾讯、字节跳动等科技大厂都在评估AI眼镜项目。
是继续在AR的路上走到黑,还是重新开辟一条AI路线,如今的智能眼镜走到了十字路口。
01 百镜大战
2012年,被Google称为“登月计划”的 Google Glass上线发布,在Google的计划中,Google Glass的终极使命是“替代手机”,成为人们每天都能戴在眼睛上的“智能手机”。
对标手机屏幕,Google Glass采用棱镜投影技术,能够显示邮件、短信、导航等信息;
对标手机的影音娱乐功能,Google Glass可以通过内置的 500 万像素摄像头完成第一人称拍摄,并通过棱镜投影回看影片;
对标手机的上网功能,Google Glass支持语音搜索交互,用户可以问询一些天气、股票价格等知识类问题。
现实是残酷的,Google Glass并没有完成预想中的大卖,至于“取代手机”更是边都没沾到。2015年,Google暂停了Google Glass的售卖。
行业对 Google Glass 的失败进行了归因分析,包括营销策略、落地场景缺失、市场接受度等问题。其中美国科技媒体 Verge 明确指出,Google Glass 提供的许多功能(如语音拍照、导航)在智能手机上同样可用,但手机的体验更好、更便捷。
“替换手机”这条路走不通,那就从眼镜的原始功能出发——提供差异化的视觉体验,于是智能眼镜厂商们死磕显示技术,AR/VR眼镜成为后Google Glass时代的主流。
为了实现更好的显示效果,AR/VR眼镜的设计与普通眼镜有非常大的不同,通常采用极为夸张和科幻的造型,眼镜的重量成为行业始终没有解决的问题,加上贫瘠的应用和内容生态,AR/VR眼镜在消费端至今没有掀起太大的波澜。
苹果召集2000多名设计师、工程师,历时8年,前后花费数十亿美元研发的Vision Pro就是其中的典型。
光就产品力而言,Vision Pro确实已经做到了智能眼镜的极致,两块Micro OLED显示屏幕能够实现双眼接近8K的显示效果,像素密度达到惊人的3400 PPI,远超我们在智能眼镜视距内的PPI分辨极限。
Vision Pro发布之前,果粉们期待雀跃,可是产品发布后,市场用脚投票,发售不到一年即宣布停产,成为苹果“最短命”产品。
AR/VR眼镜之后,行业迎来由Ray-Ban Meta所激活的AI眼镜热潮。
这款由Meta与雷朋公司合作打造的智能眼镜自去年9月上线,1年多时间卖出了超过100万台,2024年年度销量有望超过200万台,国金证券发布的研究报告预测,当Ray-Ban Meta的销售网络铺设到全球,其年销量潜力或可跃升至 600 万台以上。
Ray-Ban Meta显然给了行业极大的示范与刺激,中国厂商中,百度今年推出的“小度AI眼镜”以及Rokid与时尚眼镜品牌BOLON合作的“Rokid glasses”颇受关注。
百度入局AI眼镜,源自号称“最懂中文”的文心大模型,可以无缝对接包括百度地图、搜索、百科在内的百度应用生态。
Rokid此次推出的“Rokid glasses”接入了阿里巴巴通义千问大模型的算法能力,实现问题解答、实时翻译等功能。
除了百度、Rokid外,还要很多科技公司也在布局智能眼镜产品。
今年4月份,AR品牌“李未可”发布了AI智能眼镜Meta Lens Chat;8月份,小米生态链企业蜂巢科技推出了界环AI音频眼镜;同月,雷鸟创新与博士眼镜成立合资公司,首款产品预计年底发布……
根据公开信息及渠道消息,截至目前中国已经有至少 50 家公司正在推进智能眼镜项目。其中包括小米、华为、百度、字节跳动等领军企业,也包括雷鸟、影目、Rokid等上一波智能眼镜浪潮中崛起的新兴厂商。海外厂商中,苹果、三星、谷歌等巨头也都在跃跃欲试,大有“百镜大战”的架势。
02 AI带来的风口
仔细研究了Ray-Ban Meta的成功要素之后,所有的AI眼镜厂商都将拍照识别、音频录制播放和AI调用列为产品的三项主要功能,即智能眼镜既是相机,也是耳机,同时还是能帮你翻译、导航的AI助理。
AI眼镜的定义似乎又回到了Google Glass时代,随着AI大模型的崛起,行业需要其他的类似手机一样的AI应用的物理载体。
回过头来复盘,Google Glass的产品设计理念其实是没有问题的,只是提出这个想法的时间不对,就像“领先半步”理论说的那样,“领先一步是先驱,领先两步是先烈”。
现在的技术成熟度与Google Glass发售的12年前有了天翻地覆的变化。
以最新发布的Rokid Glasses为例,与以往分体式设计有所不同,此次发布的Rokid Glasses采用了一体化结构布局,重量仅49g。Rokid产品团队将主板、电池等核心组件集成于纤薄框架之中,使得整体造型更加接近传统眼镜样式,极大地提升了佩戴者的舒适度及便携性,这是智能眼镜工业设计上的进步。
借助光波导技术的支持,该款AR眼镜能够在不影响正常视线的前提下,通过透明镜片展示出清晰细腻的虚拟界面,实现信息叠加显示效果,从而开辟了全新的人机交互模式,这是显示技术的进步。
功能性方面,Rokid Glasses通过深度整合阿里巴巴旗下通义千问大模型的算法能力,能够轻松完成物体识别、文字翻译乃至数学题解答等多种任务。
比如快速准确地计算食物卡路里含量,并即时呈现给使用者;或者是在跨文化交流场景下,自动捕捉对话内容并实时转化为对方语言的文字提示,方便国际旅行者之间的沟通交流。这是AI大模型技术进步下的具体应用。
另外一个方面,供应链的成熟也大大降低了AI眼镜的进入门槛。
在行业人士看来,纯粹的AI眼镜属于轻量级的产品,硬件构成比较简单,AI眼镜厂商只需要找一个白牌眼镜供应商,然后采购摄像头、声学模块、蓝牙模块、电池和处理器,再开发一个接入开源大模型手机APP,一个具有基础功能的AI眼镜基本就成型了。
事实上,这样的产品很早就已经出现了,甚至比Ray-Ban Meta更早,拼多多上的“AI智能音频眼镜”价格普遍不超过100元,待机时长更是能够达到夸张的240小时,这也是行业能够形成“百镜大战“竞争格局的原因之一。
03 AR+AI=未来
综合上文不难看出,智能眼镜发展至今已经形成了3条技术路线,即“具备AR功能的智能眼镜”,“无显示屏的AI眼镜”和侧重于音频体验的“音频眼镜”。
目前,AR眼镜与AI眼镜除了显示能力之外,其主要差异在于交互方式上的不同,AI眼镜是VUI(语音交互界面),主要通过语音、TTS(文本转语音)以及指示灯反馈进行交互,AR眼镜是GUI(图像交互界面),主要通过显示、触控以及语音和TTS进行交互。
可是,无论哪类智能眼镜,现阶段都还没有摆脱续航、重量和算力的“不可能三角”,与所有的智能终端一样,智能眼镜的功能越多,能耗也就越高,如果扩大电池的容量,又会影响到眼镜的重量。
在这方面,AR眼镜的痛点尤其突出,一些产品笨重的头套式就劝退了很多想尝鲜的用户,“无显示屏的AI眼镜”虽然在一定程度上减轻了重量,但与普通眼镜20-30克的重量相比,还是较重。
目前市面上主流AI眼镜的重量在45克左右,可是如果配上镜片,根据镜片度数的不同,重量就还要往上再加10克以上,长时间佩戴还是会感觉不适。
除此之外,几乎所有的AI眼镜目前都没有解决续航问题。相比于手机、相机或者其他手持拍摄设备,Meta持续拍摄最多可以维持3小时。这也是目前大部分AI眼镜产品的痛点。
这也是说,智能眼镜的产品还未完全定型,无论是AR眼镜还是AI眼镜,在行业真正爆发之前,还要大量的技术问题有待解决。
比如,AR眼镜就有意识的融入AI技术,让自己的应用场景更加广泛,部分AI眼镜厂商则在努力加强自己的显示能力,同样是为了弥补自己的短板。
之所以会出现这样的情况,很大一个原因在于,行业普遍认为AR眼镜才是智能眼镜的最终形态,“人类有八成的信息通过视觉来接收,如果没有影像方面的交互,单凭AI能力是无法成为人类获取信息和服务的新入口的”,有专业人士如是评述。
XREAL创始人兼CEO徐驰在接受媒体采访时曾表示,“AR是AI最好的载体,AI是AR最好的交互,这很可能是未来十年最能够改变消费电子和我们终端体验的两个核心技术。”
智能眼镜的未来,AR和AI或许会合二为一,但从当下来看,二者都还需要面对如何实现规模化,实现快速渗透的同一个挑战,要知道,行业唯一的爆款Ray-Ban Meta一年下来,也才卖出100多万台,这个数量是手机厂商们发布新品时3天就能达到的销量。
原文标题 : AR向左,AI向右,智能眼镜来到十字路口
作者 |辰纹
来源 | 洞见新研社
从Google Glass到Vision Pro,人类对智能眼镜的探索有进展,但都不算成功,直至Ray-Ban Meta的出现,这才让行业对智能眼镜重燃信心,从去年开始,随着AI大模型应用的深入,智能眼镜又有了新的故事可说。
今年下半年,百度和国内头部智能眼镜商Rokid发布搭载AI能力的智能眼镜,在百度和Rokid之外,小米和苹果也在被传将入局智能眼镜研发,与此同时,OPPO、vivo、华为、腾讯、字节跳动等科技大厂都在评估AI眼镜项目。
是继续在AR的路上走到黑,还是重新开辟一条AI路线,如今的智能眼镜走到了十字路口。
01 百镜大战
2012年,被Google称为“登月计划”的 Google Glass上线发布,在Google的计划中,Google Glass的终极使命是“替代手机”,成为人们每天都能戴在眼睛上的“智能手机”。
对标手机屏幕,Google Glass采用棱镜投影技术,能够显示邮件、短信、导航等信息;
对标手机的影音娱乐功能,Google Glass可以通过内置的 500 万像素摄像头完成第一人称拍摄,并通过棱镜投影回看影片;
对标手机的上网功能,Google Glass支持语音搜索交互,用户可以问询一些天气、股票价格等知识类问题。
现实是残酷的,Google Glass并没有完成预想中的大卖,至于“取代手机”更是边都没沾到。2015年,Google暂停了Google Glass的售卖。
行业对 Google Glass 的失败进行了归因分析,包括营销策略、落地场景缺失、市场接受度等问题。其中美国科技媒体 Verge 明确指出,Google Glass 提供的许多功能(如语音拍照、导航)在智能手机上同样可用,但手机的体验更好、更便捷。
“替换手机”这条路走不通,那就从眼镜的原始功能出发——提供差异化的视觉体验,于是智能眼镜厂商们死磕显示技术,AR/VR眼镜成为后Google Glass时代的主流。
为了实现更好的显示效果,AR/VR眼镜的设计与普通眼镜有非常大的不同,通常采用极为夸张和科幻的造型,眼镜的重量成为行业始终没有解决的问题,加上贫瘠的应用和内容生态,AR/VR眼镜在消费端至今没有掀起太大的波澜。
苹果召集2000多名设计师、工程师,历时8年,前后花费数十亿美元研发的Vision Pro就是其中的典型。
光就产品力而言,Vision Pro确实已经做到了智能眼镜的极致,两块Micro OLED显示屏幕能够实现双眼接近8K的显示效果,像素密度达到惊人的3400 PPI,远超我们在智能眼镜视距内的PPI分辨极限。
Vision Pro发布之前,果粉们期待雀跃,可是产品发布后,市场用脚投票,发售不到一年即宣布停产,成为苹果“最短命”产品。
AR/VR眼镜之后,行业迎来由Ray-Ban Meta所激活的AI眼镜热潮。
这款由Meta与雷朋公司合作打造的智能眼镜自去年9月上线,1年多时间卖出了超过100万台,2024年年度销量有望超过200万台,国金证券发布的研究报告预测,当Ray-Ban Meta的销售网络铺设到全球,其年销量潜力或可跃升至 600 万台以上。
Ray-Ban Meta显然给了行业极大的示范与刺激,中国厂商中,百度今年推出的“小度AI眼镜”以及Rokid与时尚眼镜品牌BOLON合作的“Rokid glasses”颇受关注。
百度入局AI眼镜,源自号称“最懂中文”的文心大模型,可以无缝对接包括百度地图、搜索、百科在内的百度应用生态。
Rokid此次推出的“Rokid glasses”接入了阿里巴巴通义千问大模型的算法能力,实现问题解答、实时翻译等功能。
除了百度、Rokid外,还要很多科技公司也在布局智能眼镜产品。
今年4月份,AR品牌“李未可”发布了AI智能眼镜Meta Lens Chat;8月份,小米生态链企业蜂巢科技推出了界环AI音频眼镜;同月,雷鸟创新与博士眼镜成立合资公司,首款产品预计年底发布……
根据公开信息及渠道消息,截至目前中国已经有至少 50 家公司正在推进智能眼镜项目。其中包括小米、华为、百度、字节跳动等领军企业,也包括雷鸟、影目、Rokid等上一波智能眼镜浪潮中崛起的新兴厂商。海外厂商中,苹果、三星、谷歌等巨头也都在跃跃欲试,大有“百镜大战”的架势。
02 AI带来的风口
仔细研究了Ray-Ban Meta的成功要素之后,所有的AI眼镜厂商都将拍照识别、音频录制播放和AI调用列为产品的三项主要功能,即智能眼镜既是相机,也是耳机,同时还是能帮你翻译、导航的AI助理。
AI眼镜的定义似乎又回到了Google Glass时代,随着AI大模型的崛起,行业需要其他的类似手机一样的AI应用的物理载体。
回过头来复盘,Google Glass的产品设计理念其实是没有问题的,只是提出这个想法的时间不对,就像“领先半步”理论说的那样,“领先一步是先驱,领先两步是先烈”。
现在的技术成熟度与Google Glass发售的12年前有了天翻地覆的变化。
以最新发布的Rokid Glasses为例,与以往分体式设计有所不同,此次发布的Rokid Glasses采用了一体化结构布局,重量仅49g。Rokid产品团队将主板、电池等核心组件集成于纤薄框架之中,使得整体造型更加接近传统眼镜样式,极大地提升了佩戴者的舒适度及便携性,这是智能眼镜工业设计上的进步。
借助光波导技术的支持,该款AR眼镜能够在不影响正常视线的前提下,通过透明镜片展示出清晰细腻的虚拟界面,实现信息叠加显示效果,从而开辟了全新的人机交互模式,这是显示技术的进步。
功能性方面,Rokid Glasses通过深度整合阿里巴巴旗下通义千问大模型的算法能力,能够轻松完成物体识别、文字翻译乃至数学题解答等多种任务。
比如快速准确地计算食物卡路里含量,并即时呈现给使用者;或者是在跨文化交流场景下,自动捕捉对话内容并实时转化为对方语言的文字提示,方便国际旅行者之间的沟通交流。这是AI大模型技术进步下的具体应用。
另外一个方面,供应链的成熟也大大降低了AI眼镜的进入门槛。
在行业人士看来,纯粹的AI眼镜属于轻量级的产品,硬件构成比较简单,AI眼镜厂商只需要找一个白牌眼镜供应商,然后采购摄像头、声学模块、蓝牙模块、电池和处理器,再开发一个接入开源大模型手机APP,一个具有基础功能的AI眼镜基本就成型了。
事实上,这样的产品很早就已经出现了,甚至比Ray-Ban Meta更早,拼多多上的“AI智能音频眼镜”价格普遍不超过100元,待机时长更是能够达到夸张的240小时,这也是行业能够形成“百镜大战“竞争格局的原因之一。
03 AR+AI=未来
综合上文不难看出,智能眼镜发展至今已经形成了3条技术路线,即“具备AR功能的智能眼镜”,“无显示屏的AI眼镜”和侧重于音频体验的“音频眼镜”。
目前,AR眼镜与AI眼镜除了显示能力之外,其主要差异在于交互方式上的不同,AI眼镜是VUI(语音交互界面),主要通过语音、TTS(文本转语音)以及指示灯反馈进行交互,AR眼镜是GUI(图像交互界面),主要通过显示、触控以及语音和TTS进行交互。
可是,无论哪类智能眼镜,现阶段都还没有摆脱续航、重量和算力的“不可能三角”,与所有的智能终端一样,智能眼镜的功能越多,能耗也就越高,如果扩大电池的容量,又会影响到眼镜的重量。
在这方面,AR眼镜的痛点尤其突出,一些产品笨重的头套式就劝退了很多想尝鲜的用户,“无显示屏的AI眼镜”虽然在一定程度上减轻了重量,但与普通眼镜20-30克的重量相比,还是较重。
目前市面上主流AI眼镜的重量在45克左右,可是如果配上镜片,根据镜片度数的不同,重量就还要往上再加10克以上,长时间佩戴还是会感觉不适。
除此之外,几乎所有的AI眼镜目前都没有解决续航问题。相比于手机、相机或者其他手持拍摄设备,Meta持续拍摄最多可以维持3小时。这也是目前大部分AI眼镜产品的痛点。
这也是说,智能眼镜的产品还未完全定型,无论是AR眼镜还是AI眼镜,在行业真正爆发之前,还要大量的技术问题有待解决。
比如,AR眼镜就有意识的融入AI技术,让自己的应用场景更加广泛,部分AI眼镜厂商则在努力加强自己的显示能力,同样是为了弥补自己的短板。
之所以会出现这样的情况,很大一个原因在于,行业普遍认为AR眼镜才是智能眼镜的最终形态,“人类有八成的信息通过视觉来接收,如果没有影像方面的交互,单凭AI能力是无法成为人类获取信息和服务的新入口的”,有专业人士如是评述。
XREAL创始人兼CEO徐驰在接受媒体采访时曾表示,“AR是AI最好的载体,AI是AR最好的交互,这很可能是未来十年最能够改变消费电子和我们终端体验的两个核心技术。”
智能眼镜的未来,AR和AI或许会合二为一,但从当下来看,二者都还需要面对如何实现规模化,实现快速渗透的同一个挑战,要知道,行业唯一的爆款Ray-Ban Meta一年下来,也才卖出100多万台,这个数量是手机厂商们发布新品时3天就能达到的销量。
原文标题 : AR向左,AI向右,智能眼镜来到十字路口