一款极其灵动的 AI 台灯机器人,火了。尽管这两年不断见证了真实世界的机器人刷新我们的认知,从奔跑、翻滚到跳舞,也看过了米家皮皮灯,但还是第一次看到这么灵动的——台灯,很像皮克斯片头跳动的 Luxo Jr.(小台灯)。
图/苹果而这个台灯,是苹果公司机器学习研究团队做的非人形机器人。苹果要做家用机器人的消息,其实已经传了相当一段时间,但官方实际上一直没有承认,也没有透露产品细节。不过,苹果机器学习研究团队近期直接在官网公布了一篇研究论文以及一段实拍演示视频,全面展示了这款 AI 台灯机器人的交互能力和表现,也在 X、Reddit 等社交平台上被各种围观讨论。乍看之下,这款苹果「台灯」的外观并不奇特,硬要说也就是比常规台灯全身上下多了不少机电结构。但关键是动起来,它不仅能让灯光主动跟随书本,用户还能通过简单地触摸、手势来召唤或者指引它。
事实上,尽管从对话和智能程度来看,大概率可以判断出苹果机器学习研究团队是基于大模型开发出了这款台灯形态的 AI 机器人。但就苹果公布的这篇论文而言,并非聚焦在人工智能的层面,反而是聚焦在「台灯」一系列精细、灵动的运动上。首先苹果论文的标题就是——《ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot》(优雅:非人形机器人的表现性和功能性运动设计),四位论文作者中有三位是华人。
图/苹果研究团队也确实招募了 21 名参与者,在 6 种不同场景下观看人类与机器人之间的交互。结果显示,比起单纯满足功能性要求的运动设计,兼具表现力和功能性的运动设计明显能提高参与者的评分——用户更喜欢也能接受 ,而且男性比女性更明显,普通用户比专业用户更明显。其实从常理也能看到,米家皮皮灯推出之初之所以能够引起广泛关注和讨论,并不在于功能性或者实用价值。但另一方面,苹果这款 AI 台灯的原型版最大的亮点就是同时具备情绪和实用价值,而不只是「萌」。
图/苹果苹果很大程度上也是基于大模型的能力,自然语言对话自不必说,从视觉能力上也能得以窥见一二。与此同时,在人形机器人还很难短期内落地家庭场景的背景下,这可能也是家用机器人的必然,即基于多模态大模型成为人类的「第三只眼」「第二大脑」。此外,这款「台灯」也让我们初步看到了苹果在人机交互上的想法,比如除了 AI 语音交互,还能看到基于摄像头的 AI 视觉+图形界面显示,以及简单的手势和触摸交互。尤其是视觉+显示的交互能力,直接赋予了「台灯」在各种场景下满足的需求。从这个角度看,我们完全可以期待苹果未来最终推出的桌面机器人,在语音之外也支持视觉和显示的能力,在拥有基于 AI 的实用价值的同时,也能满足人类用户的情绪价值。
一款极其灵动的 AI 台灯机器人,火了。尽管这两年不断见证了真实世界的机器人刷新我们的认知,从奔跑、翻滚到跳舞,也看过了米家皮皮灯,但还是第一次看到这么灵动的——台灯,很像皮克斯片头跳动的 Luxo Jr.(小台灯)。
图/苹果而这个台灯,是苹果公司机器学习研究团队做的非人形机器人。苹果要做家用机器人的消息,其实已经传了相当一段时间,但官方实际上一直没有承认,也没有透露产品细节。不过,苹果机器学习研究团队近期直接在官网公布了一篇研究论文以及一段实拍演示视频,全面展示了这款 AI 台灯机器人的交互能力和表现,也在 X、Reddit 等社交平台上被各种围观讨论。乍看之下,这款苹果「台灯」的外观并不奇特,硬要说也就是比常规台灯全身上下多了不少机电结构。但关键是动起来,它不仅能让灯光主动跟随书本,用户还能通过简单地触摸、手势来召唤或者指引它。
事实上,尽管从对话和智能程度来看,大概率可以判断出苹果机器学习研究团队是基于大模型开发出了这款台灯形态的 AI 机器人。但就苹果公布的这篇论文而言,并非聚焦在人工智能的层面,反而是聚焦在「台灯」一系列精细、灵动的运动上。首先苹果论文的标题就是——《ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot》(优雅:非人形机器人的表现性和功能性运动设计),四位论文作者中有三位是华人。
图/苹果研究团队也确实招募了 21 名参与者,在 6 种不同场景下观看人类与机器人之间的交互。结果显示,比起单纯满足功能性要求的运动设计,兼具表现力和功能性的运动设计明显能提高参与者的评分——用户更喜欢也能接受 ,而且男性比女性更明显,普通用户比专业用户更明显。其实从常理也能看到,米家皮皮灯推出之初之所以能够引起广泛关注和讨论,并不在于功能性或者实用价值。但另一方面,苹果这款 AI 台灯的原型版最大的亮点就是同时具备情绪和实用价值,而不只是「萌」。
图/苹果苹果很大程度上也是基于大模型的能力,自然语言对话自不必说,从视觉能力上也能得以窥见一二。与此同时,在人形机器人还很难短期内落地家庭场景的背景下,这可能也是家用机器人的必然,即基于多模态大模型成为人类的「第三只眼」「第二大脑」。此外,这款「台灯」也让我们初步看到了苹果在人机交互上的想法,比如除了 AI 语音交互,还能看到基于摄像头的 AI 视觉+图形界面显示,以及简单的手势和触摸交互。尤其是视觉+显示的交互能力,直接赋予了「台灯」在各种场景下满足的需求。从这个角度看,我们完全可以期待苹果未来最终推出的桌面机器人,在语音之外也支持视觉和显示的能力,在拥有基于 AI 的实用价值的同时,也能满足人类用户的情绪价值。