财经头条
提升一亿中产阶级阅读效率
打开
狂热过后,我和几位硬件工程师聊了聊 Manus 的价值和意义
极客公园
2天前
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
作者|张勇毅
编辑|
郑玄
在昨天拿到 Manus AI 的测试码、连续进行了数个小时的测试之后,有不少在手机/PC 厂商的工程师/产品经理朋友,来找我「打听」Manus AI 的真正能力如何。
为什么硬件行业这么关注 Manus?这与当下硬件行业最受关注的概念——LAM 有关。LAM 是一个从 LLM 延伸而来的名词,全名为大型行动模型 (Large Action Models),也称为大型智能体模型。
与 LLM 致力于「超越人类」,因此在训练方法上也经常突破人类经验完全不同,现阶段 LAM 想要做到的,是成为人类的手,去作为人类用户在数字世界中的代理人。
这与 Manus 的核心理念有相通之处。目前而言,Manus AI 的体验,围绕在一个运行在云端的 Ubuntu 操作系统虚拟机上,同时在操作系统中打开 Chrome 浏览器界面,在网页中或是调用其他软件,来完成各种用户的请求。
为了完成这个要求,Manus 需求同时具备「自然语义理解和计算机视觉」,以及「用户行为习惯学习与场景感知」,同时拥有「意图识别自主决策」的能力,当然最重要的,同时也是让 Manus AI 与此前的 Computer Use 在体验上拉开明显差距的,还是「跨应用调用工具」的能力。
举例来讲,对于常见的「能不能用 Manus AI 生成一段视频」这个问题,严格来讲回答是「可以」,但 Manus AI 去生成一段视频的方式,也是通过在网络上搜索第三方 AI 视频生成工具,并在这个过程中使用到各种工具,来完成用户的请求。
01
LAM 真正的未来
进入 2025 年,Agent AI,或者说 LAM 在端侧的落地,已经是再明显不过的趋势。但怎么落地,以及最终呈现给用户的会是怎样的商业产品,仍然有很多问题。
早在 2024 年初,彼时发布的 Rabbit R1 硬件,以及对应的 LAM 工具——Rabbit LAM Playground 其实已经展现出了今天我们在 Manus AI 中看到的能力雏形。
在官方的演示中,Rabbit R1 所搭载的 LAM Playground,能主动帮助用户完成类似音乐播放、打车等服务,实际上背后的技术原理,就是通过使用 LAM 来访问对应服务的网站,通过模拟人类与网站的交互方式,完成用户指令中的工作内容。
Rabbit 发布的 LAM Playground,其实已经具备今天 Manus AI 的初步能力 | 图片来源:Rabbit
但彼时的 Rabbit Playground 受限于模型以及开发能力的限制,还并不能做到像人类一样,在互联网中畅通无阻。
在实际用户的测试中,面对类似人机验证这样的场景 Rabbit Playground 仍然难以通过,也无法使用第三方工具,来完成生成复杂表格、导出 PPT 这样的用户需求。
由于在实际使用中面临着诸多挑战,Rabbit R1 作为一款明星 AI 硬件,很快就退出主流用户的视野,AI 时代的热点变化的是如此之快,以至于到了 2025 年年初,在互联网上已经很难找到关于这款产品讨论的声音。
但 LAM 这个概念,作为一个可能改变人类用户与智能硬件设备交互的火种,留存了下来,仍然作为行业中一个重要的研究方向而存在。
Manus AI 的出现,尤其是它在自然语义理解,以及在互联网访问网站时,面对各种各样的人机识别,都能「畅行无阻」的能力,让不少仍然在致力于 LAM 产品开发、并希望在今年推出相关测试产品的人,再次看到了一个契机,并希望通过 Manus AI 目前的能力以及展现出的短板,来进一步完善自己的产品。
Manus AI 已经能在遇到各种人机验证时成功通过,大幅提升了对互联网的访问能力 | 图片来源:极客公园
目前,在致力于开发 LAM 产品、来提升用户对手机/电脑等产品使用体验的硬件厂商中,
系统级厂商在做 LAM 中,有着最明显的优势。
「Manus AI 这种命令执行方式,对于算力要求非常高,但如果是浏览器或智能手机操作系统来做这件事,能通过获得更多高质量数据的方式,大幅降低算力成本与提升运行速度」。
「做通用 LAM 并不用针对某些单一网站去适配,虽然在某些场景下可能」
「
Manus
AI
中的一些简单的场景,并不需要完全搬到(云端)上面去处理,反而是留在端侧效果会更好
」据这位面向桌面端开发 LAM 应用的开发者介绍,当前的端侧模型经过针对性训练之后,目前也能实现简单的通用网页访问并内容识别能力,已经能初步完成例如「访问旅游相关网站并制定旅游计划」这样的需求。
此外由于端侧有着更便捷的文件管理系统,同时也有更强大的本地文件管理工具,遇到类似「整理并分析简历」这样的需求,端侧 LAM 同样能做到更好的效果。
在我的实际测试中,我想要让 Manus AI 帮我生成一个 PPT 文件,它就能自动在电脑上安装对应的依赖环境,然后利用工具来自动完成 PPT 生成,虽然最终仍然完成了用户指令中的需求,但仍然因此大幅拉低了对请求的响应时间。
02
如何理解 Manus 的意义
当前,Manus AI 展示出的逻辑中,已经向外界展示了 LAM 在「生产力」领域能带来怎样的改变,但仍然有很多问题亟待解答。
其中最重要的,也是被问到最多的,或许就是商业化这件事:不少用户对于 Manus AI 这样的服务,最终会定价多少有着诸多的猜测。
除了类似 Manus AI 这样,完全交给云端运行,用户端只需要「输入命令 - 返回成果」的模式,前面提到的不少硬件厂商,实际上是将端侧/云端混合运行的模式作为主流方案。
这其实也暗示了,未来 LAM 的发展,或许将分为两个不同的主流方向;不仅有基于现有硬件算力,在端侧实现性能稍差的 LAM,也有完全基于云端的「数字代理」服务。
但这样的服务,距离最终投向市场可能还有不小的距离。「Manus AI 如果订阅的话,这样的服务 20 美元(订阅费)显然是完全不够的。」一位目前就职于手机厂商,研发 LAM 端侧应用的工程师对此评价道。
仅仅是全程虚拟机运行以及以及实时显示内容串流的高昂成本,就足以成为此类服务现阶段面向普通消费级市场的最大阻力。
对于以 ChatGPT 为代表的 LLM 产品来讲,过去几年已经迅速建立起一套行之有效的订阅系统,用户也在「每个月 20 美元」的周期往复中,建立起了一个准确的心理预期。
如果 LAM 未来想要以这种「前端硬件 + 后端云服务」的方式继续存在,同样也要经历这样一个过程,同时在这个过程中将订阅成本快速拉低,最终将这一商业模式跑通。
随着完全在云端部署的 LAM 进一步完善,我们大概率会再次看到像 Rabbit R1 这样、有着更灵活形态的 AI 硬件设备出现:它可以是智能手表、也可以是 AI 眼镜,甚至都可能是完全不需要屏幕的智能耳机等设备。
到这个阶段,LAM 实际上已经进化成了 Agent UI:用户并不再需要传统手机桌面、浏览器那样的用户交互界面,只需要一个供用户输入指令的方式,以及接受 LAM 最终交付成果的终端。
当初 Rabbit R1 的展示场景中,就已经出现了一些 Manus AI 的案例 | 图片来源:Rabbit
它或许不如 LLM 那样科幻,但它却是在现有硬件的基础上,短期内我们能看到最明显、最有能力给用户与硬件的交互,带来改变的方向。
随着 Manus AI 进一步将 LAM 以及 Agent AI 能做到什么,展现给更多普通用户,这或许就是 Manus AI 在这场浪潮最终退去之后,给我们留下的最重要的收获。
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
*头图来源:Monica.im
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
作者|张勇毅
编辑|
郑玄
在昨天拿到 Manus AI 的测试码、连续进行了数个小时的测试之后,有不少在手机/PC 厂商的工程师/产品经理朋友,来找我「打听」Manus AI 的真正能力如何。
为什么硬件行业这么关注 Manus?这与当下硬件行业最受关注的概念——LAM 有关。LAM 是一个从 LLM 延伸而来的名词,全名为大型行动模型 (Large Action Models),也称为大型智能体模型。
与 LLM 致力于「超越人类」,因此在训练方法上也经常突破人类经验完全不同,现阶段 LAM 想要做到的,是成为人类的手,去作为人类用户在数字世界中的代理人。
这与 Manus 的核心理念有相通之处。目前而言,Manus AI 的体验,围绕在一个运行在云端的 Ubuntu 操作系统虚拟机上,同时在操作系统中打开 Chrome 浏览器界面,在网页中或是调用其他软件,来完成各种用户的请求。
为了完成这个要求,Manus 需求同时具备「自然语义理解和计算机视觉」,以及「用户行为习惯学习与场景感知」,同时拥有「意图识别自主决策」的能力,当然最重要的,同时也是让 Manus AI 与此前的 Computer Use 在体验上拉开明显差距的,还是「跨应用调用工具」的能力。
举例来讲,对于常见的「能不能用 Manus AI 生成一段视频」这个问题,严格来讲回答是「可以」,但 Manus AI 去生成一段视频的方式,也是通过在网络上搜索第三方 AI 视频生成工具,并在这个过程中使用到各种工具,来完成用户的请求。
01
LAM 真正的未来
进入 2025 年,Agent AI,或者说 LAM 在端侧的落地,已经是再明显不过的趋势。但怎么落地,以及最终呈现给用户的会是怎样的商业产品,仍然有很多问题。
早在 2024 年初,彼时发布的 Rabbit R1 硬件,以及对应的 LAM 工具——Rabbit LAM Playground 其实已经展现出了今天我们在 Manus AI 中看到的能力雏形。
在官方的演示中,Rabbit R1 所搭载的 LAM Playground,能主动帮助用户完成类似音乐播放、打车等服务,实际上背后的技术原理,就是通过使用 LAM 来访问对应服务的网站,通过模拟人类与网站的交互方式,完成用户指令中的工作内容。
Rabbit 发布的 LAM Playground,其实已经具备今天 Manus AI 的初步能力 | 图片来源:Rabbit
但彼时的 Rabbit Playground 受限于模型以及开发能力的限制,还并不能做到像人类一样,在互联网中畅通无阻。
在实际用户的测试中,面对类似人机验证这样的场景 Rabbit Playground 仍然难以通过,也无法使用第三方工具,来完成生成复杂表格、导出 PPT 这样的用户需求。
由于在实际使用中面临着诸多挑战,Rabbit R1 作为一款明星 AI 硬件,很快就退出主流用户的视野,AI 时代的热点变化的是如此之快,以至于到了 2025 年年初,在互联网上已经很难找到关于这款产品讨论的声音。
但 LAM 这个概念,作为一个可能改变人类用户与智能硬件设备交互的火种,留存了下来,仍然作为行业中一个重要的研究方向而存在。
Manus AI 的出现,尤其是它在自然语义理解,以及在互联网访问网站时,面对各种各样的人机识别,都能「畅行无阻」的能力,让不少仍然在致力于 LAM 产品开发、并希望在今年推出相关测试产品的人,再次看到了一个契机,并希望通过 Manus AI 目前的能力以及展现出的短板,来进一步完善自己的产品。
Manus AI 已经能在遇到各种人机验证时成功通过,大幅提升了对互联网的访问能力 | 图片来源:极客公园
目前,在致力于开发 LAM 产品、来提升用户对手机/电脑等产品使用体验的硬件厂商中,
系统级厂商在做 LAM 中,有着最明显的优势。
「Manus AI 这种命令执行方式,对于算力要求非常高,但如果是浏览器或智能手机操作系统来做这件事,能通过获得更多高质量数据的方式,大幅降低算力成本与提升运行速度」。
「做通用 LAM 并不用针对某些单一网站去适配,虽然在某些场景下可能」
「
Manus
AI
中的一些简单的场景,并不需要完全搬到(云端)上面去处理,反而是留在端侧效果会更好
」据这位面向桌面端开发 LAM 应用的开发者介绍,当前的端侧模型经过针对性训练之后,目前也能实现简单的通用网页访问并内容识别能力,已经能初步完成例如「访问旅游相关网站并制定旅游计划」这样的需求。
此外由于端侧有着更便捷的文件管理系统,同时也有更强大的本地文件管理工具,遇到类似「整理并分析简历」这样的需求,端侧 LAM 同样能做到更好的效果。
在我的实际测试中,我想要让 Manus AI 帮我生成一个 PPT 文件,它就能自动在电脑上安装对应的依赖环境,然后利用工具来自动完成 PPT 生成,虽然最终仍然完成了用户指令中的需求,但仍然因此大幅拉低了对请求的响应时间。
02
如何理解 Manus 的意义
当前,Manus AI 展示出的逻辑中,已经向外界展示了 LAM 在「生产力」领域能带来怎样的改变,但仍然有很多问题亟待解答。
其中最重要的,也是被问到最多的,或许就是商业化这件事:不少用户对于 Manus AI 这样的服务,最终会定价多少有着诸多的猜测。
除了类似 Manus AI 这样,完全交给云端运行,用户端只需要「输入命令 - 返回成果」的模式,前面提到的不少硬件厂商,实际上是将端侧/云端混合运行的模式作为主流方案。
这其实也暗示了,未来 LAM 的发展,或许将分为两个不同的主流方向;不仅有基于现有硬件算力,在端侧实现性能稍差的 LAM,也有完全基于云端的「数字代理」服务。
但这样的服务,距离最终投向市场可能还有不小的距离。「Manus AI 如果订阅的话,这样的服务 20 美元(订阅费)显然是完全不够的。」一位目前就职于手机厂商,研发 LAM 端侧应用的工程师对此评价道。
仅仅是全程虚拟机运行以及以及实时显示内容串流的高昂成本,就足以成为此类服务现阶段面向普通消费级市场的最大阻力。
对于以 ChatGPT 为代表的 LLM 产品来讲,过去几年已经迅速建立起一套行之有效的订阅系统,用户也在「每个月 20 美元」的周期往复中,建立起了一个准确的心理预期。
如果 LAM 未来想要以这种「前端硬件 + 后端云服务」的方式继续存在,同样也要经历这样一个过程,同时在这个过程中将订阅成本快速拉低,最终将这一商业模式跑通。
随着完全在云端部署的 LAM 进一步完善,我们大概率会再次看到像 Rabbit R1 这样、有着更灵活形态的 AI 硬件设备出现:它可以是智能手表、也可以是 AI 眼镜,甚至都可能是完全不需要屏幕的智能耳机等设备。
到这个阶段,LAM 实际上已经进化成了 Agent UI:用户并不再需要传统手机桌面、浏览器那样的用户交互界面,只需要一个供用户输入指令的方式,以及接受 LAM 最终交付成果的终端。
当初 Rabbit R1 的展示场景中,就已经出现了一些 Manus AI 的案例 | 图片来源:Rabbit
它或许不如 LLM 那样科幻,但它却是在现有硬件的基础上,短期内我们能看到最明显、最有能力给用户与硬件的交互,带来改变的方向。
随着 Manus AI 进一步将 LAM 以及 Agent AI 能做到什么,展现给更多普通用户,这或许就是 Manus AI 在这场浪潮最终退去之后,给我们留下的最重要的收获。
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
*头图来源:Monica.im
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
展开
打开“财经头条”阅读更多精彩资讯
相关新闻
狂热过后,我和几位硬件工程师聊了聊 Manus 的价值和意义
极客公园
2天前
听说一二线城市房价都在涨,我和中介聊了聊
真叫卢俊
1周前
随便聊聊云和AI端侧场景
韭菜大神
3周前
周末大事冲哪个?小米机器人、华为AI医疗、GKJ、AI智能体?
格隆
9小时前
DeepSeek,突传大消息
券商中国
1天前
人形机器人,突传两大重磅!
券商中国
2天前
这个80后湖南老板:一年给员工分8亿,把充电宝卖到特朗普手里
正和岛
16小时前
“科技板”要来了!科创债发行提速
证券时报
2天前
上半年新增装机22万套,德国阳台光伏前景详解
财经头条
13小时前
APP内打开