重大突破！国产AI可像人一样用手机了

财经头条

提升一亿中产阶级阅读效率

打开

重大突破！国产AI可像人一样用手机了

财经早餐

龙龙

3周前

最近，AI领域又有新产品出圈了，智谱AI推出自主智能体AutoGLM，持续火爆。

二级市场上，相关个股也是连续大涨，电广传媒已经连续4个一字板，豆神教育已经连续3个20CM涨停。

智谱AutoGLM出圈

国产AI Agent表现惊艳

10月25日，智谱AI推出自主智能体AutoGLM，只需接收文字/语音指令，就可以模拟人类操作手机，开启人机交互全新模式和应用新蓝海。

具体来说，当你向AutoGLM发出指令后，它能够代替你在手机和网页上完成各种操作，比如写点评、电商下单、写摘要、点外卖、发微信等。

例如，你可以要求AutoGLM向指定微信好友的朋友圈点赞、评论，比如输入“给老板的最新一条朋友圈点赞”，它自己就可以执行如下步骤：打开微信→搜索人→进入对话框→点击头像→点开朋友圈→找到一条内容→点赞→评论。

你也可以让AutoGLM在大众点评给出指定店家的好评，并自动编辑评论，比如输入“打开大众点评，帮我给xxx店写一个五星好评”，在执行“发送评论”这一超出指令的操作时，AutoGLM会主动提示是否进行。

你也可以让它查找淘宝某一时段的历史订单，复购指定商品，比如输入“打开淘宝，帮我下单我的订单里最近一个月买过的餐巾纸”。

此外，AutoGLM还能批量总结微信公众号多篇文章，并生成文章摘要，比如输入“帮我总结一下xxx公众号最新2篇文章的内容”。

……

根据智谱宣传Demo中已经有的功能看，目前智谱AutoGLM可适配微信、淘宝、美团、小红书等8款知名应用软件，覆盖日常生活常用的线上聊天、网购、地图、酒店火车订票、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文等功能。

目前，用户可以通过安装“智谱清言”插件体验AutoGLM，AutoGLM也在安卓系统上开放了内测申请。

据智谱公众号介绍，AutoGLM基于自进化在线课程强化学习框架WEBRL，具备自适应学习策略，能在迭代中不断改进，具备一定自我纠错能力，成为个人“超级助理”的雏形。

AI Agent进入全新阶段

事实上，除了国内智谱AutoGLM外，最近海外AI Agent方面也有大动作。

10月23日，Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。

Sonnet能力不仅全面超过GPT-4o，更带来全新AI体验：计算机使用，可以像人类一样操作电脑。

与过去AI Agent直接通过代码/程序，后台联网搜索/操作应用不同的是，这一次Claude真正像人类一样去使用电脑：先看屏幕，再使用鼠标操作，再通过思考，重复以上步骤直到完成目的。在这个过程中，可以很明显的看到，Claude每一次截图查看屏幕，移动光标/点选，并给出思考的全过程。

比如，根据Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。

开始时，Alex给Claude指示：

1）去美国政府数据网，下载一个最近有趣的数据。

2）安装sklearn（一个机器学习工具包）和bash相关工具（执行程序的工具包）。

3）写一个python文件，把数据分为训练集和验证集，然后创建一个分类器并训练。同时还给出提示，需要Claude检查数据，以免出现模型不收敛的情况。

4）最后使用浏览器可视化的展示分类的结果。

随之，Claude开始操作电脑：

1）使用工具：截图，以查看当前的电脑桌面并找到浏览器（每一次查看都需要使用这个工具）。

2）使用工具：鼠标移动&使用工具：左键单击打开浏览器。

3）使用工具：键盘输入网址。

接下来就重复以上三步，查看页面，并移动鼠标点选，并输入想要的数据。

4）下载完成后，Claude自动打开数据进行分析，其中遇到了几步bug，包括路径错误、数据类型错误等，Claude都通过几次尝试解决了。

5）通过编写的python代码，完成了分类器的训练并展示结果。

中信建投指出，Claude新模型像人一样操作电脑，智谱AutoGLM自动操作手机App，AI Agent已进入全新阶段。同时，令人欣喜的是，在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代，以智谱为代表的国产AI公司完成了从追赶者，到领路人的身份转换。

德邦证券认为，2025年或进入全终端Agent爆发元年，Agent network有望初具规模，终端有望率先放量、其次是全行业落地应用，AI应用商业模式闭环或将形成。

值得一提的是，根据智谱对AI的分级，一级LLM主要具有语言能力，开启了chatbot、AI搜索等应用涌现；二级AI具有人类水准的问题求解能力，比如openAI的o1模型，可以求解复杂的逻辑推理问题；三级AI可以使用工具，系统可以执行动作，完成多数人类物理世界问题。山西证券认为，目前的AI Agent已初步具备三级AI能力。

手机侧AI Agent

或将迎来百花齐放

值得注意的是，目前AutoGLM的实现方式是通过读取用户在手机上的UI界面，直接模拟用户点击进行操作，要求用户给予APP“无障碍”级别的高敏感操作权限实现对手机界面的接管，目前仅适用于安卓这一开放度更高的操作系统。

申万宏源认为，从最终实现来看，AutoGLM并未在底层操作系统上直接对于应用进行调用，而是绕过操作系统环节，直接从用户UI界面进行模拟用户使用来完成，最终与从底层操作系统开始打通应用的路径有所不同，未来仍有迭代进步空间。

其指出，未来的手机侧AI Agent或将迎来百花齐放，各类厂商具备各自竞争优势，主要竞争者包括：

1）自身拥有手机硬件以及操作系统的厂商，例如苹果、华为、小米等，拥有出色的禀赋，但大模型能力有不足；

2）拥有操作系统/APP应用生态的互联网巨头，包括谷歌/META/腾讯等，拥有应用矩阵/操作系统等，且代表厂商谷歌、META等具备较强大模型能力，拥有开发AIAgent的潜力；

3）AI大模型厂商，包括智谱、OpenAI、Anthropic等，拥有较强的AI大模型能力，但难度在于实现各个APP之间的打通。

“AI+”产业浪潮持续

有望复刻“互联网+”的爆发

复盘今年以来的AI行业进展：

通用模型端，当前通用大模型底座加速更新，能力与性价比提升，能够以更低的成本处理更复杂、多样化的任务，满足用户需求，OpenAI于9月发布o1模型，推理能力大幅加强。

多模态端，国产文生视频大模型表现优秀，豆包视频生成模型多镜头能力凸显。

应用端，智谱AutoGLM为代表的AIAgent取得重大突破，为用户深入实现便利的执行与操作，AI应用的用户数量有望迎来快速崛起。

硬件端，即将搭载AppleIntelligence的iPhone 16、具备全新AI功能的Meta AR眼镜、豆包AI耳机上线，将AI大模型能力融入原生应用体系，有望提升AI应用的渗透率。

兴业证券认为，类比移动互联网发展历程，AI应用正在迎来“iPhone”时刻，通用模型、多模态、硬件端的进步正促进AI与更多场景的紧密结合，将促进更多“AI+”应用的出现，有望复刻“互联网+”的爆发。

免责声明（上下滑动查看全部）

任何在本文出现的信息（包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等）均只作为参考，投资人须对任何自主决定的投资行为负责。另，本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议，亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险，过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正，但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。