重大突破!国产AI可像人一样用手机了

财经早餐

龙龙

3周前

最近,AI领域又有新产品出圈了,智谱AI推出自主智能体AutoGLM,持续火爆。
二级市场上,相关个股也是连续大涨,电广传媒已经连续4个一字板,豆神教育已经连续3个20CM涨停。

智谱AutoGLM出圈

国产AI Agent表现惊艳
10月25日,智谱AI推出自主智能体AutoGLM,只需接收文字/语音指令,就可以模拟人类操作手机开启人机交互全新模式和应用新蓝海。
具体来说,当你向AutoGLM发出指令后,它能够代替你在手机和网页上完成各种操作,比如写点评、电商下单、写摘要、点外卖、发微信等。
例如,你可以要求AutoGLM向指定微信好友的朋友圈点赞、评论,比如输入“给老板的最新一条朋友圈点赞”,它自己就可以执行如下步骤:打开微信→搜索人→进入对话框→点击头像→点开朋友圈→找到一条内容→点赞→评论。
你也可以让AutoGLM在大众点评给出指定店家的好评,并自动编辑评论,比如输入“打开大众点评,帮我给xxx店写一个五星好评”,在执行“发送评论”这一超出指令的操作时,AutoGLM会主动提示是否进行。
你也可以让它查找淘宝某一时段的历史订单,复购指定商品,比如输入“打开淘宝,帮我下单我的订单里最近一个月买过的餐巾纸”。
此外,AutoGLM还能批量总结微信公众号多篇文章,并生成文章摘要,比如输入“帮我总结一下xxx公众号最新2篇文章的内容”。
……
根据智谱宣传Demo中已经有的功能看,目前智谱AutoGLM可适配微信、淘宝、美团、小红书等8款知名应用软件,覆盖日常生活常用的线上聊天、网购、地图、酒店火车订票、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文等功能。
目前,用户可以通过安装“智谱清言”插件体验AutoGLM,AutoGLM也在安卓系统上开放了内测申请。
据智谱公众号介绍,AutoGLM基于自进化在线课程强化学习框架WEBRL,具备自适应学习策略,能在迭代中不断改进,具备一定自我纠错能力,成为个人“超级助理”的雏形。
AI Agent进入全新阶段
事实上,除了国内智谱AutoGLM外,最近海外AI Agent方面也有大动作。
10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。
Sonnet能力不仅全面超过GPT-4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑。
与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,可以很明显的看到,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。
比如,根据Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。
开始时,Alex给Claude指示:
1)去美国政府数据网,下载一个最近有趣的数据。
2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。
3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。
4)最后使用浏览器可视化的展示分类的结果。
随之,Claude开始操作电脑:
1)使用工具:截图,以查看当前的电脑桌面并找到浏览器(每一次查看都需要使用这个工具)。
2)使用工具:鼠标移动&使用工具:左键单击打开浏览器。
3)使用工具:键盘输入网址。
接下来就重复以上三步,查看页面,并移动鼠标点选,并输入想要的数据。
4)下载完成后,Claude自动打开数据进行分析,其中遇到了几步bug,包括路径错误、数据类型错误等,Claude都通过几次尝试解决了。
5)通过编写的python代码,完成了分类器的训练并展示结果。
中信建投指出,Claude新模型像人一样操作电脑,智谱AutoGLM自动操作手机App,AI Agent已进入全新阶段。同时,令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到领路人的身份转换。
德邦证券认为,2025年或进入全终端Agent爆发元年,Agent network有望初具规模,终端有望率先放量、其次是全行业落地应用,AI应用商业模式闭环或将形成。
值得一提的是,根据智谱对AI的分级,一级LLM主要具有语言能力,开启了chatbot、AI搜索等应用涌现;二级AI具有人类水准的问题求解能力,比如openAI的o1模型,可以求解复杂的逻辑推理问题;三级AI可以使用工具,系统可以执行动作,完成多数人类物理世界问题。山西证券认为,目前的AI Agent已初步具备三级AI能力。

手机侧AI Agent

或将迎来百花齐放
值得注意的是,目前AutoGLM的实现方式是通过读取用户在手机上的UI界面,直接模拟用户点击进行操作,要求用户给予APP“无障碍”级别的高敏感操作权限实现对手机界面的接管,目前仅适用于安卓这一开放度更高的操作系统。
申万宏源认为,从最终实现来看,AutoGLM并未在底层操作系统上直接对于应用进行调用,而是绕过操作系统环节,直接从用户UI界面进行模拟用户使用来完成,最终与从底层操作系统开始打通应用的路径有所不同,未来仍有迭代进步空间。
其指出,未来的手机侧AI Agent或将迎来百花齐放,各类厂商具备各自竞争优势,主要竞争者包括:
1)自身拥有手机硬件以及操作系统的厂商,例如苹果、华为、小米等,拥有出色的禀赋,但大模型能力有不足;
2)拥有操作系统/APP应用生态的互联网巨头,包括谷歌/META/腾讯等,拥有应用矩阵/操作系统等,且代表厂商谷歌、META等具备较强大模型能力,拥有开发AIAgent的潜力;
3)AI大模型厂商,包括智谱、OpenAI、Anthropic等,拥有较强的AI大模型能力,但难度在于实现各个APP之间的打通。

“AI+”产业浪潮持续

有望复刻“互联网+”的爆发
复盘今年以来的AI行业进展:
通用模型端,当前通用大模型底座加速更新,能力与性价比提升,能够以更低的成本处理更复杂、多样化的任务,满足用户需求,OpenAI于9月发布o1模型,推理能力大幅加强。
多模态端,国产文生视频大模型表现优秀,豆包视频生成模型多镜头能力凸显。
应用端,智谱AutoGLM为代表的AIAgent取得重大突破,为用户深入实现便利的执行与操作,AI应用的用户数量有望迎来快速崛起。
硬件端,即将搭载AppleIntelligence的iPhone 16、具备全新AI功能的Meta AR眼镜、豆包AI耳机上线,将AI大模型能力融入原生应用体系,有望提升AI应用的渗透率。
兴业证券认为,类比移动互联网发展历程,AI应用正在迎来“iPhone”时刻,通用模型、多模态、硬件端的进步正促进AI与更多场景的紧密结合,将促进更多“AI+”应用的出现,有望复刻“互联网+”的爆发。

免责声明(上下滑动查看全部)

任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。


最近,AI领域又有新产品出圈了,智谱AI推出自主智能体AutoGLM,持续火爆。
二级市场上,相关个股也是连续大涨,电广传媒已经连续4个一字板,豆神教育已经连续3个20CM涨停。

智谱AutoGLM出圈

国产AI Agent表现惊艳
10月25日,智谱AI推出自主智能体AutoGLM,只需接收文字/语音指令,就可以模拟人类操作手机开启人机交互全新模式和应用新蓝海。
具体来说,当你向AutoGLM发出指令后,它能够代替你在手机和网页上完成各种操作,比如写点评、电商下单、写摘要、点外卖、发微信等。
例如,你可以要求AutoGLM向指定微信好友的朋友圈点赞、评论,比如输入“给老板的最新一条朋友圈点赞”,它自己就可以执行如下步骤:打开微信→搜索人→进入对话框→点击头像→点开朋友圈→找到一条内容→点赞→评论。
你也可以让AutoGLM在大众点评给出指定店家的好评,并自动编辑评论,比如输入“打开大众点评,帮我给xxx店写一个五星好评”,在执行“发送评论”这一超出指令的操作时,AutoGLM会主动提示是否进行。
你也可以让它查找淘宝某一时段的历史订单,复购指定商品,比如输入“打开淘宝,帮我下单我的订单里最近一个月买过的餐巾纸”。
此外,AutoGLM还能批量总结微信公众号多篇文章,并生成文章摘要,比如输入“帮我总结一下xxx公众号最新2篇文章的内容”。
……
根据智谱宣传Demo中已经有的功能看,目前智谱AutoGLM可适配微信、淘宝、美团、小红书等8款知名应用软件,覆盖日常生活常用的线上聊天、网购、地图、酒店火车订票、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文等功能。
目前,用户可以通过安装“智谱清言”插件体验AutoGLM,AutoGLM也在安卓系统上开放了内测申请。
据智谱公众号介绍,AutoGLM基于自进化在线课程强化学习框架WEBRL,具备自适应学习策略,能在迭代中不断改进,具备一定自我纠错能力,成为个人“超级助理”的雏形。
AI Agent进入全新阶段
事实上,除了国内智谱AutoGLM外,最近海外AI Agent方面也有大动作。
10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。
Sonnet能力不仅全面超过GPT-4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑。
与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,可以很明显的看到,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。
比如,根据Anthropic的开发者关系负责人Alex Albert展示的一个演示的demo。
开始时,Alex给Claude指示:
1)去美国政府数据网,下载一个最近有趣的数据。
2)安装sklearn(一个机器学习工具包)和bash相关工具(执行程序的工具包)。
3)写一个python文件,把数据分为训练集和验证集,然后创建一个分类器并训练。同时还给出提示,需要Claude检查数据,以免出现模型不收敛的情况。
4)最后使用浏览器可视化的展示分类的结果。
随之,Claude开始操作电脑:
1)使用工具:截图,以查看当前的电脑桌面并找到浏览器(每一次查看都需要使用这个工具)。
2)使用工具:鼠标移动&使用工具:左键单击打开浏览器。
3)使用工具:键盘输入网址。
接下来就重复以上三步,查看页面,并移动鼠标点选,并输入想要的数据。
4)下载完成后,Claude自动打开数据进行分析,其中遇到了几步bug,包括路径错误、数据类型错误等,Claude都通过几次尝试解决了。
5)通过编写的python代码,完成了分类器的训练并展示结果。
中信建投指出,Claude新模型像人一样操作电脑,智谱AutoGLM自动操作手机App,AI Agent已进入全新阶段。同时,令人欣喜的是,在从以聊天为主的大模型1.0时代迈入个人智能助理的大模型2.0时代,以智谱为代表的国产AI公司完成了从追赶者,到领路人的身份转换。
德邦证券认为,2025年或进入全终端Agent爆发元年,Agent network有望初具规模,终端有望率先放量、其次是全行业落地应用,AI应用商业模式闭环或将形成。
值得一提的是,根据智谱对AI的分级,一级LLM主要具有语言能力,开启了chatbot、AI搜索等应用涌现;二级AI具有人类水准的问题求解能力,比如openAI的o1模型,可以求解复杂的逻辑推理问题;三级AI可以使用工具,系统可以执行动作,完成多数人类物理世界问题。山西证券认为,目前的AI Agent已初步具备三级AI能力。

手机侧AI Agent

或将迎来百花齐放
值得注意的是,目前AutoGLM的实现方式是通过读取用户在手机上的UI界面,直接模拟用户点击进行操作,要求用户给予APP“无障碍”级别的高敏感操作权限实现对手机界面的接管,目前仅适用于安卓这一开放度更高的操作系统。
申万宏源认为,从最终实现来看,AutoGLM并未在底层操作系统上直接对于应用进行调用,而是绕过操作系统环节,直接从用户UI界面进行模拟用户使用来完成,最终与从底层操作系统开始打通应用的路径有所不同,未来仍有迭代进步空间。
其指出,未来的手机侧AI Agent或将迎来百花齐放,各类厂商具备各自竞争优势,主要竞争者包括:
1)自身拥有手机硬件以及操作系统的厂商,例如苹果、华为、小米等,拥有出色的禀赋,但大模型能力有不足;
2)拥有操作系统/APP应用生态的互联网巨头,包括谷歌/META/腾讯等,拥有应用矩阵/操作系统等,且代表厂商谷歌、META等具备较强大模型能力,拥有开发AIAgent的潜力;
3)AI大模型厂商,包括智谱、OpenAI、Anthropic等,拥有较强的AI大模型能力,但难度在于实现各个APP之间的打通。

“AI+”产业浪潮持续

有望复刻“互联网+”的爆发
复盘今年以来的AI行业进展:
通用模型端,当前通用大模型底座加速更新,能力与性价比提升,能够以更低的成本处理更复杂、多样化的任务,满足用户需求,OpenAI于9月发布o1模型,推理能力大幅加强。
多模态端,国产文生视频大模型表现优秀,豆包视频生成模型多镜头能力凸显。
应用端,智谱AutoGLM为代表的AIAgent取得重大突破,为用户深入实现便利的执行与操作,AI应用的用户数量有望迎来快速崛起。
硬件端,即将搭载AppleIntelligence的iPhone 16、具备全新AI功能的Meta AR眼镜、豆包AI耳机上线,将AI大模型能力融入原生应用体系,有望提升AI应用的渗透率。
兴业证券认为,类比移动互联网发展历程,AI应用正在迎来“iPhone”时刻,通用模型、多模态、硬件端的进步正促进AI与更多场景的紧密结合,将促进更多“AI+”应用的出现,有望复刻“互联网+”的爆发。

免责声明(上下滑动查看全部)

任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。


展开
打开“财经头条”阅读更多精彩资讯
最新评论

参与讨论

APP内打开