在对标OpenAI之路上,智谱AI又近了一步。
文|田哲
编辑|苏建勋
来源|智能涌现(ID:AIEmergence)
10月25日,智谱AI推出自主智能体AutoGLM,简单来说,它是一个能代替你在手机和网页上完成各种操作的AI助手。只需要说出你的需求,一句话手机自动帮你点外卖、发微信、写点评、给朋友圈评论。
与OpenAI的AI Agent相似,智谱清言AutoGLM模型,也无需用户手动操作示范,不受制于简单的任务场景或API调用,即可替代人类在电子设备执行操作。
具体而言,当你向AutoGLM发出指令后,双方之间的对话将以语音形式展现,并实时显示字幕。
例如,你可以要求AutoGLM在大众点评给出指定的店家好评,并自动编辑评论。在执行“发送评论”这一超出指令的操作时,AutoGLM会主动提示是否进行。
据悉,为了保护用户隐私,AutoGLM不会主动获取用户的个人隐私信息,如果需要执行授权范围之外的任务,AutoGLM会主动提示以获取用户同意。
即使用户向AutoGLM授权,也不意味着AutoGLM永久拥有相关权限。每次后台启动AutoGLM,都会重新向用户申请无障碍权限。
两个月前,智谱清言首次秀了一把视频通话技术,虽然当时语音通话功能能听懂对话、回复还算准确,但语气像是机器人“背稿子”,没啥感情。要是让它来点情感表达,它还会一本正经地告诉你:“作为一个人工智能,无法表达感情”。
不过,现在升级后的情感语音模型,感觉就不一样了。语音听起来更有“人味儿”,还能加点感情,像真人一样跟你聊。
它已经学会了用撒娇、调侃、愤怒、歇斯底里等语气表达。比如,拟人语音能模仿孩子,用撒娇语气向姐姐要糖葫芦。
玩角色扮演游戏也不成问题,可以把它设定为“哈利波特”中的反派伏地魔与你战斗,并能要求它以指定的语气进行扮演。比如它能以电视剧中常见的反派语气说话。
如果挑战绕口令加速,它可能就会“翻车”了,发音有点“飘”。
据了解,GLM-4-Voice结合了自然语言生成(NLG)和语音合成技术,相比传统的TTS技术(Text-to-Speech),拟人语音能够理解上下文语境,实现富有情感的自然对话。
此外,GLM-4-Voice以音频token的形式直接建模语音,在一个模型里面同时完成语音的理解和生成,信息损失和误差积累相比传统级联方案更少,理论上有着更高的建模上限。
据智谱公众号,智谱发布从文本、图像、视频到情感语音模型等多模态,并让AI学会使用各种工具,原因在于其打造了新的基座模型——GLM-4-Plus。在语言文本能力方面,GLM-4-Plus和GPT-4o、405B参数量的Llama3.1 相当。
“现在的小模型还处于找市场的阶段,需要将市场与技术磨合,提升效率的同时找到新的应用场景。”
两个月前,智谱AI CEO张鹏与“智能涌现”的访谈中,提到了这一观点。与手机厂商合作AI智能体,或许就是张鹏所说的新场景。
找到场景,是模型厂商的当务之急,这意味着模型厂商不仅能获得稳定的收入来源,完成自我造血,同时也能在场景中持续收集数据,进行产品迭代。
而AI智能体是大模型应用的主要形式之一,其具备自主感知、决策并采取行动,被认为将是电脑、智能手机下一代产品形态的AI手机、AI PC,就搭载了AI智能体。据咨询机构IDC预计,2027年,中国市场AI手机和AI PC的市占率将分别超过50%、80%。
智谱正在加紧推动大模型落地AI手机。本月22日,智谱与高通达成合作,为骁龙8至尊版适配优化GLM-4V端侧视觉大模型,提供多模态交互方式;智谱与三星官宣战略合作,双方将打造AI产品。
而AutoGLM,它显然是一个非常适合手机应用的杀手级功能。据知情人士透露,智谱正在和多家手机厂商展开合作,除了上面提到的三星外,9月智谱和荣耀成立了AI大模型技术联合实验室。
荣耀也有意进一步提升AI智能体的表现。在23日的荣耀MagicOS9.0发布会媒体采访中,荣耀终端有限公司CEO赵明表示,荣耀正在通过AI重构操作系统,打造核心底层能力,以实现更加智慧化的服务。
AI手机风头正盛,多家手机厂商如苹果、荣耀、vivo、OPPO等争相推出具备AI功能的手机,AI功能如AI消除、AI通话摘要等。
然而,搭载AI智能体的手机目前数量较少,其中原因,既包括行业技术发展仍不成熟,另一反面相关标准长期缺失。
不过,这一情况正在逐步改善。
市场层面,OpenAI、智谱等模型厂商已传出与手机公司合作消息,将推动模型厂商、应用软件提供者与手机厂商之间的合作。
终端智能化分级定义
多款大模型已与智能手机生态公司合作,或许AI手机,将打开智谱商业化想象的新空间。
36氪旗下AI公众号
真诚推荐你关注
在对标OpenAI之路上,智谱AI又近了一步。
文|田哲
编辑|苏建勋
来源|智能涌现(ID:AIEmergence)
10月25日,智谱AI推出自主智能体AutoGLM,简单来说,它是一个能代替你在手机和网页上完成各种操作的AI助手。只需要说出你的需求,一句话手机自动帮你点外卖、发微信、写点评、给朋友圈评论。
与OpenAI的AI Agent相似,智谱清言AutoGLM模型,也无需用户手动操作示范,不受制于简单的任务场景或API调用,即可替代人类在电子设备执行操作。
具体而言,当你向AutoGLM发出指令后,双方之间的对话将以语音形式展现,并实时显示字幕。
例如,你可以要求AutoGLM在大众点评给出指定的店家好评,并自动编辑评论。在执行“发送评论”这一超出指令的操作时,AutoGLM会主动提示是否进行。
据悉,为了保护用户隐私,AutoGLM不会主动获取用户的个人隐私信息,如果需要执行授权范围之外的任务,AutoGLM会主动提示以获取用户同意。
即使用户向AutoGLM授权,也不意味着AutoGLM永久拥有相关权限。每次后台启动AutoGLM,都会重新向用户申请无障碍权限。
两个月前,智谱清言首次秀了一把视频通话技术,虽然当时语音通话功能能听懂对话、回复还算准确,但语气像是机器人“背稿子”,没啥感情。要是让它来点情感表达,它还会一本正经地告诉你:“作为一个人工智能,无法表达感情”。
不过,现在升级后的情感语音模型,感觉就不一样了。语音听起来更有“人味儿”,还能加点感情,像真人一样跟你聊。
它已经学会了用撒娇、调侃、愤怒、歇斯底里等语气表达。比如,拟人语音能模仿孩子,用撒娇语气向姐姐要糖葫芦。
玩角色扮演游戏也不成问题,可以把它设定为“哈利波特”中的反派伏地魔与你战斗,并能要求它以指定的语气进行扮演。比如它能以电视剧中常见的反派语气说话。
如果挑战绕口令加速,它可能就会“翻车”了,发音有点“飘”。
据了解,GLM-4-Voice结合了自然语言生成(NLG)和语音合成技术,相比传统的TTS技术(Text-to-Speech),拟人语音能够理解上下文语境,实现富有情感的自然对话。
此外,GLM-4-Voice以音频token的形式直接建模语音,在一个模型里面同时完成语音的理解和生成,信息损失和误差积累相比传统级联方案更少,理论上有着更高的建模上限。
据智谱公众号,智谱发布从文本、图像、视频到情感语音模型等多模态,并让AI学会使用各种工具,原因在于其打造了新的基座模型——GLM-4-Plus。在语言文本能力方面,GLM-4-Plus和GPT-4o、405B参数量的Llama3.1 相当。
“现在的小模型还处于找市场的阶段,需要将市场与技术磨合,提升效率的同时找到新的应用场景。”
两个月前,智谱AI CEO张鹏与“智能涌现”的访谈中,提到了这一观点。与手机厂商合作AI智能体,或许就是张鹏所说的新场景。
找到场景,是模型厂商的当务之急,这意味着模型厂商不仅能获得稳定的收入来源,完成自我造血,同时也能在场景中持续收集数据,进行产品迭代。
而AI智能体是大模型应用的主要形式之一,其具备自主感知、决策并采取行动,被认为将是电脑、智能手机下一代产品形态的AI手机、AI PC,就搭载了AI智能体。据咨询机构IDC预计,2027年,中国市场AI手机和AI PC的市占率将分别超过50%、80%。
智谱正在加紧推动大模型落地AI手机。本月22日,智谱与高通达成合作,为骁龙8至尊版适配优化GLM-4V端侧视觉大模型,提供多模态交互方式;智谱与三星官宣战略合作,双方将打造AI产品。
而AutoGLM,它显然是一个非常适合手机应用的杀手级功能。据知情人士透露,智谱正在和多家手机厂商展开合作,除了上面提到的三星外,9月智谱和荣耀成立了AI大模型技术联合实验室。
荣耀也有意进一步提升AI智能体的表现。在23日的荣耀MagicOS9.0发布会媒体采访中,荣耀终端有限公司CEO赵明表示,荣耀正在通过AI重构操作系统,打造核心底层能力,以实现更加智慧化的服务。
AI手机风头正盛,多家手机厂商如苹果、荣耀、vivo、OPPO等争相推出具备AI功能的手机,AI功能如AI消除、AI通话摘要等。
然而,搭载AI智能体的手机目前数量较少,其中原因,既包括行业技术发展仍不成熟,另一反面相关标准长期缺失。
不过,这一情况正在逐步改善。
市场层面,OpenAI、智谱等模型厂商已传出与手机公司合作消息,将推动模型厂商、应用软件提供者与手机厂商之间的合作。
终端智能化分级定义
多款大模型已与智能手机生态公司合作,或许AI手机,将打开智谱商业化想象的新空间。
36氪旗下AI公众号
真诚推荐你关注