市场消息称,苹果公司正与阿里巴巴合作,开发和推出面向中国苹果用户的人工智能,并已将共同开发的AI功能向监管机构提交审批。2月12日,阿里巴巴港股强势上涨超8%,13号收盘再涨2.55%。如果考虑到本轮由AI驱动的阿里股价涨势的话,从今年1月中旬的股价低点开始,阿里香港股票市值已经上涨超过800亿美元,风头正盛……
马云的现身伴随着阿里在人工智能领域的一波亮眼操作,无法不令人浮想联翩。
北京时间1月29日凌晨1点半,阿里突然发力,发布了升级后的阿里云通义千问旗舰版模型Qwen2.5-Max。
据阿里的介绍,Qwen2.5-Max模型是基于对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。
与Qwen2.5-Max进行对比的模型,就包括了最近火爆海内外的深度求索(DeepSeek)旗下的V3模型,最大的开源稠密模型Llama-3.1-405B,以及阿里自产的位列开源稠密模型前列的Qwen2.5-72B。
微妙之处在于这个时间点不同寻常。此前没几天,深度求索的DeepSeek R1模型刚刚在全世界范围内掀起巨浪,由其革命性的以较低成本产生较高性能大语言模型的创新,使得以英伟达为首的AI算力供应商股价大跌,发布后的首个交易日就让华尔街跌去1万亿美元的市值。美国权威媒体和专家惊呼:“这是中美人工智能霸权争夺战的‘斯普特尼克时刻’。”
用篮球术语讲,这是阿里在点名深度求索,换防单挑。
而不管是DeepSeek也好,还是阿里的通义千问模型也罢,关键词其实都是基于“开源MoE模型”。这很容易让已经被DeepSeek所震撼的投资者产生了惯性。
开源MoE模型需要拆解来看。“MoE”的意思是混合专家模型。这种模型更倚重强化学习、专家混合方法(使用多个更高效的小模型)、知识蒸馏和精细化思维链推理。这种策略使其能够以极小成本开发出具有竞争力的模型。
而此前美国硅谷巨头和华尔街的普遍观点是,AI大语言模型的发展要靠所谓的“扩展法则”,以向模型输入更多数据和提供更多算力来解锁更强大的能力。高盛的一篇研报分析,美国企业的这种AI发展路径将需要几家AI大模型巨头在未来向GPU、数据中心等上游投资约1万亿美元的金额,这也是去年英伟达、博通等AI芯片供应商股价上涨如此迅猛的逻辑底座。
阿里和深度求索的新模型,无疑提供了AI大模型发展的另一种“更廉价、更具前景的替代方案”,是颠覆性的。
“开源”的意思非常好理解,大致就是个人用户或者程序员都可以免费使用或者调用的意思。这也是DeepSeek R1和Qwen2.5-Max区别于OpenAI和其他主流AI大模型的地方。这种策略的成功是明显的,因为竞争者都在跟随。2月13日,百度和OpenAI同一天宣布,旗下文心一言和ChatGPT将免费。
那么和同在杭州的小老弟深度求索的产品相比,阿里的AI又有何优势呢?
我想,撇开繁琐的模型研究和性能拼比不谈,阿里AI最大的优势在于下游B端的应用。
别忘了,是阿里云发布了Qwen相关的模型,阿里云本身就是一家云计算服务商,可以直接为企业用户提供包含AI相关技术在内的云服务。这就好比电商是一个逻辑,DeepSeek可能可以被看做是电商平台的一家旗舰店,而阿里云则就是平台本身。对于企业端的客户来说,凭借阿里云的完整云生态,接入通义千问的途径会更加灵活,所享受到的“打包服务”也更加丰富。
这也就是为何苹果会选择阿里的AI大模型为中国终端用户开发AI功能。多家媒体报道,2月13日,阿里巴巴联合创始人、董事局主席蔡崇信回应阿里与苹果合作传闻,他表示,苹果一直非常挑剔,他们与中国的多家公司进行了交谈。最终,他们选择与我们做生意。我们非常幸运,也非常荣幸能够与苹果这样的伟大公司做生意。
理由其实不难理解,相比深度求索这样可能不足200人的“小”企业,现阶段阿里云既能提供性能不逊色的AI大模型,也能提供更多的企业端服务经验、人员以及算力支持。而苹果希望在手机等设备上开发的AI服务绝对不仅是类似搜索引擎那样的问答软件,而是更复杂软件的开发需求和长期维护保障。
另一方面,作为电商巨头,阿里拥有与消费和支付行为相关的庞大数据库,而利用这些数据训练出来的定制化生成式人工智能可能会为苹果在消费服务方面提供更好的体验。
对阿里来说,一旦AI产品被植入苹果相关终端产品中,就可以极大提高其原本并不占优势的个人用户使用量。据aicpb发布的AI产品榜,在C端用户活跃度方面,今年1月份阿里的通义千问相比国内其他大厂的产品还不占优势。
马云脸上的笑容,似乎包含着在这个AI当道时代的一种胸有成竹。
与之相伴的就是阿里巴巴股价的“逆转”。此前,阿里巴巴的电商业务曾一度不受资本市场的看好,2024年之前股价连续多年低迷。如今,由AI驱动的阿里新一轮增长极已经显露端倪。更重要的是,与国内几大电商竞争者相比,阿里在云计算服务和AI大模型领域的技术进展和商业变现正处于优势地位。
这和阿里创业团队多年来坚定重仓AI赛道、云计算赛道是分不开的。当然,国内云计算服务赛道的增长其实和美国比起来还属偏慢。比如,华尔街分析师估计,阿里巴巴和百度去年12月季度的云业务收入分别同比增长9.7%和7.7%,而亚马逊公司和微软公司的云服务部门分别增长19%和31%。
不过,这反过来其实也可以被说成“国内市场由AI驱动的新一轮云服务增长潜力巨大”、“阿里云Qwen服务的出海潜力高”,一切的发展还需拭目以待。
高盛还认为,鉴于生成式人工智能可能节省大量成本,一旦开发出应用,部署的边际成本可能非常小,全世界范围内采用生成式人工智能更多的是‘何时’的问题,而不是‘是否’的问题。
中国科技企业相对低成本和高效的新模型,将突破过高的投资成本这一人工智能商业化发展道路上的最大障碍——将可能大幅降低推理算力成本,开源方式,加快AI大模型技术的应用爆发。大模型变得更小、更好用、更便宜,对应用无疑是全方位的利好。
市场消息称,苹果公司正与阿里巴巴合作,开发和推出面向中国苹果用户的人工智能,并已将共同开发的AI功能向监管机构提交审批。2月12日,阿里巴巴港股强势上涨超8%,13号收盘再涨2.55%。如果考虑到本轮由AI驱动的阿里股价涨势的话,从今年1月中旬的股价低点开始,阿里香港股票市值已经上涨超过800亿美元,风头正盛……
马云的现身伴随着阿里在人工智能领域的一波亮眼操作,无法不令人浮想联翩。
北京时间1月29日凌晨1点半,阿里突然发力,发布了升级后的阿里云通义千问旗舰版模型Qwen2.5-Max。
据阿里的介绍,Qwen2.5-Max模型是基于对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。
与Qwen2.5-Max进行对比的模型,就包括了最近火爆海内外的深度求索(DeepSeek)旗下的V3模型,最大的开源稠密模型Llama-3.1-405B,以及阿里自产的位列开源稠密模型前列的Qwen2.5-72B。
微妙之处在于这个时间点不同寻常。此前没几天,深度求索的DeepSeek R1模型刚刚在全世界范围内掀起巨浪,由其革命性的以较低成本产生较高性能大语言模型的创新,使得以英伟达为首的AI算力供应商股价大跌,发布后的首个交易日就让华尔街跌去1万亿美元的市值。美国权威媒体和专家惊呼:“这是中美人工智能霸权争夺战的‘斯普特尼克时刻’。”
用篮球术语讲,这是阿里在点名深度求索,换防单挑。
而不管是DeepSeek也好,还是阿里的通义千问模型也罢,关键词其实都是基于“开源MoE模型”。这很容易让已经被DeepSeek所震撼的投资者产生了惯性。
开源MoE模型需要拆解来看。“MoE”的意思是混合专家模型。这种模型更倚重强化学习、专家混合方法(使用多个更高效的小模型)、知识蒸馏和精细化思维链推理。这种策略使其能够以极小成本开发出具有竞争力的模型。
而此前美国硅谷巨头和华尔街的普遍观点是,AI大语言模型的发展要靠所谓的“扩展法则”,以向模型输入更多数据和提供更多算力来解锁更强大的能力。高盛的一篇研报分析,美国企业的这种AI发展路径将需要几家AI大模型巨头在未来向GPU、数据中心等上游投资约1万亿美元的金额,这也是去年英伟达、博通等AI芯片供应商股价上涨如此迅猛的逻辑底座。
阿里和深度求索的新模型,无疑提供了AI大模型发展的另一种“更廉价、更具前景的替代方案”,是颠覆性的。
“开源”的意思非常好理解,大致就是个人用户或者程序员都可以免费使用或者调用的意思。这也是DeepSeek R1和Qwen2.5-Max区别于OpenAI和其他主流AI大模型的地方。这种策略的成功是明显的,因为竞争者都在跟随。2月13日,百度和OpenAI同一天宣布,旗下文心一言和ChatGPT将免费。
那么和同在杭州的小老弟深度求索的产品相比,阿里的AI又有何优势呢?
我想,撇开繁琐的模型研究和性能拼比不谈,阿里AI最大的优势在于下游B端的应用。
别忘了,是阿里云发布了Qwen相关的模型,阿里云本身就是一家云计算服务商,可以直接为企业用户提供包含AI相关技术在内的云服务。这就好比电商是一个逻辑,DeepSeek可能可以被看做是电商平台的一家旗舰店,而阿里云则就是平台本身。对于企业端的客户来说,凭借阿里云的完整云生态,接入通义千问的途径会更加灵活,所享受到的“打包服务”也更加丰富。
这也就是为何苹果会选择阿里的AI大模型为中国终端用户开发AI功能。多家媒体报道,2月13日,阿里巴巴联合创始人、董事局主席蔡崇信回应阿里与苹果合作传闻,他表示,苹果一直非常挑剔,他们与中国的多家公司进行了交谈。最终,他们选择与我们做生意。我们非常幸运,也非常荣幸能够与苹果这样的伟大公司做生意。
理由其实不难理解,相比深度求索这样可能不足200人的“小”企业,现阶段阿里云既能提供性能不逊色的AI大模型,也能提供更多的企业端服务经验、人员以及算力支持。而苹果希望在手机等设备上开发的AI服务绝对不仅是类似搜索引擎那样的问答软件,而是更复杂软件的开发需求和长期维护保障。
另一方面,作为电商巨头,阿里拥有与消费和支付行为相关的庞大数据库,而利用这些数据训练出来的定制化生成式人工智能可能会为苹果在消费服务方面提供更好的体验。
对阿里来说,一旦AI产品被植入苹果相关终端产品中,就可以极大提高其原本并不占优势的个人用户使用量。据aicpb发布的AI产品榜,在C端用户活跃度方面,今年1月份阿里的通义千问相比国内其他大厂的产品还不占优势。
马云脸上的笑容,似乎包含着在这个AI当道时代的一种胸有成竹。
与之相伴的就是阿里巴巴股价的“逆转”。此前,阿里巴巴的电商业务曾一度不受资本市场的看好,2024年之前股价连续多年低迷。如今,由AI驱动的阿里新一轮增长极已经显露端倪。更重要的是,与国内几大电商竞争者相比,阿里在云计算服务和AI大模型领域的技术进展和商业变现正处于优势地位。
这和阿里创业团队多年来坚定重仓AI赛道、云计算赛道是分不开的。当然,国内云计算服务赛道的增长其实和美国比起来还属偏慢。比如,华尔街分析师估计,阿里巴巴和百度去年12月季度的云业务收入分别同比增长9.7%和7.7%,而亚马逊公司和微软公司的云服务部门分别增长19%和31%。
不过,这反过来其实也可以被说成“国内市场由AI驱动的新一轮云服务增长潜力巨大”、“阿里云Qwen服务的出海潜力高”,一切的发展还需拭目以待。
高盛还认为,鉴于生成式人工智能可能节省大量成本,一旦开发出应用,部署的边际成本可能非常小,全世界范围内采用生成式人工智能更多的是‘何时’的问题,而不是‘是否’的问题。
中国科技企业相对低成本和高效的新模型,将突破过高的投资成本这一人工智能商业化发展道路上的最大障碍——将可能大幅降低推理算力成本,开源方式,加快AI大模型技术的应用爆发。大模型变得更小、更好用、更便宜,对应用无疑是全方位的利好。