在AI技术的飞速发展下,GPU市场正经历着翻天覆地的变化。由于AI基础设施的巨额投资,市场上的H100算力已经供过于求,导致租赁价格从8美元/小时大幅下降至低于2美元/小时。本文作者Eugene Cheah深入研究H100市场后,建议用户按需租用算力,而非购买,以避免潜在的亏损。
文章还讨论了AI竞赛的历史,从GPT-3.5和ChatGPT的兴起到H100的推出,以及由此引发的对H100的高需求。然而,随着时间的推移,H100的价格不仅没有保持稳定,反而出现了大幅下降。
这种价格下降的原因很复杂,包括硬件供应商的转变、数据中心的过度投资、以及开放权重模型的兴起等。这些因素共同导致了对H100需求的减少,以及市场上算力供应的增加。
最后,文章提出了几种可能的市场走向,包括H100集群价格的分层、新公共云H100集群可能面临的无利可图的风险,以及便宜的H100可能加速开放权重AI的采用浪潮。作者的结论是,建议用户在需要时租用而不是购买算力。你是否认可作者的观点?以下,Enjoy:
Eugene Cheah是AI推理服务供应商Featherless.AI的联合创始人,也是RWKV开源基础模型项目的联合负责人。
本文由OneFlow编译发布,转载请联系授权
原文:https://www.latent.space/p/gpu-bubble
这里将重点关注经济成本和租赁的ROI,对比不同的市场价格,不包括机会成本或业务价值。
对AI推理和微调的需求增加:由于许多“开放”模型缺乏适当的“开源”许可证,但仍然被免费分发和广泛使用,甚至用于商业用途。在这里,我们将统称它们为“开放权重”或“开放”模型。
如今,对于大多数企业可能需要的用例,已经有现成的开放权重模型。这些模型在某些基准测试中可能略逊于专有模型,但提供了以下优势:
灵活性:特定领域/任务的微调。
可靠性:不再有小的模型更新导致用例失效(目前,社区对模型权重在没有通知的情况下在公共API端点上悄悄更改导致不可解释的效果退化缺乏信任度)。
安全性和隐私:确保他们的提示词和客户数据的安全。
基础模型创建市场萎缩(小型和中型):我们用“模型创建者”来统称从零开始创建模型的组织。对于微调者,我们称他们为“模型微调者”。
也许你还想看:
经纬徐传陞:做VC这么多年,人们总在问我同一个问题
在AI技术的飞速发展下,GPU市场正经历着翻天覆地的变化。由于AI基础设施的巨额投资,市场上的H100算力已经供过于求,导致租赁价格从8美元/小时大幅下降至低于2美元/小时。本文作者Eugene Cheah深入研究H100市场后,建议用户按需租用算力,而非购买,以避免潜在的亏损。
文章还讨论了AI竞赛的历史,从GPT-3.5和ChatGPT的兴起到H100的推出,以及由此引发的对H100的高需求。然而,随着时间的推移,H100的价格不仅没有保持稳定,反而出现了大幅下降。
这种价格下降的原因很复杂,包括硬件供应商的转变、数据中心的过度投资、以及开放权重模型的兴起等。这些因素共同导致了对H100需求的减少,以及市场上算力供应的增加。
最后,文章提出了几种可能的市场走向,包括H100集群价格的分层、新公共云H100集群可能面临的无利可图的风险,以及便宜的H100可能加速开放权重AI的采用浪潮。作者的结论是,建议用户在需要时租用而不是购买算力。你是否认可作者的观点?以下,Enjoy:
Eugene Cheah是AI推理服务供应商Featherless.AI的联合创始人,也是RWKV开源基础模型项目的联合负责人。
本文由OneFlow编译发布,转载请联系授权
原文:https://www.latent.space/p/gpu-bubble
这里将重点关注经济成本和租赁的ROI,对比不同的市场价格,不包括机会成本或业务价值。
对AI推理和微调的需求增加:由于许多“开放”模型缺乏适当的“开源”许可证,但仍然被免费分发和广泛使用,甚至用于商业用途。在这里,我们将统称它们为“开放权重”或“开放”模型。
如今,对于大多数企业可能需要的用例,已经有现成的开放权重模型。这些模型在某些基准测试中可能略逊于专有模型,但提供了以下优势:
灵活性:特定领域/任务的微调。
可靠性:不再有小的模型更新导致用例失效(目前,社区对模型权重在没有通知的情况下在公共API端点上悄悄更改导致不可解释的效果退化缺乏信任度)。
安全性和隐私:确保他们的提示词和客户数据的安全。
基础模型创建市场萎缩(小型和中型):我们用“模型创建者”来统称从零开始创建模型的组织。对于微调者,我们称他们为“模型微调者”。
也许你还想看:
经纬徐传陞:做VC这么多年,人们总在问我同一个问题