强强联合！华为携手浦发银行成功部署基于昇腾的DeepSeek 671B满血版，助力浦发银行数智化战略加速推进

财经头条

提升一亿中产阶级阅读效率

打开

新浪

2天前

近日，华为公司携手浦发银行，在昇腾服务器上顺利部署DeepSeek-R1671B满血版本，率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用。

【通信产业网讯】近日，华为公司携手浦发银行，在昇腾服务器上顺利部署DeepSeek-R1 671B满血版本，率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用！

快速部署，彰显技术实力

浦发银行全力推进数智化战略实施。在本次DeepSeek热潮中，浦发银行把握先机，基于昇腾算力集群，快速完成DeepSeek-R1 671B满血版的部署，并应用在智能问答助手、智能财务分析等多个场景，全面提升数字金融服务的“数智”能力，加速数字员工建设，帮助浦发银行对内更好地赋能员工，对外更好地服务客户。

除了DeepSeek的快速部署和应用外，浦发银行的工程师积极参与昇腾AI大模型训练推理相关的上机实践，快速上手MindIE等工具的使用，帮助完成模型的微调、调优，让模型发挥更大的价值。

展望未来，持续创新，引领金融科技高质量发展

浦发银行作为金融科技的先行者，深入推进数字金融创新发展。在未来，浦发银行将人工智能等技术与数字金融深度融合，在公司业务、零售业务、金融市场、风险合规以及内部管理等领域强化数字化、智能化创新建设，全面打造数字金融服务体系的“智”基座、“简”流程、“融”生态、“惠”服务，力争成为“最懂数字经济、最懂用户体验”的数字金融服务最佳银行。

关于DeepSeek：

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek是一家创新型科技公司，专注于研究世界领先的AI底层模型与创新技术。

DeepSeek-R1大模型创新技术简析：

（1）模型结构优化：通过MLA（Multi-Head Latent Attention，多头潜在注意力）技术大幅降低KV缓存开销；通过MoE架构（Mixture of Experts，混合专家）；通过MTP（Multi-Token Prediction，多token预测）一次性预测多个token，提升训练和推理的效率；

（2）训练优化：通过高质量数据构建、超参数、长上下文拓展等技术优化预训练；通过监督微调、强化学习、增加评级机制等技术优化后训练。