强强联合!华为携手浦发银行成功部署基于昇腾的DeepSeek 671B满血版,助力浦发银行数智化战略加速推进

新浪

2天前

近日,华为公司携手浦发银行,在昇腾服务器上顺利部署DeepSeek-R1671B满血版本,率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用。

【通信产业网讯】近日,华为公司携手浦发银行,在昇腾服务器上顺利部署DeepSeek-R1 671B满血版本,率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用!

快速部署,彰显技术实力

浦发银行全力推进数智化战略实施。在本次DeepSeek热潮中,浦发银行把握先机,基于昇腾算力集群,快速完成DeepSeek-R1 671B满血版的部署,并应用在智能问答助手、智能财务分析等多个场景,全面提升数字金融服务的“数智”能力,加速数字员工建设,帮助浦发银行对内更好地赋能员工,对外更好地服务客户。

除了DeepSeek的快速部署和应用外,浦发银行的工程师积极参与昇腾AI大模型训练推理相关的上机实践,快速上手MindIE等工具的使用,帮助完成模型的微调、调优,让模型发挥更大的价值。

展望未来,持续创新,引领金融科技高质量发展

浦发银行作为金融科技的先行者,深入推进数字金融创新发展。在未来,浦发银行将人工智能等技术与数字金融深度融合,在公司业务、零售业务、金融市场、风险合规以及内部管理等领域强化数字化、智能化创新建设,全面打造数字金融服务体系的“智”基座、“简”流程、“融”生态、“惠”服务,力争成为“最懂数字经济、最懂用户体验”的数字金融服务最佳银行。

关于DeepSeek

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek是一家创新型科技公司,专注于研究世界领先的AI底层模型与创新技术。

DeepSeek-R1大模型创新技术简析:

(1)模型结构优化:通过MLA(Multi-Head Latent Attention,多头潜在注意力)技术大幅降低KV缓存开销;通过MoE架构(Mixture of Experts,混合专家);通过MTP(Multi-Token Prediction,多token预测)一次性预测多个token,提升训练和推理的效率;

(2)训练优化:通过高质量数据构建、超参数、长上下文拓展等技术优化预训练;通过监督微调、强化学习、增加评级机制等技术优化后训练。

近日,华为公司携手浦发银行,在昇腾服务器上顺利部署DeepSeek-R1671B满血版本,率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用。

【通信产业网讯】近日,华为公司携手浦发银行,在昇腾服务器上顺利部署DeepSeek-R1 671B满血版本,率先实现全栈自主研发算力平台+DeepSeek大模型的金融应用!

快速部署,彰显技术实力

浦发银行全力推进数智化战略实施。在本次DeepSeek热潮中,浦发银行把握先机,基于昇腾算力集群,快速完成DeepSeek-R1 671B满血版的部署,并应用在智能问答助手、智能财务分析等多个场景,全面提升数字金融服务的“数智”能力,加速数字员工建设,帮助浦发银行对内更好地赋能员工,对外更好地服务客户。

除了DeepSeek的快速部署和应用外,浦发银行的工程师积极参与昇腾AI大模型训练推理相关的上机实践,快速上手MindIE等工具的使用,帮助完成模型的微调、调优,让模型发挥更大的价值。

展望未来,持续创新,引领金融科技高质量发展

浦发银行作为金融科技的先行者,深入推进数字金融创新发展。在未来,浦发银行将人工智能等技术与数字金融深度融合,在公司业务、零售业务、金融市场、风险合规以及内部管理等领域强化数字化、智能化创新建设,全面打造数字金融服务体系的“智”基座、“简”流程、“融”生态、“惠”服务,力争成为“最懂数字经济、最懂用户体验”的数字金融服务最佳银行。

关于DeepSeek

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek是一家创新型科技公司,专注于研究世界领先的AI底层模型与创新技术。

DeepSeek-R1大模型创新技术简析:

(1)模型结构优化:通过MLA(Multi-Head Latent Attention,多头潜在注意力)技术大幅降低KV缓存开销;通过MoE架构(Mixture of Experts,混合专家);通过MTP(Multi-Token Prediction,多token预测)一次性预测多个token,提升训练和推理的效率;

(2)训练优化:通过高质量数据构建、超参数、长上下文拓展等技术优化预训练;通过监督微调、强化学习、增加评级机制等技术优化后训练。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开