“2025(第二十三届)水业战略论坛”上,E20环境平台智能规划中心AI解决方案总监战凯以《两山智联®视频智能V2.0(大模型版):“快而准”的视频智能安全管控》为题,系统性拆解了云边端协同架构下的技术闭环,并首次公开“两山智联®视频智能V2.0(大模型版)”在水务行业的规模化落地路径。
在运营为王的时代,水务行业面临效率提升与风险管控的双重挑战,智能化转型成为破局关键。
随着视频监控的普及,全国大量公共区域及水务设施已完成覆盖,据不完全统计双百跨越标杆水厂便部署了33类视频智能技能,视频分析技术已成为行业标配、并得到了行业内认可。如何借助视频智能赋能行业发展,成为业界同仁面临的一道必选题。
在“2025(第二十三届)水业战略论坛”上,E20环境平台智能规划中心AI解决方案总监战凯以《两山智联®视频智能V2.0(大模型版):“快而准”的视频智能安全管控》为题,系统性拆解了云边端协同架构下的技术闭环,并首次公开“两山智联®视频智能V2.0(大模型版)”在水务行业的规模化落地路径。
战凯
1.0阶段小模型奠基,覆盖三大核心场景
2023年,E20环境平台与百度智能云联合推出了两山智联视频智能1.0版本。针对供水、污水、垃圾焚烧领域,双方共同开发了25项行业技能,并且有17个项目成功落地。
战凯表示,视频智能的技术演进植根于小模型积累,受限于小模型的局限性,在实际应用中会偶发误报存在。
例如夜晚场景中灯光被错误标注为火焰,地面反光被识别为积水,施工工人被误判为人员倒地等。为提升系统准确率、解决误报问题,需采集大量负样本数据。然而,与正样本相比,负样本数量少,采集工作艰巨。尽管系统准确率已达行业领先的 90% - 95%,但客户期望达到 100% 的准确率,每一张误报图片都会影响客户使用体验。
战凯首先感谢了过去一年多亲密合作的用户,让1.0版本得到快速落地和完善。在1.0实践应用阶段,E20与用户始终保持密切沟通,水务集团也对双方的合作给与了高度信任和支持,在过程中积极反馈助力技术迭代。
“尽管技术迭代与用户反馈持续推动优化,小模型的技术瓶颈仍是误报难根治的核心症结。”战凯强调。
因其底层逻辑依赖单帧抽样分析——从每秒24帧视频中截取单帧进行特征点匹配,这一机制在复杂现实场景中易受环境干扰:低光照导致图像模糊、非常规视角引发特征偏移、动态遮挡与背景噪声形成干扰信号。
因此突破环境敏感性与特征泛化能力的天花板,需系统性重构算法架构。
技术攻坚:多模态大模型破解行业痛点
在小模型推进缓慢的情况下,技术瓶颈亟待突破。随着技术发展,大模型的出现带来了转机。
2017 年 Transformer 架构出现,大模型开始进入人们的视野;2022 年 ChatGPT 出现,使大模型应用成为可能;2023 年中期 GPT4V 出现,首次实现了图像和文本两个模态的交互;到 2024 年初 GPT4O出现,真正实现了视频、音频、图像甚至其他感知的多模态交互,经过一年发展,国内很多厂商也实现了多模态大模型的落地。
多模态大模型在视觉识别上优势显著。大语言模型能理解并归纳文本内容,同样,多模态大模型也能解读图像信息。在复杂场景中,小模型可能需十几个要素来识别图片内容,而大模型通过分析图像内容就能准确判断。
例如火烧云照片,小模型可能因特征值匹配烟火而误报火灾,多模态大模型却能准确解释这是自然景象。在实际测试中,小模型将灯误识别为烟火,多模态大模型则正确识别出是监控拍摄的夜景,还能解析画面中特定区域的反光和光线折射效果。
可见,多模态大模型在理解和解析复杂视觉信息方面能力卓越,能够有效解决小模型在视频智能应用中面临的误报难题。
场景落地:全链路赋能水务智能化
随着技术发展,E20两山智联团队推出了两山智联®视频智能V2.0(大模型版)。
该版本在端侧配备智能分析一体机,通过小模型实现快速且低成本的秒级抽帧分析。前端完成识别后,借助智联盒将预警信息传送至云侧,由两山智联视频智能运维平台进行事件处理及应用场景服务。同时,大模型平台负责提升分析准确性并应对复杂场景。
技术升级后,两山智联®视频智能系统v2.0(大模型版)应运而生。此版本以 “准、活、简” 三大核心能力为突破点,深度融合云边端协同架构,全面优化智能识别与场景适配效率。
“准”大模型复判提高识别准确率≧99%
前端部署轻量化小模型实现毫秒级抽帧与秒级初判,通过智能分析一体机覆盖全厂区,完成基础检测后,由云端大模型对预警结果二次校验(如跌倒行为确认、标志物精准识别等),结合与百度联合训练专属多模态大模型,准确率突破99%甚至100%,专属模型一键调用百度智能云平台,解决复杂场景误报难题。
“活”零代码AI技能编排,灵活适配现场管理需求
以污水处理厂为例,工作人员卸药操作有位置、持料管、穿防护服等多个要求,属于复杂场景。以往实现此类复杂场景识别需开发代码、编写底层逻辑,而现在通过平台的可视化编排,配置好逻辑规则就能实现,即基于平台可完成针对复杂场景的技能编排。
“简”算法能力工程化,内置丰富的产线,周期短、效果优
算法能力工程化,内置丰富的产线,周期短、效果优。传统新模型从 0 到 1 开发,需设计方案、进行大量数据标注(提供大量正、负样本),还要做训练、封装、测试等,不仅需要专业算法工程师,耗时两到四周,且需大量图片(行业标准是五千张正样本、一千张负样本),准确率还未必能达到要求。平台内置的产线利用其他行业成熟模型,基于其底层逻辑类似的特点进行调优生成新模型,大幅降低了投入成本和时间。比如广东自来水公司,在购置我们的视频智能平台并接受简短培训后,其团队仅用一个月时间就成功开发出了检测物资的算法,并已经正式上线运行。
效能延续更快、更准、更多应用场景1.0基因与2.0创新的融合
2.0 版在保留 1.0 版优势项目的基础上,具备了“准”、“活”、“简”的特点。
1.0版具有“快”和“多”的特点。对于一百个摄像头,1.0版无需代码,五天内就能完成连接、技能编排及配置。此外,一台标准视频分析一体机能并发解析100个摄像头,实现秒级抽帧,每个摄像头可配备10项技能,叠加起来可达一千项。在当前技术条件下,一台一体机处理一千个并发,性价比极高。
2.0版不仅延续了“快”与“多”的能力,在准确性方面也表现卓越。
战凯表示,E20两山智联团队一直重视提高视频智能本身的识别准确率,经调研发现,很多场景都需要视频技术的支持。例如巡检场景,若视频识别准确率达到100%,就能用于识别设备状态和读数;在有限空间作业等危险场景中,100%的准确率也能保障作业安全和效果。未来,希望视频智能除了应用于识别领域,还能融入更多管理和业务场景。
基于这样强大的技术平台,E20两山智联团队相信能够开展更多富有成效的工作。因此,两山智联团队发出号召,诚邀行业伙伴共同参与创新,E20将凭借先进的技术实力,结合客户在不同场景下的需求,除已提供25种基于安全的通用场景,在业务、设备和生产工艺等方面,也蕴含着巨大的创新空间。战凯表示,期待与行业同仁携手,,共同开发出更多、更好的模型,并将这些模型应用到行业中,推动整个行业的进步与发展。05写在最后
战凯在论坛中回顾了过去一年与客户深度互动的实践历程,强调技术落地离不开行业伙伴的信任与反馈。为回馈用户支持,他表示针对老客户,承诺免费提供2.0版本升级及现场部署服务,最大限度降低迭代成本;面向新客户,则推出前十名订单九折优惠,并可自主选择百度智能云·一见开发训练平台三个月试用或定制技能开发支持,以降低智能化转型门槛。
卓越同行,智赢未来。战凯相信,在水务同仁的支持和两山智联的不断探索下,智能化事业必将取得显著成就。
编辑:李丹
“2025(第二十三届)水业战略论坛”上,E20环境平台智能规划中心AI解决方案总监战凯以《两山智联®视频智能V2.0(大模型版):“快而准”的视频智能安全管控》为题,系统性拆解了云边端协同架构下的技术闭环,并首次公开“两山智联®视频智能V2.0(大模型版)”在水务行业的规模化落地路径。
在运营为王的时代,水务行业面临效率提升与风险管控的双重挑战,智能化转型成为破局关键。
随着视频监控的普及,全国大量公共区域及水务设施已完成覆盖,据不完全统计双百跨越标杆水厂便部署了33类视频智能技能,视频分析技术已成为行业标配、并得到了行业内认可。如何借助视频智能赋能行业发展,成为业界同仁面临的一道必选题。
在“2025(第二十三届)水业战略论坛”上,E20环境平台智能规划中心AI解决方案总监战凯以《两山智联®视频智能V2.0(大模型版):“快而准”的视频智能安全管控》为题,系统性拆解了云边端协同架构下的技术闭环,并首次公开“两山智联®视频智能V2.0(大模型版)”在水务行业的规模化落地路径。
战凯
1.0阶段小模型奠基,覆盖三大核心场景
2023年,E20环境平台与百度智能云联合推出了两山智联视频智能1.0版本。针对供水、污水、垃圾焚烧领域,双方共同开发了25项行业技能,并且有17个项目成功落地。
战凯表示,视频智能的技术演进植根于小模型积累,受限于小模型的局限性,在实际应用中会偶发误报存在。
例如夜晚场景中灯光被错误标注为火焰,地面反光被识别为积水,施工工人被误判为人员倒地等。为提升系统准确率、解决误报问题,需采集大量负样本数据。然而,与正样本相比,负样本数量少,采集工作艰巨。尽管系统准确率已达行业领先的 90% - 95%,但客户期望达到 100% 的准确率,每一张误报图片都会影响客户使用体验。
战凯首先感谢了过去一年多亲密合作的用户,让1.0版本得到快速落地和完善。在1.0实践应用阶段,E20与用户始终保持密切沟通,水务集团也对双方的合作给与了高度信任和支持,在过程中积极反馈助力技术迭代。
“尽管技术迭代与用户反馈持续推动优化,小模型的技术瓶颈仍是误报难根治的核心症结。”战凯强调。
因其底层逻辑依赖单帧抽样分析——从每秒24帧视频中截取单帧进行特征点匹配,这一机制在复杂现实场景中易受环境干扰:低光照导致图像模糊、非常规视角引发特征偏移、动态遮挡与背景噪声形成干扰信号。
因此突破环境敏感性与特征泛化能力的天花板,需系统性重构算法架构。
技术攻坚:多模态大模型破解行业痛点
在小模型推进缓慢的情况下,技术瓶颈亟待突破。随着技术发展,大模型的出现带来了转机。
2017 年 Transformer 架构出现,大模型开始进入人们的视野;2022 年 ChatGPT 出现,使大模型应用成为可能;2023 年中期 GPT4V 出现,首次实现了图像和文本两个模态的交互;到 2024 年初 GPT4O出现,真正实现了视频、音频、图像甚至其他感知的多模态交互,经过一年发展,国内很多厂商也实现了多模态大模型的落地。
多模态大模型在视觉识别上优势显著。大语言模型能理解并归纳文本内容,同样,多模态大模型也能解读图像信息。在复杂场景中,小模型可能需十几个要素来识别图片内容,而大模型通过分析图像内容就能准确判断。
例如火烧云照片,小模型可能因特征值匹配烟火而误报火灾,多模态大模型却能准确解释这是自然景象。在实际测试中,小模型将灯误识别为烟火,多模态大模型则正确识别出是监控拍摄的夜景,还能解析画面中特定区域的反光和光线折射效果。
可见,多模态大模型在理解和解析复杂视觉信息方面能力卓越,能够有效解决小模型在视频智能应用中面临的误报难题。
场景落地:全链路赋能水务智能化
随着技术发展,E20两山智联团队推出了两山智联®视频智能V2.0(大模型版)。
该版本在端侧配备智能分析一体机,通过小模型实现快速且低成本的秒级抽帧分析。前端完成识别后,借助智联盒将预警信息传送至云侧,由两山智联视频智能运维平台进行事件处理及应用场景服务。同时,大模型平台负责提升分析准确性并应对复杂场景。
技术升级后,两山智联®视频智能系统v2.0(大模型版)应运而生。此版本以 “准、活、简” 三大核心能力为突破点,深度融合云边端协同架构,全面优化智能识别与场景适配效率。
“准”大模型复判提高识别准确率≧99%
前端部署轻量化小模型实现毫秒级抽帧与秒级初判,通过智能分析一体机覆盖全厂区,完成基础检测后,由云端大模型对预警结果二次校验(如跌倒行为确认、标志物精准识别等),结合与百度联合训练专属多模态大模型,准确率突破99%甚至100%,专属模型一键调用百度智能云平台,解决复杂场景误报难题。
“活”零代码AI技能编排,灵活适配现场管理需求
以污水处理厂为例,工作人员卸药操作有位置、持料管、穿防护服等多个要求,属于复杂场景。以往实现此类复杂场景识别需开发代码、编写底层逻辑,而现在通过平台的可视化编排,配置好逻辑规则就能实现,即基于平台可完成针对复杂场景的技能编排。
“简”算法能力工程化,内置丰富的产线,周期短、效果优
算法能力工程化,内置丰富的产线,周期短、效果优。传统新模型从 0 到 1 开发,需设计方案、进行大量数据标注(提供大量正、负样本),还要做训练、封装、测试等,不仅需要专业算法工程师,耗时两到四周,且需大量图片(行业标准是五千张正样本、一千张负样本),准确率还未必能达到要求。平台内置的产线利用其他行业成熟模型,基于其底层逻辑类似的特点进行调优生成新模型,大幅降低了投入成本和时间。比如广东自来水公司,在购置我们的视频智能平台并接受简短培训后,其团队仅用一个月时间就成功开发出了检测物资的算法,并已经正式上线运行。
效能延续更快、更准、更多应用场景1.0基因与2.0创新的融合
2.0 版在保留 1.0 版优势项目的基础上,具备了“准”、“活”、“简”的特点。
1.0版具有“快”和“多”的特点。对于一百个摄像头,1.0版无需代码,五天内就能完成连接、技能编排及配置。此外,一台标准视频分析一体机能并发解析100个摄像头,实现秒级抽帧,每个摄像头可配备10项技能,叠加起来可达一千项。在当前技术条件下,一台一体机处理一千个并发,性价比极高。
2.0版不仅延续了“快”与“多”的能力,在准确性方面也表现卓越。
战凯表示,E20两山智联团队一直重视提高视频智能本身的识别准确率,经调研发现,很多场景都需要视频技术的支持。例如巡检场景,若视频识别准确率达到100%,就能用于识别设备状态和读数;在有限空间作业等危险场景中,100%的准确率也能保障作业安全和效果。未来,希望视频智能除了应用于识别领域,还能融入更多管理和业务场景。
基于这样强大的技术平台,E20两山智联团队相信能够开展更多富有成效的工作。因此,两山智联团队发出号召,诚邀行业伙伴共同参与创新,E20将凭借先进的技术实力,结合客户在不同场景下的需求,除已提供25种基于安全的通用场景,在业务、设备和生产工艺等方面,也蕴含着巨大的创新空间。战凯表示,期待与行业同仁携手,,共同开发出更多、更好的模型,并将这些模型应用到行业中,推动整个行业的进步与发展。05写在最后
战凯在论坛中回顾了过去一年与客户深度互动的实践历程,强调技术落地离不开行业伙伴的信任与反馈。为回馈用户支持,他表示针对老客户,承诺免费提供2.0版本升级及现场部署服务,最大限度降低迭代成本;面向新客户,则推出前十名订单九折优惠,并可自主选择百度智能云·一见开发训练平台三个月试用或定制技能开发支持,以降低智能化转型门槛。
卓越同行,智赢未来。战凯相信,在水务同仁的支持和两山智联的不断探索下,智能化事业必将取得显著成就。
编辑:李丹