可灵AI O1正式上线：号称全球首个统一多模态视频大模型

财经头条

提升一亿中产阶级阅读效率

打开

站长之家

5小时前

尤为值得一提的是，可灵O1通过多视角主体构建技术，成功攻克了视频中人物或物体在镜头切换时特征漂移的行业难题。

站长之家（ChinaZ.com）12月2日消息:可灵AI正式宣布其全新O1视频大模型全量上线，这款被业界誉为“全球首个统一多模态视频大模型”的创新产品，凭借其突破性的技术架构和功能设计，直击传统视频生成工具功能割裂、操作复杂的行业痛点，为视频创作领域带来革命性变革。目前，用户已可在可灵App及官网率先体验这一前沿科技。

全球首个统一多模态视频大模型！可灵AI O1 正式上线：一句话生成视频

与传统视频生成工具需分步处理文生视频、图生视频、局部编辑等任务不同，可灵O1基于创新的MVL（多模态视觉语言）交互架构，在单一输入框内即可无缝融合文字、图像、视频等多种指令，实现跨模态内容的无缝衔接与高效创作。这一设计极大地简化了操作流程，提升了创作效率。

结合先进的Chain-of-thought技术，可灵O1不仅能够精准理解用户意图，还能进行常识推理与事件推演，确保生成的视频内容更加符合逻辑、贴近现实。例如，用户上传一段真人视频后，仅需通过简单对话指令，即可实现局部元素的增加或删除、前后镜头的智能延展以及动作捕捉生成新画面等高级功能，让视频创作变得更加灵活多样。

全球首个统一多模态视频大模型！可灵AI O1 正式上线：一句话生成视频

尤为值得一提的是，可灵O1通过多视角主体构建技术，成功攻克了视频中人物或物体在镜头切换时特征漂移的行业难题。这一技术确保了多主体场景下画面的精准连贯性，为视频创作提供了更加稳定可靠的技术支持。

此外，可灵O1还支持长达310秒的自由生成时长，将叙事节奏的控制权完全交还给创作者。无论是短视频博主、广告团队还是个人用户，都能借助这一平台快速产出高质量、高一致性的创意视频，满足多样化的创作需求。

（举报）

尤为值得一提的是，可灵O1通过多视角主体构建技术，成功攻克了视频中人物或物体在镜头切换时特征漂移的行业难题。

全球首个统一多模态视频大模型！可灵AI O1 正式上线：一句话生成视频

（举报）

展开

打开“财经头条”阅读更多精彩资讯