谷歌(GOOGL.US)、马斯克紧逼下 OpenAI火线升级ChatGPT图像功能：生成速度提升4倍编辑精度显著优化

财经头条

提升一亿中产阶级阅读效率

打开

智通财经

19小时前

该公司于周二宣布，将为ChatGPT的图像生成功能推出重大更新，不仅能提升图像生成的精准度与编辑灵活性，生成速度更较前代模型最高提升4倍，同时还将在移动端应用及网页端增设独立图像生成入口，无需通过聊天交互即可直接使用。

智通财经APP获悉，在与谷歌(GOOGL.US)等公司的激烈竞争中，AI巨头OpenAI持续强化其旗舰聊天机器人产品。该公司于周二宣布，将为ChatGPT的图像生成功能推出重大更新，不仅能提升图像生成的精准度与编辑灵活性，生成速度更较前代模型最高提升4倍，同时还将在移动端应用及网页端增设独立图像生成入口，无需通过聊天交互即可直接使用。

作为OpenAI打造“全能应用”战略的重要一环，ChatGPT正逐步整合搜索引擎、语音助手、图像及视频生成等多元功能。然而，当前行业竞争日趋白热化：谷歌近期推出了重磅AI模型Gemini 3，其旗下热门图像生成工具Nano Banana用户粘性持续提升;埃隆・马斯克创办的xAI公司推出的聊天机器人Grok，也已上线类似图像生成功能，对ChatGPT形成围追堵截之势。

据此前的报道称，受Gemini 3发布冲击，OpenAI首席执行官萨姆・奥尔特曼在内部备忘录中宣布进入“红色警报”状态，要求团队全力推进ChatGPT功能升级。就在上周，OpenAI刚刚发布了一款更先进的AI模型，重点强化了ChatGPT在编程、科学计算及各类办公场景的应用能力。

此次图像功能升级，旨在同时满足个人创作与专业生产需求。升级后的系统支持对上传图像进行多维度编辑：例如将照片级写实风格转换为水彩画质感，或为画面中的人物添加新配饰，且所有编辑操作均能保留原始图像的细节完整性。OpenAI特别强调，新模型在多次编辑过程中可稳定保持光线效果、人物外观及场景构图的一致性——这一痛点曾导致前代图像模型在多轮编辑中频繁出现细节失真问题。

此外，新模型在文本生成能力上实现突破，支持创建包含更多小型文字的图像内容，例如根据用户提示生成详细信息图表或多段落文本;同时在单张图像中生成多个清晰的小尺寸人脸图像方面，表现也更为出色。

展开

打开“财经头条”阅读更多精彩资讯