智通财经APP获悉,在与谷歌(GOOGL.US)等公司的激烈竞争中,AI巨头OpenAI持续强化其旗舰聊天机器人产品。该公司于周二宣布,将为ChatGPT的图像生成功能推出重大更新,不仅能提升图像生成的精准度与编辑灵活性,生成速度更较前代模型最高提升4倍,同时还将在移动端应用及网页端增设独立图像生成入口,无需通过聊天交互即可直接使用。
作为OpenAI打造“全能应用”战略的重要一环,ChatGPT正逐步整合搜索引擎、语音助手、图像及视频生成等多元功能。然而,当前行业竞争日趋白热化:谷歌近期推出了重磅AI模型Gemini 3,其旗下热门图像生成工具Nano Banana用户粘性持续提升;埃隆・马斯克创办的xAI公司推出的聊天机器人Grok,也已上线类似图像生成功能,对ChatGPT形成围追堵截之势。
据此前的报道称,受Gemini 3发布冲击,OpenAI首席执行官萨姆・奥尔特曼在内部备忘录中宣布进入“红色警报”状态,要求团队全力推进ChatGPT功能升级。就在上周,OpenAI刚刚发布了一款更先进的AI模型,重点强化了ChatGPT在编程、科学计算及各类办公场景的应用能力。
此次图像功能升级,旨在同时满足个人创作与专业生产需求。升级后的系统支持对上传图像进行多维度编辑:例如将照片级写实风格转换为水彩画质感,或为画面中的人物添加新配饰,且所有编辑操作均能保留原始图像的细节完整性。OpenAI特别强调,新模型在多次编辑过程中可稳定保持光线效果、人物外观及场景构图的一致性——这一痛点曾导致前代图像模型在多轮编辑中频繁出现细节失真问题。
此外,新模型在文本生成能力上实现突破,支持创建包含更多小型文字的图像内容,例如根据用户提示生成详细信息图表或多段落文本;同时在单张图像中生成多个清晰的小尺寸人脸图像方面,表现也更为出色。
智通财经APP获悉,在与谷歌(GOOGL.US)等公司的激烈竞争中,AI巨头OpenAI持续强化其旗舰聊天机器人产品。该公司于周二宣布,将为ChatGPT的图像生成功能推出重大更新,不仅能提升图像生成的精准度与编辑灵活性,生成速度更较前代模型最高提升4倍,同时还将在移动端应用及网页端增设独立图像生成入口,无需通过聊天交互即可直接使用。
作为OpenAI打造“全能应用”战略的重要一环,ChatGPT正逐步整合搜索引擎、语音助手、图像及视频生成等多元功能。然而,当前行业竞争日趋白热化:谷歌近期推出了重磅AI模型Gemini 3,其旗下热门图像生成工具Nano Banana用户粘性持续提升;埃隆・马斯克创办的xAI公司推出的聊天机器人Grok,也已上线类似图像生成功能,对ChatGPT形成围追堵截之势。
据此前的报道称,受Gemini 3发布冲击,OpenAI首席执行官萨姆・奥尔特曼在内部备忘录中宣布进入“红色警报”状态,要求团队全力推进ChatGPT功能升级。就在上周,OpenAI刚刚发布了一款更先进的AI模型,重点强化了ChatGPT在编程、科学计算及各类办公场景的应用能力。
此次图像功能升级,旨在同时满足个人创作与专业生产需求。升级后的系统支持对上传图像进行多维度编辑:例如将照片级写实风格转换为水彩画质感,或为画面中的人物添加新配饰,且所有编辑操作均能保留原始图像的细节完整性。OpenAI特别强调,新模型在多次编辑过程中可稳定保持光线效果、人物外观及场景构图的一致性——这一痛点曾导致前代图像模型在多轮编辑中频繁出现细节失真问题。
此外,新模型在文本生成能力上实现突破,支持创建包含更多小型文字的图像内容,例如根据用户提示生成详细信息图表或多段落文本;同时在单张图像中生成多个清晰的小尺寸人脸图像方面,表现也更为出色。