刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

​ AIGC开放社区公众号

5小时前

目前,已经有众多知名企业开始将GPT-image-1模型应用在实际业务中,例如,多媒体巨头Adobe已经将其集成在Firefly和Express应用中,为用户提供不同类型的图片风格。

今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。

GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经将该模型集成在产品中。

需要注意的是,OpenAI已经对新模型的API使用了全新身份验证。如果无法通过验证的小伙伴,可以使用微软的Azure云服务来体验。

详细API指南:https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1

GPT-image-1应用案例

目前,已经有众多知名企业开始将GPT-image-1模型应用在实际业务中,例如,多媒体巨头Adobe已经将其集成在Firefly和Express应用中,为用户提供不同类型的图片风格。

云设计平台Figma通过GPT-image-1只用简单的提示生成和编辑图像,就能帮助设计师直接在Figma中快速获取想法并进行视觉迭代。

AI视频平台HeyGen正在使用GPT-image-1来增强头像创建,特别是改进平台内的头像编辑。

图片

云开发平台Wix通过GPT-image-1可以帮助任何用户将其想法快速变成现实。

图片

图像设计平台Photoroom正在使用GPT-image-1帮助在线卖家通过一张产品照片即时创建工作室品质的视觉效果、生活场景和模特照片。

GPT-image-1支持哪些高级定制

开发者通过API最大特色就是支持各种高级功能的定制。例如,通常我们用GPT-4o来生成图像一般是一张,但通过API只需要设置一个N参数,就可以一次生成多张。

图片

用多张图像作为提示词,例如,我们直接用四张单图,直接合成一张完成的礼品新图像。

图片

图片

使用过Photoshop合成图片的小伙伴应该都知道很重要的一个功能—蒙版。现在通过GPT-image-1也能轻松实现了。

提示词:阳光明媚的室内休息区,有一个游泳池,池中有一只火烈鸟。然后进行蒙版涂抹。

图片

最终输出的图像。

图片

图片

开发者也可以对图片的透明度进行更改,只需要将background参数设置为transparent即可。但仅支持png和webp输出格式。

图片

此外,开发者也可以通过API设置GPT-image-1的图像尺寸1024x1024、1024x1536、1024x1536或者自动;渲染质量,low、medium、high三种;压缩格式,JPEG和WebP格式的压缩级别(0-100%)。

图片

所以,通过GPT-image-1的API来生成图片,自由度极高,彻底释放用户的想法,生成的图像也非常好。

定价方面,文本输入每100万token为5美元,图像输入每100万token为510美元;图像输出每100万token为40美元。

在实际使用中,低质量的1024x1024图像生成成本大约为每张0.02美元,中等质量的图像约为每张0.07美元,而高质量图像则约为每张0.19美元。

图片

OpenAI首席执行官兼联合创始人Sam Altman也赞扬了该模型,并表示与ChatGPT版本有很大的不同。

图片

网友表示,这次API发布对开发者来说意义重大。单是图像编辑功能,就能开启众多此前无法实现的创意应用场景。

图片

这个模型太棒了!会取代DALL-E系列吗?

图片

图像生成功能的集成如今拓宽了API用户的创意可能性。期待看到开发者们的应用不断增加。这是引人注目的创新。

图片

这很有意思!API在底层提供了更多的控制能力。对于特定的应用场景而言,自定义审核敏感度以及平衡质量与速度可能会带来变革。

图片

(举报)

目前,已经有众多知名企业开始将GPT-image-1模型应用在实际业务中,例如,多媒体巨头Adobe已经将其集成在Firefly和Express应用中,为用户提供不同类型的图片风格。

今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。

GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经将该模型集成在产品中。

需要注意的是,OpenAI已经对新模型的API使用了全新身份验证。如果无法通过验证的小伙伴,可以使用微软的Azure云服务来体验。

详细API指南:https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1

GPT-image-1应用案例

目前,已经有众多知名企业开始将GPT-image-1模型应用在实际业务中,例如,多媒体巨头Adobe已经将其集成在Firefly和Express应用中,为用户提供不同类型的图片风格。

云设计平台Figma通过GPT-image-1只用简单的提示生成和编辑图像,就能帮助设计师直接在Figma中快速获取想法并进行视觉迭代。

AI视频平台HeyGen正在使用GPT-image-1来增强头像创建,特别是改进平台内的头像编辑。

图片

云开发平台Wix通过GPT-image-1可以帮助任何用户将其想法快速变成现实。

图片

图像设计平台Photoroom正在使用GPT-image-1帮助在线卖家通过一张产品照片即时创建工作室品质的视觉效果、生活场景和模特照片。

GPT-image-1支持哪些高级定制

开发者通过API最大特色就是支持各种高级功能的定制。例如,通常我们用GPT-4o来生成图像一般是一张,但通过API只需要设置一个N参数,就可以一次生成多张。

图片

用多张图像作为提示词,例如,我们直接用四张单图,直接合成一张完成的礼品新图像。

图片

图片

使用过Photoshop合成图片的小伙伴应该都知道很重要的一个功能—蒙版。现在通过GPT-image-1也能轻松实现了。

提示词:阳光明媚的室内休息区,有一个游泳池,池中有一只火烈鸟。然后进行蒙版涂抹。

图片

最终输出的图像。

图片

图片

开发者也可以对图片的透明度进行更改,只需要将background参数设置为transparent即可。但仅支持png和webp输出格式。

图片

此外,开发者也可以通过API设置GPT-image-1的图像尺寸1024x1024、1024x1536、1024x1536或者自动;渲染质量,low、medium、high三种;压缩格式,JPEG和WebP格式的压缩级别(0-100%)。

图片

所以,通过GPT-image-1的API来生成图片,自由度极高,彻底释放用户的想法,生成的图像也非常好。

定价方面,文本输入每100万token为5美元,图像输入每100万token为510美元;图像输出每100万token为40美元。

在实际使用中,低质量的1024x1024图像生成成本大约为每张0.02美元,中等质量的图像约为每张0.07美元,而高质量图像则约为每张0.19美元。

图片

OpenAI首席执行官兼联合创始人Sam Altman也赞扬了该模型,并表示与ChatGPT版本有很大的不同。

图片

网友表示,这次API发布对开发者来说意义重大。单是图像编辑功能,就能开启众多此前无法实现的创意应用场景。

图片

这个模型太棒了!会取代DALL-E系列吗?

图片

图像生成功能的集成如今拓宽了API用户的创意可能性。期待看到开发者们的应用不断增加。这是引人注目的创新。

图片

这很有意思!API在底层提供了更多的控制能力。对于特定的应用场景而言,自定义审核敏感度以及平衡质量与速度可能会带来变革。

图片

(举报)

展开
打开“财经头条”阅读更多精彩资讯
APP内打开