API – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Thu, 24 Apr 2025 06:54:33 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico API – 青瓜传媒 //m.clubpenjuin.com 32 32 OpenAI最强图像生成API上线,一张图1毛5 //m.clubpenjuin.com/367037.html Thu, 24 Apr 2025 06:54:33 +0000 //m.clubpenjuin.com/?p=367037

 

昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。

这一次,他们直接把每张图的成本打到几美分。

对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。

gpt-image-1集成了三大核心功能:图像生成、图像编辑、图像变体(仅限DALL·E 2)。

与GPT-4o图像生成不同,gpt-image-1最大的特点,在于支持各种高级功能的定制。

比如,自定义输出图像的质量、尺寸、格式、压缩程度,甚至可选择是否需要透明背景,能够满足多样化创意需求。

它具备了强大的通用能力,不仅能够创作多种风格图片,还能精准遵循自定义需求。通过结合世界知识,生成更符合上下文的图像。

现在,你就可以在playground中使用gpt-image-1来快速迭代提示词和图像:

GPT-4o上线掀起全网吉卜力风潮,并在发布首周全球1.3亿用户,创作了超7亿图片。

gpt-image-1作为OpenAI全新一个原生多模态图像模型,随着API开放,将会在未来极大地释放人们创意。

效果一览

在官方API文档「探索」区,OpenAI放出了许多gpt-image-1生成图片的demo,效果非常惊艳。

接下来,就一睹为快吧。

一句话,让gpt-image-1展示出创建鳄梨酱所需的所有食材。

下面这张梦幻之境,可是用了一个「小作文」提示词才完成的。

再来看它创作的外星人Glorptak,有着凝胶状身体,半透明发光,非常可爱。

对于模特、电商行业来说,gpt-image-1将重塑创作方式。上传一张衣服图、一张人的照片,就能看到衣服上身的效果了。

橄榄油宣传图,也只需找一张背景图,gpt-image-1瞬间完成P图。

更神奇的是,上传一张房屋设计平面图,gpt-image-1就能将其变为3D效果,更加直观。

番茄酱广告,非常有视觉冲击力。

设计矿泉水的瓶身,也是多种风格拿捏。

生成超写实的3D图标,看着非常有质感。

gpt-image-1还能生成粗线条手绘风格图解,为回针缝制法每一步配上了简洁的说明文字。

上传一张CD模板图,让gpt-image-1生成金属乐队黑胶唱片。

还有各种纹理的防止图案,也是非常有创意。

还有动画分镜脚本——马匹跳跃循环序列,gpt-image-1可做到逐帧解剖要点。

上传独立流行音乐人的照片,一张演唱会门票直接设计好了。

自定义图像输出,精准创意

目前,OpenAI GPT Image API提供了丰富的自定义选项,让开发者完全掌控输出效果。

尺寸:支持多种分辨率,比如1024×1024, 1024×1536

质量:可选low,medium,high三种渲染质量

格式:文件输出格式

压缩:针对JPEG和WebP格式,可设置0-100%级别的压缩

背景:透明或不透明

生成图像

通过图像生成端点,仅凭一段文本提示,即可生成令人惊叹的图像。

可设置参数n ,一次可生成多张图像(默认情况下,API返回单张图片)。

图像编辑

而图像编辑功能,可以让创意更进一步。通过图像编辑端点,你可以:

  • 直接编辑现有图片
  • 参考图像生成新图片:上传多张参考图像,然后生成新图
  • 局部编辑(inpainting):通过上传图像和蒙版,精准替换指定的区域

参考图像生成新图片

比如,上传四张礼品图片,生成一个包含所有礼品的精美礼物篮的图像。

使用蒙版编辑图像(局部编辑)

你可以上传一个蒙版来编辑图像,蒙版中的透明区域将被替换,而黑色区域保持不变。

OpenAI建议,你可以使用提示来描述整个新图像,而不仅仅是被擦除的区域。

蒙版要求:

1. 图像和蒙版需要格式一致,尺寸相同,大小不超过25MB。

2. 蒙版需包含Alpha通道,在图像编辑工具中保存蒙版时,务必勾选「保存Alpha通道」。

在自定义中,还需要注意的包括:

方形图片以标准质量生成的速度最快,默认大小是1024×1024。

Image API返回base64编码的图像数据,默认格式是png ,但你也可以请求jpeg或webp。

如果使用jpeg或webp,还可以指定output_compression参数来控制压缩级别(0-100%)。例如, output_compression=50就是把图像压缩50%。

此外,gpt-image-1支持透明背景。要启用透明度,需将background参数设置为transparent。

模型对比

虽然gpt-image-1是目前OpenAI最强大的多模态模型,此前推出的DALL·E 2和DALL·E 3则是专为图像生成设计的模型,各有所长。

根据不同需求和场景,开发者可灵活从中选用这些模型API。

gpt-image-1使用同样是按Token计费,文本和图像的Token各有不同的价格:

  • 文本输入Token:5美元/百万token
  • 图像输入Token:10美元/百万token
  • 图像输出Token:40美元/百万token

如前所述,在实际应用中,对于低、中和高质量的方形图片,每生成一张图像的费用大约分别为0.02美元、0.07美元和0.19美元。

从创意到商业无限可能

OpenAI全新Image API的推出,将为各行各业解锁更多创意魔法。

目前,创意工具、电商、教育、企业软件、游戏等行业的领先企业和初创公司,已经将图像生成集成到他们的产品和服务中。

Adobe的创意工具,包括Firefly和Express,将通过gpt-image-1为创作者提供选择和灵活性,方便他们实验不同的美学风格。

Figma正在利用gpt-image-1从简单的提示词生成和编辑图像,使设计师能够快速探索创意并直接在Figma中进行视觉迭代。

HeyGen正在使用gpt-image-1来增强头像创建,特别是在平台内改善头像编辑。

Photoroom正在使用gpt-image-1帮助在线卖家从单一产品照片中瞬间创建工作室级别的视觉效果、生活场景和模特展示图。

此外,Canva已将gpt-image-1集成到Canva AI和Magic Studio工具中,进一步扩展设计生成和编辑能力。

简单的草图,gpt-image-1即可将其转化为精美图形元素。与此同时,它还支持高保真的视觉编辑,让2.3亿用户能够用全新方式将创意变为现实。

专为设计logo而生的GoDaddy,通过集成gpt-image-1,可以轻松创建编辑Logo,去除背景并生成专业字体设计。

借助GoDaddy Airo,创意者通过提示即可生成原创产品和品牌内容,并打造体现自身品牌个性的社交媒体和营销素材。

还有HubSpot通过OpenAI图像新模型,有望彻底革新客户制作高质量社交媒体、邮件营销以及落地页图片的方式,无需专业设计经验也能轻松实现。

Instacart正在测试如何利用API生成用于菜谱和购物清单的图片,以提升用户体验。

创作个性化视频invideo,在集成gpt-image-1后,将支持更强大的文本生成、精细化编辑控制和高级风格指导,进一步丰富了用户的视频创作体验。

作者:桃子 好困

来源:新智元

]]>
API是什么意思? //m.clubpenjuin.com/206591.html Mon, 20 Jul 2020 09:05:05 +0000 //m.clubpenjuin.com/?p=206591

API(Application Programming Interface,应用程序接口)是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。 [1]  用来提供应用程序与开发人员基于某软件或硬件得以访问的一组例程,而又无需访问源码,或理解内部工作机制的细节。

简介

操作系统是用户与计算机硬件系统之间的接口,用户通过操作系统的帮助,可以快速、有效和安全、可靠地操纵计算机系统中的各类资源,以处理自己的程序。为使用户能方便地使用操作系统,OS 又向用户提供了如下两类接口:

(1) 用户接口:操作系统专门为用户提供了“用户与操作系统的接口” ,通常称为用户接口。该接口支持用户与 OS 之间进行交互,即由用户向 OS 请求提供特定的服务,而系统则把服务的结果返回给用户。

(2) 程序接口:操作系统向编程人员提供了“程序与操作系统的接口” ,简称程序接口,又称应用程序接口 API(Application Programming Interface)。 该接口是为程序员在编程时使用的,系统和应用程序通过这个接口,可在执行中访问系统中的资源和取得 OS 的服务,它也是程序能取得操作系统服务的唯一途径。大多数操作系统的程序接口是由一组系统调用(system call)组成,每一个系统调用都是一个能完成特定功能的子程序 [2]  。

应用程序接口又称为应用编程接口,是一组定义、程序及协议的集合,通过 API接口实现计算机软件之间的相互通信。API 的一个主要功能是提供通用功能集。API同时也是一种中间件,为各种不同平台提供数据共享。程序设计的实践中,编程接口的设计首先要使软件系统的职责得到合理划分。良好的接口设计可以降低系统各部分的相互依赖,提高组成单元的内聚性,降低组成单元间的耦合程度,从而提高系统的可维护性和可扩展性。

分类

Windows API

操作系统的用户接口

API函数包含在Windows系统目录下的动态连接库文件中。Windows API是一套用来控制Windows的各个部件的外观和行为的预先定义的Windows函数。用户的每个动作都会引发一个或几个函数的运行以告诉Windows发生了什么。这在某种程度上很像Windows的天然代码。而其他的语言只是提供一种能自动而且更容易的访问API的方法。当你点击窗体上的一个按钮时,Windows会发送一个消息给窗体,VB获取这个调用并经过分析后生成一个特定事件。

更易理解来说:Windows系统除了协调应用程序的执行、内存的分配、系统资源的管理外,同时他也是一个很大的服务中心。调用这个服务中心的各种服务(每一种服务就是一个函数)可以帮助应用程序达到开启视窗、描绘图形和使用周边设备等目的,由于这些函数服务的对象是应用程序,所以称之为Application Programming Interface,简称API 函数。WIN32 API也就是MicrosoftWindows 32位平台的应用程序编程接口。

凡是在 Windows工作环境底下执行的应用程序,都可以调用Windows API。

linux API

在linux中,用户编程接口API遵循了UNIX中最流行的应用编程界面标准—POSIX标准。POSIX标准是由IEEE和ISO/IEC共同开发的标准系统。该标准基于当时现有的UNIX实践和经验,描述了操作系统的系统调用编程接口API,用于保证应用程序可以在源程序一级上在多种操作系统上移植运行。这些系统调用编程接口主要是通过C库(LIBC)来实现的。

开放平台

基于互联网的应用正变得越来越普及,在这个过程中,有更多的站点将自身的资源开放给开发者来调用。对外提供的API 调用使得站点之间的内容关联性更强,同时这些开放的平台也为用户、开发者和中小网站带来了更大的价值。

开放是发展趋势,越来越多的产品走向开放。网站不能靠限制用户离开来留住用户,开放的架构反而更增加了用户的粘性。在Web 2.0的浪潮到来之前,开放的API 甚至源代码主要体现在桌面应用上,越来越多的Web应用面向开发者开放了API。

具备分享、标准、去中心化、开放、模块化的Web 2.0站点,在为使用者带来价值的同时,更希望通过开放的API 来让站点提供的服务拥有更大的用户群和服务访问数量。

站点在推出基于开放API 标准的产品和服务后,无需花费力气做大量的市场推广,只要提供的服务或应用出色易用,其他站点就会主动将开放API 提供的服务整合到自己的应用之中。同时,这种整合API 带来的服务应用,也会激发更多富有创意的应用产生。

为了对外提供统一的API 接口,需要对开发者开放资源调用API 的站点提供开放统一的API接口环境,来帮助使用者访问站点的功能和资源。

当然,开放API 的站点为第三方的开发者提供良好的社区支持也是很有意义的,这有助于吸引更多的技术人员参与到开放的开发平台中,并开发出更为有趣的第三方应用。

视频云技术提供商CC视频开放API接口,用户可以在自己的网站后台轻松完成视频的上传、视频播放控制操作,并可批量获取视频及平台信息。

API 声明

正如在”什么是API”中所说,API函数包含在位于系统目录下的DLL文件中。你可以自己输入API函数的声明,但VB提供了一种更简单的方法,即使用API Text Viewer。 要想在你的工程中声明API函数,只需运行API Text Viewer,打开Win32api.txt或MDB。如果你已经把它转换成了数据库的话,这样可以加快速度。 使用预定义的常量和类型也是同样的方法。 API除了有应用“应用程序接口”的意思外,还特指API的说明文档,也称为帮助文档。

常见问题

假设你想在你的窗体模块中声明一个函数,粘贴然后运行,VB会告诉你:编译错误…Declare 语句不允许作为类或对象模块中的Public(公共的) 成员。..看起来很糟糕,其实你需要做的只是在声明前面添加一个Private(私有的)。不要忘了,可是这将使该函数只在该窗体模块可用。. 在有些情况下,你会得到”不明确的名称”这样的提示,这是因为函数、常量或其他的什么东西共用了一个名称。由于绝大多数的函数都进行了别名化,亦即意味着你可以通过Alias子句使用其它的而不是他们原有的名称,你只需简单地改变一下函数名称而它仍然可以正常运行。

程序功能

远程过程调用(RPC):通过作用在共享数据缓存器上的过程(或任务)实现程序间的通信。

标准查询语言(SQL):是标准的访问数据的查询语言,通过通用数据库实现应用程序间的数据共享。

文件传输:文件传输通过发送格式化文件实现应用程序间数据共享。

信息交付:指松耦合或紧耦合应用程序间的小型格式化信息,通过程序间的直接通信实现数据共享。

当前应用于 API 的标准包括ANSI 标准SQL API。另外还有一些应用于其它类型的标准尚在制定之中。API 可以应用于所有计算机平台和操作系统。这些API 以不同的格式连接数据。每种数据格式要求以不同的数据命令和参数实现正确的数据通信,但同时也会产生不同类型的错误。因此,除了具备执行数据共享任务所需的知识以外,这些类型的API 还必须解决很多网络参数问题和可能的差错条件,即每个应用程序都必须清楚自身是否有强大的性能支持程序间通信。相反由于这种API 只处理一种信息格式,所以该情形下的信息交付API 只提供较小的命令、网络参数以及差错条件子集。正因为如此,交付API 方式大大降低了系统复杂性,所以当应用程序需要通过多个平台实现数据共享时,采用信息交付API 类型是比较理想的选择。

API与GUI

API 接口属于一种操作系统或程序接口,GUI接口属于一种图形操作系统。两者都属于直接用户接口。有时公司会将 API 作为其公共开放系统。也就是说,公司制定自己的系统接口标准,当需要执行系统整合、自定义和程序应用等操作时,公司所有成员都可以通过该接口标准调用源代码,该接口标准被称之为开放式API。

]]>