O OpenAI disponibiliza seu gerador de imagens atualizado para desenvolvedores

A Openai na quarta -feira trouxe a tecnologia por trás de seu novo e aprimorado recurso de geração de imagens no ChatGPT à sua API, permitindo que os desenvolvedores o integrassem em seus aplicativos e serviços.

O novo gerador de imagens da OpenAI, lançado para a maioria dos usuários do ChatGPT no final de março, se tornou viral por sua capacidade de criar fotos realistas do estilo ghibli e “figuras de ação da AI”. Tem sido uma bênção mista para o OpenAI, levando a milhões de novas inscrições para o ChatGPT, além de forçar bastante a capacidade da empresa. Mais de 130 milhões de usuários do ChatGPT criaram mais de 700 milhões de imagens apenas na primeira semana da disponibilidade da ferramenta, de acordo com a empresa.

Na API do Openai, a capacidade de geração de imagens é alimentada por um modelo de IA chamado “GPT-Image-1”. Um modelo nativamente multimodal, o GPT-Image-1 pode criar imagens em diferentes estilos, seguir diretrizes personalizadas, alavancar o conhecimento mundial e renderizar o texto.

Os desenvolvedores podem gerar várias imagens por vez usando GPT-Image-1 e controlar a qualidade da geração-e, portanto, a velocidade.

De acordo com o OpenAI, o GPT-Image-1 emprega os mesmos corrimãos de segurança que a geração de imagens no ChatGPT, incluindo salvaguardas que restringem o modelo de gerar conteúdo que atravessa as políticas da empresa. Os desenvolvedores podem controlar a sensibilidade à moderação, que pode ser definida como “automática” para filtragem padrão ou “baixo” para filtragem menos restritiva. Limites de filtragem baixa menos categorias de conteúdo potencialmente inadequado de idade, por documentação do OpenAI fornecida ao TechCrunch.

O OpenAI também diz que todas as imagens criadas com GPT-Image-1 são marcadas com os metadados C2PA para que possam ser identificados como gerados por IA por plataformas e aplicativos suportados.

O preço é de US $ 5 por milhão de tokens de entrada para texto e US $ 10 por milhão de tokens de entrada para imagens e tokens de saída de US $ 40 por milhão para imagens. (Os tokens são os bits brutos de dados que o modelo processa.) Isso se traduz em cerca de 2 centavos, 7 centavos e 19 centavos por imagem gerada para imagens quadradas de baixa, média e alta qualidade, respectivamente, de acordo com o OpenAI.

Openai diz que empresas como Adobe, Airtable, Wix, Instacart, GoDaddy, Canva e Figma já estão usando ou experimentando o GPT-Image-1. A plataforma de design da figma da figma, por exemplo, agora permite que os usuários gerem e editem imagens via GPT-Image-1, enquanto o Instacart está testando o modelo para imagens para receitas e listas de compras.

Veja também