Så här arbetar du med DALL-E-modellerna
OpenAI:s DALL-E-modeller genererar avbildningar baserat på textfrågor som tillhandahålls av användaren. Den här guiden visar hur du använder DALL-E-modellerna och konfigurerar deras alternativ via REST API-anrop.
Förutsättningar
- En Azure-prenumeration Du kan skapa en kostnadsfritt.
- En Azure OpenAI-resurs som skapats i Regionen Sverige, centrala . Mer information finns i Skapa och distribuera en Azure OpenAI Service-resurs.
- Distribuera en dall-e-3-modell med din Azure OpenAI-resurs.
Anropa API:er för bildgenerering
Följande kommando visar det mest grundläggande sättet att använda DALL-E med kod. Om det här är första gången du använder dessa modeller programmatiskt rekommenderar vi att du börjar med snabbstarten DALL-E.
Skicka en POST-begäran till:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Ersätt följande platshållare:
<your_resource_name>
är namnet på din Azure OpenAI-resurs.<your_deployment_name>
är namnet på din DALL-E 3-modelldistribution.<api_version>
är den version av API:et som du vill använda. Exempel:2024-02-01
Nödvändiga rubriker:
Content-Type
:application/json
api-key
:<your_API_key>
Brödtext:
Följande är ett exempel på begärandetext. Du anger ett antal alternativ som definieras i senare avsnitt.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Output
Utdata från ett API-anrop för lyckad bildgenerering ser ut som i följande exempel. Fältet url
innehåller en URL där du kan ladda ned den genererade avbildningen. URL:en förblir aktiv i 24 timmar.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Avvisande av API-anrop
Prompter och bilder filtreras baserat på vår innehållsprincip, vilket returnerar ett fel när en fråga eller bild flaggas.
Om din fråga har flaggats error.code
är värdet i meddelandet inställt på contentFilter
. Här är ett exempel:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Det är också möjligt att den genererade avbildningen filtreras. I det här fallet har felmeddelandet angetts till Genererad avbildning filtrerades som ett resultat av vårt säkerhetssystem. Här är ett exempel:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Skriva bildprompter
Dina bildprompter bör beskriva det innehåll som du vill se i bilden och bildformatet.
När du skriver prompter bör du tänka på att api:erna för bildgenerering har ett con tältläge ration-filter. Om tjänsten identifierar din fråga som skadligt innehåll genereras ingen avbildning. Mer information finns i Innehållsfiltrering.
Dricks
En grundlig titt på hur du kan justera textfrågorna för att generera olika typer av bilder finns i guiden för bildpromptteknik.
Ange API-alternativ
Följande API-brödtextparametrar är tillgängliga för DALL-E-avbildningsgenerering.
Storlek
Ange storleken på de genererade bilderna. Måste vara en av 1024x1024
, 1792x1024
eller 1024x1792
för DALL-E 3-modeller. Kvadratbilder är snabbare att generera.
Format
DALL-E 3 introducerar två formatalternativ: natural
och vivid
. Den naturliga stilen liknar mer standardformatet DALL-E 2, medan den livliga stilen genererar fler hyperreella och filmiska bilder.
Den naturliga stilen är användbar i fall där DALL-E 3 överdriver eller förvirrar ett ämne som är tänkt att vara enklare, dämpat eller realistiskt.
Standardvärdet är vivid
.
Kvalitet
Det finns två alternativ för bildkvalitet: hd
och standard
. Hd-alternativet skapar bilder med finare information och större konsekvens i bilden. Standardbilder kan genereras snabbare.
Standardvärdet är standard
.
Antal
Med DALL-E 3 kan du inte generera fler än en bild i ett enda API-anrop: parametern n
måste vara inställd på 1. Om du behöver generera flera bilder samtidigt gör du parallella begäranden.
Svarsformat
Formatet där de genererade bilderna returneras. Måste vara en av url
(en URL som pekar på bilden) eller b64_json
(baskoden på 64 byte i JSON-format). Standardvärdet är url
.