Partager via


Comment utiliser les modèles DALL-E

Les modèles DALL-E d’OpenAI génèrent des images basées sur des invites de texte fournies par l’utilisateur. Ce guide explique comment utiliser les modèles DALL-E et configurer leurs options via des appels d’API REST.

Prérequis

Appeler les API de génération d’images

La commande suivante montre la façon la plus simple d’utiliser DALL-E avec du code. Si c’est la première fois que vous utilisez ces modèles par programmation, nous vous recommandons de commencer par notre Démarrage rapide DALL-E.

Envoyez une requête POST à :

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Remplacez les espaces réservés suivants :

  • <your_resource_name> est le nom de votre ressource Azure OpenAI.
  • <your_deployment_name> est le nom de votre déploiement de modèle DALL-E 3.
  • <api_version> est la version de l’API que vous voulez utiliser. Par exemple : 2024-02-01.

En-têtes obligatoires :

  • Content-Type: application/json
  • api-key: <your_API_key>

Corps :

Voici un exemple de corps de la requête. Vous spécifiez un certain nombre d’options, définies dans les sections ultérieures.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Sortie

La sortie d’un appel d’API de génération d’images réussi ressemble à l’exemple ci-dessous. Le champ url contient une URL dans laquelle vous pouvez télécharger l’image générée. L’URL reste active pendant 24 heures.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Refus d’appel API

Les invites et les images sont filtrées en fonction de notre stratégie de contenu, en retournant une erreur lorsqu’une invite ou une image est marquée.

Si votre invite est marquée, la valeur error.code du message est définie sur contentFilter. Voici un exemple :

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Il est également possible que l’image générée elle-même soit filtrée. Dans ce cas, le message d’erreur est défini sur L’image générée a été filtrée en raison de notre système de sécurité. Voici un exemple :

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Écriture d’invites d’images

Vos requêtes d’images doivent décrire le contenu que vous souhaitez voir dans l’image, ainsi que le style visuel de l’image.

Lorsque vous écrivez des invites, considérez que les API de génération d’images sont fournies avec un filtre de modération de contenu. Si le service reconnaît votre invite comme étant du contenu nuisible, il ne génère pas d’image. Pour plus d’informations, consultez l’article Filtrage du contenu.

Conseil

Pour un examen approfondi de la façon dont vous pouvez ajuster vos invites de texte pour générer différents types d’images, consultez le Guide d’ingénierie pour la création d’images.

Spécifier les options d’API

Les paramètres de corps d’API suivants sont disponibles pour la génération d’images DALL-E.

Taille

Spécifiez la taille des images générées. Doit être 1024x1024, 1792x1024 ou 1024x1792 pour les modèles DALL-E 3. Les images carrées sont plus rapides à générer.

Style

DALL-E 3 introduit deux options de style : natural et vivid. Le style natural ressemble davantage au style DALL-E 2 par défaut, tandis que le style vivid génère plus d’images hyper-réelles et cinématographiques.

Le style natural est utile dans les cas où DALL-E 3 exagère ou confond un sujet qui est destiné à être plus simple, sobre ou réaliste.

La valeur par défaut est vivid.

Contrôle

Il existe deux options pour la qualité de l’image : hd et standard. L’option hd crée des images avec des détails plus fins et une plus grande cohérence dans l’image. Les images standard peuvent être générées plus rapidement.

La valeur par défaut est standard.

Number

Avec DALL-E 3, vous ne pouvez pas générer plusieurs images dans un seul appel d’API : le paramètre n doit être défini sur 1. Si vous devez générer plusieurs images à la fois, effectuez des demandes parallèles.

Format de la réponse

Format dans lequel les images générées sont retournées. Doit être url (URL pointant vers l’image) ou b64_json (code de base 64 octets au format JSON). Par défaut, il s’agit de url.