Techniques d’ingénierie d’invite

Article
10/04/2024

Les modèles GPT-3, GPT-3.5, GPT-4 et GPT-4o d’OpenAI sont basés sur des invites. Dans le cas d’un modèle basé sur des invites, l’utilisateur interagit avec le modèle en entrant une invite de texte, à laquelle le modèle répond par une saisie semi-automatique. Cette saisie semi-automatique est la continuation du texte d’entrée par le modèle.

Bien que ces modèles soient extrêmement puissants, leur comportement est également très sensible à l’invite. La construction de l’invite est dès lors une compétence importante à développer.

La construction de l’invite peut être difficile. Dans la pratique, l’invite agit pour configurer les pondérations du modèle pour accomplir la tâche souhaitée. Il s’agit toutefois plus d’un art que d’une science, qui nécessite souvent de l’expérience et de l’intuition pour créer une invite réussie. Cet article visé à vous aider à vous familiariser avec ce processus d’entraînement. Il tente de présenter les concepts généraux et les modèles qui s’appliquent à tous les modèles GPT. Toutefois, il est important de comprendre que chaque modèle se comporte d’une manière qui lui est propre, de sorte que les entraînements peuvent ne pas s’appliquer de la même façon à tous les modèles.

Concepts de base

Cette section décrit les concepts et les éléments de base des invites GPT.

Les invites de texte sont la façon dont les utilisateurs interagissent avec les modèles GPT. À l’instar de tous les modèles linguistiques génératifs, les modèles GPT essaient de produire la série de mots qui sont le plus susceptibles de suivre le texte précédent. C’est comme si l’on disait Quelle est la première chose qui vous vient à l’esprit quand je dis <prompt> ? Les exemples ci-dessous illustrent ce comportement. Quand il rencontre les premiers mots d’un contenu célèbre, le modèle est en mesure de poursuivre le texte avec précision.

Prompt	Completion
Il y a quatre-vingt-sept ans, nos	pères donnèrent naissance sur ce continent à une nouvelle nation conçue dans la liberté et vouée à la thèse selon laquelle tous les hommes sont créés égaux. […]
« Appelons-moi Ismaël. »	« Il y a quelque temps - le nombre exact des années n’a aucune importance -, n’ayant que peu ou point d’argent en poche, et rien qui me retînt spécialement à terre, l’idée me vint et l’envie me prit de naviguer quelque peu et de m’en aller visitant les étendues marines de ce monde. » [...]

À mesure que vous développez des invites plus complexes, il est utile de garder ce comportement fondamental à l’esprit. Quelle que soit l’invite fournie, le modèle répond simplement avec le contenu qui est, selon lui, le plus probable (compte tenu de ses données et de ses cibles d’entraînement). Si vous posez une question dans votre invite, le modèle ne suit pas un chemin de code de type « Q&A » distinct, il répond plutôt à la question, car une réponse est le type de réaction le plus probable pour la question donnée en tant qu’entrée.

Composants d’invite

Lorsque vous utilisez l’API Completion alors qu’il n’existe aucune différenciation entre les différentes parties de l’invite, il peut toujours être utile, à des fins d’apprentissage et de discussion, d’identifier les composants d’invite sous-jacents. Avec l’API Chat Completion, il existe des sections distinctes de l’invite qui sont envoyées à l’API sous la forme d’un tableau de dictionnaires avec des rôles associés : système, utilisateur et assistant. Ce guide se concentre plus généralement sur la façon d’envisager la construction des invites plutôt que de fournir des conseils prescriptifs spécifiques à une API plutôt qu’à une autre.

Il est également important de comprendre que, bien qu’il puisse y avoir d’autres moyens valides de disséquer les invites, l’objectif de cette décomposition est de fournir un moyen relativement simple d’envisager la construction des invites. Avec l’API Completion, tous les composants sont facultatifs, mais au moins un doit être présent et la plupart des invites incluent plusieurs composants. Il peut également y avoir une zone grise entre les composants. L’ordre présenté ci-dessous correspond approximativement à la fréquence d’utilisation de chaque composant, du plus fréquent au moins fréquent.

Instructions

Les instructions sont probablement le composant d’invite le plus couramment utilisé. Elles indiquent simplement au modèle ce qu’il faut faire. Ce concept est simple, mais, dans la pratique, les instructions peuvent être complexes. Le tableau ci-dessous illustre ce principe en montrant des instructions simples et plus complexes, sous deux formes différentes.

Type d’instruction	Prompt	Completion
Instructions simples	Rédiger une introduction pour un bulletin d’informations hebdomadaire.	Bienvenue dans notre bulletin d’informations hebdomadaire. Cette semaine, nous allons mettre l’accent sur la productivité. Nous allons partager des conseils et des astuces permettant d’améliorer votre productivité dans tous les secteurs de votre vie. Nous espérons qu’ils vous seront utiles. N’hésitez pas à les partager avec vos amis !
Instructions complexes	Rédiger une introduction pour un bulletin d’informations hebdomadaire à mon entreprise nommée Contoso. Elle doit mentionner la grande réunion que nous avons eue la semaine dernière et remercier l’équipe de son travail acharné au cours de ces derniers mois.	Bienvenue dans le bulletin d’informations hebdomadaire de Contoso ! La semaine dernière, nous avons eu une grande réunion et j’en profite pour remercier l’équipe de son travail acharné au cours de ces derniers mois. Notre avenir est radieux et je suis convaincu que nous réaliserons de grandes choses grâce au dévouement et à l’engagement de notre équipe. Je vous remercie de faire partie de notre équipe et j’ai hâte de travailler avec vous dans les semaines et les mois à venir. Cordialement, [Votre nom].
Instructions complexes	Rédiger une introduction pour un bulletin d’informations hebdomadaire, qui contient les éléments suivants : - Mon entreprise s’appelle Contoso - Salutations grandioses - Remerciements à l’équipe pour son travail acharné pendant ces derniers mois difficiles - Perspectives positives pour le trimestre à venir - Signature de la direction	Bonjour à tous les membres de l’équipe Contoso ! Je tenais à vous remercier de tout le travail que vous avez accompli au cours de ces derniers mois. Cette période a été difficile, mais vous avez tous fait un travail incroyable. Je suis très fier de chacun de vous. À l’approche du prochain trimestre, je suis empli de confiance. Je pense sincèrement que nous allons réaliser de grandes choses. Merci encore, la direction.

Contenu principal

Le contenu principal désigne du texte traité ou transformé par le modèle. Il est généralement utilisé avec des instructions. La traduction dans une autre langue est un exemple simple. Dans l’exemple ci-dessous, le texte anglais est considéré comme le contenu principal, tandis que « Traduire en français : » est une instruction.

Demander	Completion
Can you please tell me how to get to the museum? Traduire en français :	`Pouvez-vous s'il vous plaît me dire comment aller au musée?`

Le contenu principal peut également être beaucoup plus long. Dans l’exemple suivant, le contenu principal est la section d’introduction de l’entrée Wikipédia sur la complexité temporelle (en anglais), qui contient près de 300 mots. Ce contenu a été abrégé dans le tableau pour en faciliter l’affichage.

Prompt	Completion
In computer science, the time complexity is the computational complexity that describes the amount of computer time it takes to run an algorithm. Time complexity is commonly estimated by [...] Résumer le texte précédent en quelques phrases :	Time complexity is a measure of how long an algorithm takes to run. It is typically expressed as a function of the size of the input. The most common measure is worst-case time complexity, which is the maximum amount of time required for inputs of a given size.
In computer science, the time complexity is the computational complexity that describes the amount of computer time it takes to run an algorithm. Time complexity is commonly estimated by [...] `TL;DR` (Trop long, pas lu)	The time complexity of an algorithm is the amount of time it takes to run an algorithm. Time complexity is commonly estimated by counting the number of elementary operations performed by the algorithm, supposing that each elementary operation takes a fixed amount of time to perform. The time complexity is generally expressed as a function of the size of the input.

Les modèles GPT peuvent également gérer du contenu principal structuré. Dans l’exemple ci-dessous, un fichier TSV sur les bières belges (abrégé à des fins d’affichage dans cet article) est transmis au modèle dans le cadre de l’invite. Il est capable d’interpréter correctement le contenu et de répondre aux questions sur les données.

Prompt	Completion
`Belgian Beer Brands` `Beer name Beer style color ABV Brewery` `"Chimay Gold: ""Doree""" trappist pale ale gold 4.80% Chimay Brewery (official trappist)` `"Chimay Blue: ""Grande Reserve""" trappist dark ale dark 9.00%` […] En référence au tableau ci-dessus, combien de bières ont un degré d’alcool inférieur à 6 % ?	Dans le tableau, il y a 10 bières dont le degré d’alcool est inférieur à 6 %.

Exemples

Les invites réussies s’appuient souvent sur la pratique de l’apprentissage « en un coup » ou « en quelques coups ». Ce principe fait référence à l’inclusion d’un ou de plusieurs exemples du comportement souhaité du modèle, généralement en incluant des paires d’entrée et de sortie. Il ne s’agit pas d’un apprentissage dans le sens où le modèle est modifié de façon permanente. En lieu et place, les exemples conditionnent le modèle à répondre comme souhaité uniquement pour l’inférence actuelle. L’utilisation d’invites sans exemples est parfois appelée apprentissage « zéro coup ». Avec l’API Chat Completion, les exemples d’apprentissage en quelques coups sont généralement ajoutés au tableau de messages sous la forme d’exemples d’interactions utilisateur/assistant après le message système initial.

Type d’apprentissage	Prompt	Completion
Zéro coup	Titre : Le coach confiant que la blessure ne perturbera pas les Warriors Rubrique :	Le coach est confiant que la blessure ne perturbera pas la saison des Warriors. L’équipe reste concentrée sur ses objectifs et continuera à travailler dur pour les atteindre.
Quelques coups	Titre : Correa des Twins va faire appel à un agent libre Rubrique : Baseball Titre : Des zones de dégrisement prévues à la Coupe du monde au Qatar Rubrique : Football Titre : Yates : Actualité Fantasy Football - Semaine 6 Rubrique : Football américain Titre : Le coach confiant que la blessure ne perturbera pas les Warriors Rubrique :	Basket

L’exemple ci-dessus illustre l’utilité de l’apprentissage en quelques coups. Sans les exemples, le modèle semble deviner le comportement souhaité, tandis que les exemples montrent clairement au modèle comment procéder. Cela illustre également la puissance du modèle, qui peut déduire la catégorie d’étiquette souhaitée, même sans étiquette « basket » dans les exemples.

Signal

Les signaux servent de « coup d’envoi » pour la sortie du modèle, ce qui permet de diriger le modèle vers la sortie souhaitée. Il s’agit souvent d’un préfixe qui sert de base au modèle. Dans l’exemple ci-dessous, nous montrons le signal qui dirige l’histoire pour inclure des éléments clés. Les signaux sont souvent, mais pas toujours, utilisés avec des instructions. Dans les exemples ci-dessous, le modèle est utilisé pour résumer un long courrier d’annonce. Un indicateur est utilisé dans un cas pour vous aider à cibler la sortie du modèle et à suggérer un format de sortie spécifique (puces) dans l’autre.

Dans le contexte de l’API Chat Completion, les instructions prennent la forme du message système, et des exemples en quelques coups sont indiqués en fournissant une série d’exemples d’interactions utilisateur/assistant pour aider à amorcer le modèle.

Nombre d’indicateurs	Prompt	Completion
0	Les évaluations des performances sont un composant essentiel de l’approche Performances et développement de Contoso. […] Résumer le courrier ci-dessus :	L’objectif de cet e-mail est d’informer les employés des modifications récentes apportées à l’évaluation des performances, qui fait partie de l’approche Performances et développement de Contoso. Les modifications incluent une structure améliorée, une expérience utilisateur dans l’outil mise à niveau et des invites ciblées. De plus, il existe désormais une section de déclencheurs de conversation facultative qui permet aux employés de signaler les sujets dont ils souhaitent discuter avec leurs responsables.
1	Les évaluations des performances sont un composant essentiel de l’approche Performances et développement de Contoso. […] Résumer le courrier ci-dessus : Les informations principales du message sont	que Contoso améliore l’expérience d’évaluation des performances en la rendant plus axée sur les priorités, les attentes et l’impact. De plus, l’expérience utilisateur dans l’outil est mis à niveau avec des conseils, des ressources et des instructions. Enfin, le message contient des instructions sur l’activation des priorités fondamentales à l’échelle de l’entreprise.
2	Les évaluations des performances sont un composant essentiel de l’approche Performances et développement de Contoso. […] Résumer le courrier ci-dessus : Points essentiels : •	Contoso introduit des modifications dans l’expérience d’évaluation des performances à la suite des commentaires des employés. • Les modifications incluent une nouvelle perspective sur les priorités, les attentes et l’impact, une expérience utilisateur mise à niveau et de nouvelles instructions sur les priorités fondamentales à l’échelle de l’entreprise. • L’évaluation des performances est le moment de réfléchir aux performances passées et à l’apprentissage, ainsi que de planifier les priorités et les opportunités de croissance à venir. • Les employés et les responsables doivent rédiger leurs commentaires avant la réunion d’évaluation des performances. • Il devrait y avoir au moins deux évaluations des performances par an. • Le temps consacré à chaque évaluation doit rester identique.

Contenu de support

Le contenu de support désigne les informations que le modèle peut utiliser pour influencer la sortie d’une manière ou d’une autre. Il diffère du contenu principal en ce qu’il ne s’agit pas de la cible principale de la tâche, mais qu’il est généralement utilisé avec le contenu principal. Les exemples courants incluent les informations contextuelles telles que la date du jour, le nom et les préférences de l’utilisateur, etc. L’exemple ci-dessous utilise du contenu de support pour aider à organiser un ensemble d’ateliers planifiés pour l’utilisateur. Sans le contenu de support (rubriques importantes), le modèle répertorie simplement les ateliers (tronqués pour l’affichage). Quand il est informé des rubriques importantes, le modèle est en mesure de regrouper les réunions avec précision.

Contenu de prise en charge	Prompt	Completion
Sans	Liste des ateliers : Titre Description Lancement de l’atelier sur la planification Rejoignez-nous pour le lancement de notre atelier ! Écoutez ce que nos dirigeants disent sur les priorités et les apprentissages intergroupe pour l’année à venir. L’invitation à cet événement a déjà été envoyée à tous les [...] Résumer les ateliers ci-dessus, regroupés par rubrique :	Liste des ateliers : Lancement de l’atelier sur la planification - Résumé de l’atelier sur la planification - Rencontre principale - Perspectives orientées client - Impact et principaux domaines d’intérêt - Bonnes pratiques - Accélération de l’adoption des applications [...]
With	Liste des ateliers : Titre Description Lancement de l’atelier sur la planification Rejoignez-nous pour le lancement de notre atelier ! Écoutez ce que nos dirigeants disent sur les priorités et les apprentissages intergroupe pour l’année à venir. L’invitation à cet événement a déjà été envoyée à tous les [...] Mes rubriques importantes : ingénierie d’invite, recherche, modèles GPT Résumez les ateliers ci-dessus, regroupés en fonction de mes rubriques importantes :	1. Ingénierie d’invite : - Nouveaux conseils sur l’ingénierie d’invite - L’art de l’ingénierie d’invite 2. Recherche : - Introduction à la recherche vectorielle avec incorporation 3. Modèles GPT : - Introduction à GPT-4 - GPT-35-Turbo en détail.

Aide spécifique relative au scénario

Bien que les principes de l’ingénierie d’invite puissent être généralisés sur de nombreux types de modèles différents, certains modèles s’attendent à une structure d’invite spécialisée. Pour les modèles GPT Azure OpenAI, il existe actuellement deux API distinctes où l’ingénierie d’invite entre en jeu :

API de saisie semi-automatique de conversation.
API d’achèvement.

Chaque API nécessite une mise en forme différente des données d’entrée, ce qui a un impact sur la conception globale de l’invite. L’API Chat Completion prend en charge les modèles GPT-35-Turbo et GPT-4. Ces modèles sont conçus pour prendre en charge une entrée mise en forme dans une transcription de type conversation spécifique stockée dans un tableau de dictionnaires.

L’API d’achèvement de conversation prend en charge les anciens modèles GPT-3 et a des exigences d’entrée beaucoup plus flexibles puisqu’elle accepte une chaîne de texte sans règles de format spécifiques.

Les techniques de cette section vous enseignent des stratégies pour augmenter la précision et la base des réponses que vous générez avec un modèle LLM (Large Language Model). Toutefois, il est important de se rappeler que même lorsque vous utilisez efficacement l’ingénierie d’invite, vous devez toujours valider les réponses générées par les modèles. Le simple fait qu’une invite soigneusement conçue fonctionne bien pour un scénario particulier ne signifie pas nécessairement qu’elle s’adaptera de manière plus généralisée à certains cas d’usage. Il est tout aussi important de comprendre les limitations des LLM que de comprendre comment tirer parti de leurs atouts.

APIs de saisie semi-automatique de conversation
APIs d’achèvement

Ce guide ne passe pas en profondeur à la mécanique derrière la structure des messages pour les achèvements de conversation. Si vous n’êtes pas familiarisé avec les modèles d’achèvement de conversation par programmation, nous vous recommandons de lire notre guide pratique sur l’API Chat Completions.

Remarque

Tous les exemples de cette section du guide ont été testés sur un modèle GPT-4 de base en anglais. Si vous lisez une version localisée de cet article dans une autre langue, les réponses représentent une traduction localisée des résultats en anglais. Pour en savoir plus sur les limitations potentielles en fonction de la langue que vous utilisez pour l’invite du modèle, consultez notre note de transparence d’une IA responsable.

Apprentissage en quelques essais

Une façon courante d’adapter les modèles de langage aux nouvelles tâches consiste à utiliser l’apprentissage en quelques essais. Dans l’apprentissage en quelques essais, un ensemble d’exemples d’entraînement est fourni dans le cadre de l’invite pour donner davantage de contexte au modèle.

Lors de l’utilisation de l’API d’achèvement de conversation, une série de messages entre l’utilisateur et l’assistant (écrits dans le nouveau format d’invite) peuvent servir d’exemples pour l’apprentissage en quelques essais. Ces exemples peuvent être utilisés pour préparer le modèle à répondre d’une certaine manière, émuler des comportements particuliers et amorcer des réponses à des questions courantes.

Message système	Exemples d’apprentissage en quelques essais
L’assistant est un chatbot intelligent conçu pour aider les utilisateurs à répondre à leurs questions fiscales. Instructions - Réponds uniquement aux questions concernant les impôts. - Si tu n’es pas sûr d’une réponse, tu peux répondre "Je ne sais pas" ou "Je ne suis pas sûr" et recommander aux utilisateurs de se rendre sur le site web de l’IRS pour plus d’informations.	Utilisateur : "Quand dois-je déclarer mes impôts ?" Assistant - « En 2023, vous devrez déposer vos taxes d’ici le 18 avril. La date tombe après l’échéance habituelle du 15 avril, car le 15 avril tombe un samedi en 2023. Pour plus d’informations, consultez la page https://www.irs.gov/filing/individuals/when-to-file." Utilisateur : "Comment puis-je vérifier l’état de mon remboursement d’impôt ?" Assistant : "Vous pouvez vérifier l’état de votre remboursement d’impôt en consultant la page https://www.irs.gov/refunds."

Message système

Exemples d’apprentissage en quelques essais

L’assistant est un chatbot intelligent conçu pour aider les utilisateurs à répondre à leurs questions fiscales.
Instructions
- Réponds uniquement aux questions concernant les impôts.
- Si tu n’es pas sûr d’une réponse, tu peux répondre "Je ne sais pas" ou "Je ne suis pas sûr" et recommander aux utilisateurs de se rendre sur le site web de l’IRS pour plus d’informations.

Utilisateur : "Quand dois-je déclarer mes impôts ?"
Assistant - « En 2023, vous devrez déposer vos taxes d’ici le 18 avril. La date tombe après l’échéance habituelle du 15 avril, car le 15 avril tombe un samedi en 2023. Pour plus d’informations, consultez la page https://www.irs.gov/filing/individuals/when-to-file."

Utilisateur : "Comment puis-je vérifier l’état de mon remboursement d’impôt ?"
Assistant : "Vous pouvez vérifier l’état de votre remboursement d’impôt en consultant la page https://www.irs.gov/refunds."

Le tableau ci-dessus décrit la structure d’invite de base, mais pour une explication détaillée du format d’invite exact, vous devez faire référence au guide de saisie semi-automatique de conversation.

Scénarios non conversationnels

Bien que l’API d’achèvement de conversation soit optimisée pour fonctionner avec des conversations à plusieurs répliques, elle peut également être utilisée pour des scénarios non conversationnels. Par exemple, pour un scénario d’extraction d’entités, vous pouvez utiliser cette invite :

Message système	Utilisateur	Assistant
Vous êtes un assistant conçu pour analyser les sentiments à partir de données vocales. Les utilisateurs collent une chaîne de texte et vous répondez avec une évaluation de la réponse de l’orateur. L’évaluation se fait sur une échelle de 1 à 10 (10 étant l’évaluation la plus élevée). Explique la raison de cette évaluation.	bonjour merci d’avoir appelé la pharmacie contoso à qui ai-je le plaisir de parler je comprends votre frustration mary pouvez-vous me dire ce que vous voulez exactement d’accord je vérifierai ça pour vous avec plaisir un moment s’il vous plaît je vois ici que vous utilisiez une forme générique de lipitor c’est bien ça d’accord donc je vois que votre médecin a arrêté de vous prescrire ce médicament en 2021 d’accord oui je serais heureux de vérifier ça pour vous parce que parfois il y a un écart dans le système et ce n’est pas signalé alors laissez-moi jeter un coup d’œil juste un moment alors je vois ici que votre médecin vous a prescrit ces médicaments de 2012 à 2021 d’accord oui d’après les derniers dossiers fournis par le cabinet du médecin vous prenez maintenant un autre médicament metformine si vous souhaitez nous pouvons vous renouveler cette prescription et vous pouvez venir chercher votre metformine 500 mg avec plaisir mary y a-t-il autre chose que je puisse faire pour vous aider aujourd’hui.	Évaluation des sentiments : 8 L’orateur dans ce texte semble poli, serviable et patient tout en répondant aux préoccupations du client. Il prend le temps de vérifier les informations, de fournir des explications claires et de proposer son aide. Toutefois, l’évaluation n’est pas un 10, car il existe toujours un indice d’incertitude dans certaines parties de la conversation, ce qui peut ne pas transmettre une confiance totale au client.

Commencer par des instructions claires

Les informations de séquence s’affichent dans l’invite. En effet, les modèles de style GPT sont générés d’une certaine manière qui définit la façon dont ils traitent l’entrée. Notre recherche suggère que le fait de dire au modèle la tâche que vous souhaitez qu’il effectue au début de l’invite, avant de partager des informations contextuelles ou des exemples supplémentaires, peut aider à produire des sorties de meilleure qualité.

Notes

Bien que l’application de cette technique reste généralement recommandée, contrairement aux versions de modèle précédentes (GPT-3 et versions antérieures), nos tests ont montré que la réponse avec les modèles ChatGPT et GPT-4 était la même, peu importe la technique utilisée. Dans l’exemple ci-dessous, nous constatons que l’ajout de l’instruction "Plusieurs sources … importante" au début ou à la fin de l’invite n’a pas entraîné de modification dans la réponse finale du modèle.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Ta tâche consiste à vérifier si l’énoncé "Plusieurs sources mentionnent le risque d’une autre éruption importante" est confirmé par une citation spécifique parmi les extraits suivants. --- EXTRAITS [1] 14 pour cent de chances de méga-séisme à Seattle, les experts affirment SEATTLE - Il y a 14 pour cent de chances qu’un séisme de magnitude 9 en provenance de la zone de Cascadia frappe Seattle dans les 50 prochaines années, estime l’Institut d'études géologiques des États-Unis. « Malheureusement, nous ne pouvons pas... [2] Les experts en séisme ont exposé les dernières perspectives quant au vrai "Big One" qui pourrait frapper Seattle "Il y a environ 14 % de chances qu’un autre séisme de magnitude 9 se produise dans les 50 prochaines années", a déclaré un géophysicien de l’Université de Washington... --- L’énoncé "Plusieurs sources mentionnent le risque d’une autre éruption importante" est-il directement suggéré ou affirmé dans les extraits ?	Non, l’instruction n’est pas directement implicite ou indiquée par les extraits de code. Les extraits de code mentionnent une chance d’un « mégaquake » et d’un « séisme de magnitude 9 Cascadia » qui frappe Seattle au cours des 50 prochaines années, mais ne mentionnent pas une chance d’une autre éruption importante.

Répéter les instructions à la fin

Les modèles peuvent être sensibles à un biais de récence, ce qui, dans ce contexte, signifie que les informations placées à la fin de l’invite peuvent avoir une influence plus significative sur la sortie que les informations placées au début de l’invite. Par conséquent, il est utile de répéter les instructions à la fin de l’invite et d’évaluer l’impact sur la réponse générée.

Préparer la sortie

Cela fait référence à l’inclusion de quelques mots ou phrases à la fin de l’invite afin d’obtenir du modèle une réponse qui suit la forme souhaitée. Par exemple, l’utilisation d’une indication telle que “Here’s a bulleted list of key points:\n- ” permet de s’assurer que la sortie est mise en forme en tant que liste de puces.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations. Réponds en utilisant le moins de mots possible.	John Smith est marié à Lucy Smith. Ils ont cinq enfants et il travaille comme ingénieur logiciel chez Microsoft. Quelles requêtes de recherche dois-je effectuer pour vérifier cela ? ## L’une des requêtes de recherche possibles est la suivante :	"John Smith marié à Lucy Smith cinq enfants ingénieur logiciel Microsoft"

Dans l’invite ci-dessus, le texte L’une des requêtes de recherche possibles est la suivante : demande au modèle de produire une seule sortie. Sans cette indication, le modèle produit plusieurs requêtes de recherche.

Ajouter une syntaxe claire

L’utilisation d’une syntaxe claire pour votre invite (y compris la ponctuation, les en-têtes et les marqueurs de section) permet de communiquer l’intention et facilite souvent l’analyse des sorties.

Dans l’exemple ci-dessous, des séparateurs (--- dans ce cas) ont été ajoutés entre différentes sources d’informations ou étapes. Cela permet d’utiliser --- comme condition d’arrêt pour la génération. En outre, les en-têtes de section ou les variables spéciales sont présentés en majuscules pour les différencier.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Vous allez lire un paragraphe, puis émettre des requêtes sur un moteur de recherche afin de le vérifier en fait. Explique également les requêtes. --- PARAGRAPHE John Smith est marié à Lucy Smith. Ils ont cinq enfants et il travaille comme ingénieur logiciel chez Microsoft. Quelles requêtes de recherche dois-je effectuer pour vérifier cela ? --- QUERIES	1. "John Smith Microsoft" : pour vérifier si John Smith est effectivement employé chez Microsoft. 2. "John Smith Lucy Smith" : pour vérifier si John Smith est marié à Lucy Smith. 3. "John Smith enfants" : pour vérifier si John Smith a cinq enfants.

Si vous ne savez pas quelle syntaxe utiliser, envisagez d’utiliser Markdown ou XML. Les modèles ont été formés sur un contenu web volumineux en XML et Markdown, ce qui peut fournir de meilleurs résultats.

Décomposer la tâche

Les modèles de langage volumineux (LLM) fonctionnent souvent mieux si la tâche est décomposée en étapes plus petites. Par exemple, dans l’invite de requête de recherche référencée précédemment, l’invite peut être structurée de manière différente afin que le modèle soit d’abord chargé d’extraire les faits pertinents, puis de générer des requêtes de recherche pouvant être utilisées pour vérifier ces faits.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Vous allez lire un paragraphe, puis émettre des requêtes sur un moteur de recherche afin de le vérifier en fait. --- PARAGRAPHE John Smith est marié à Lucy Smith. Ils ont cinq enfants et il travaille comme ingénieur logiciel chez Microsoft. Quelles requêtes de recherche dois-je effectuer pour vérifier cela ? --- Vous allez maintenant extraire des revendications factuelles et émettre des requêtes pour les vérifier. Lors de la formulation d’une requête, utilisez la fonction RECHERCHE("requête") AFFIRMATIONS FACTUELLES	1. John Smith est marié à Lucy Smith 2. Ils ont cinq enfants 3. Il travaille en tant qu’ingénieur logiciel chez Microsoft QUERIES RECHERCHE("John Smith marié Lucy Smith") RECHERCHE("John Smith nombre enfants") RECHERCHE("John Smith ingénieur logiciel Microsoft")

Notez l’utilisation d’une syntaxe claire pour différencier les sections et préparer la sortie. Dans cet exemple simple, la rupture de la tâche d’une à deux étapes n’est pas très dramatique, mais lorsque vous essayez de le faire pour une plus grande partie du texte avec de nombreuses revendications factuelles, la décomposition de la tâche peut faire une différence significative.

Utiliser des affordances

Parfois, nous pouvons faire en sorte que le modèle utilise une affordance au lieu de s’appuyer sur ses propres paramètres pour obtenir des informations et des réponses. La recherche, par exemple, peut être une affordance pour aider à diminuer les réponses fabriquées et à obtenir des informations à jour.

Une façon simple d’utiliser une affordance consiste à arrêter la génération une fois que les appels d’affordance sont générés par le modèle, puis à coller les résultats dans l’invite. Vous trouverez ci-dessous un exemple d’appel de suivi possible après avoir effectué les appels RECHERCHE ci-dessus. Notez comment nous avons collé les résultats de la recherche dans l’invite et remplacé les appels RECHERCHE précédents.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Vous allez lire un paragraphe, extraire des revendications factuelles, puis utiliser les résultats du moteur de recherche pour les vérifier. --- PARAGRAPHE John Smith est marié à Lucy Smith. Ils ont cinq enfants et il travaille comme ingénieur logiciel chez Microsoft. Quelles requêtes de recherche dois-je effectuer pour vérifier cela ? --- AFFIRMATIONS FACTUELLES - John Smith est marié à Lucy Smith - John et Lucy ont cinq enfants - John travaille en tant qu’ingénieur logiciel chez Microsoft --- Voici différentes requêtes de recherche émises pour vérifier les affirmations ci-dessus : REQUÊTES DE RECHERCHE - John Smith marié à Lucy Smith - John Smith nombre d’enfants - John Smith ingénieur logiciel Microsoft --- Voici des extraits des résultats de la recherche : EXTRAITS : [1] … Le mariage de John Smith a eu lieu le 25 septembre 2012 … [2] … John Smith était accompagné de sa femme Lucy à une fête [3] John est allé au match de football en compagnie de ses deux filles et trois fils [4] … Après avoir passé 10 ans chez Microsoft, Smith a fondé sa propre start-up, Tailspin Toys [5] John M est le forgeron de la ville, et il a épousé Fiona. Ils ont une fille nommée Lucy --- Compte tenu des extraits, vérifie chacune des affirmations factuelles ci-dessus :	- John Smith est marié à Lucy Smith : Confirmé. Les extraits [1] et [2] mentionnent que la femme de John Smith s’appelle Lucy. - John et Lucy ont cinq enfants : Confirmé. L’extrait [3] mentionne que John était accompagné de ses deux filles et de ses trois fils. - John travaille en tant qu’ingénieur logiciel chez Microsoft : Partiellement confirmé. L’extrait de code [4] mentionne que John a passé 10 ans chez Microsoft, mais il n’indique pas explicitement qu’il y travaille actuellement. D’autres recherches pourraient être nécessaires pour confirmer son statut actuel d’emploi.

Invites en chaîne de pensée

Il s’agit d’une variante de la technique de décomposition de la tâche. Au lieu de fractionner une tâche en étapes plus petites, dans cette approche, il est demandé à la réponse du modèle de procéder pas à pas et de présenter toutes les étapes impliquées. Cela réduit le risque d’inexactitude des résultats et facilite l’évaluation de la réponse du modèle.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Qui a été l’athlète individuel le plus médaillé (maximum de médailles) aux Jeux olympiques qui ont eu lieu à Sydney ? Réponds en suivant une approche pas à pas, cite les sources et argumente avant de donner la réponse finale au format ci-dessous : la RÉPONSE est : `<name>`	Étape 1 : Déterminer l’année des Jeux Olympiques de Sydney. Les Jeux olympiques de Sydney ont eu lieu en l’an 2000. Étape 2 : Trouver la liste des athlètes individuels qui ont remporté plusieurs médailles aux Jeux olympiques de Sydney en l’an 2000. Selon le site officiel des Jeux olympiques, plusieurs athlètes individuels ont remporté plusieurs médailles aux Jeux olympiques de Sydney en l’an 2000. Voici quelques-uns des noms notables : • Ian Thorpe (Australie) : 3 médailles d’or, 2 médailles d’argent, 0 médailles de bronze • Pieter van den Hoogenband (Pays-Bas) : 2 médailles d’or, 0 médailles d’argent, 2 médailles de bronze • Lenny Krayzelburg (États-Unis) : 3 médailles d’or, 0 médailles d’argent, 0 médailles de bronze • Inge de Bruijn (Pays-Bas) : 3 médailles d’or, 1 médaille d’argent, 0 médailles de bronze Étape 3 : Déterminer l’athlète qui a remporté le plus de médailles. Après avoir examiné la liste des athlètes individuels qui ont remporté plusieurs médailles aux Jeux olympiques de Sydney en l’an 2000, on peut voir que l’athlète ayant obtenu le plus de médailles est l’Australien Ian Thorpe, qui a remporté un total de 5 médailles (3 médailles d’or et 2 médailles d’argent). Par conséquent, la RÉPONSE est : Ian Thorpe.

Spécification de la structure de sortie

L’utilisation de votre invite pour spécifier la structure de la sortie peut avoir un effet significatif sur la nature et la qualité des résultats. Parfois, les entrées de message système comme « écrivent uniquement des faits vrais » ou « ne fabriquent pas d’informations » peuvent ne pas être des atténuations adéquates. Au lieu de cela, en demandant à la réponse du modèle d’inclure également des citations, il est possible de réduire la prévalence de réponses incorrectes.

Si vous demandez au modèle de citer le matériel source lorsqu’il formule un énoncé, les énoncés sont beaucoup plus susceptibles de s’appuyer sur des fondements. Le fait de demander des citations fait en sorte que le modèle effectue deux erreurs chaque fois qu’il génère une réponse : la première erreur est la réponse fabriquée et la seconde, la citation incorrecte. Notez que plus la citation est proche du texte qu’elle supporte, plus la distance nécessaire au modèle pour anticiper la citation est courte, ce qui suggère que l’inclusion de citations fournit de meilleures atténuations pour la génération de faux contenu que les citations à la fin du contenu.

De même, si vous demandez au modèle d’extraire des énoncés factuels d’un paragraphe, il peut extraire des instructions composées telles que « X effectue Y AND Z » (ce qui peut être plus difficile à vérifier). Cela peut être évité en spécifiant une structure de sortie telle que (entité1, relation, entité2).

Les exemples ci-dessous montrent l’utilisation de citations et l’ajustement de la réponse du modèle à une structure définie.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations	Répertorie les différents comportements présentés par l’agent de support technique dans la conversation suivante. --- bonjour merci d’avoir appelé la pharmacie contoso à qui ai-je le plaisir de parler je comprends votre frustration mary pouvez-vous me dire ce que vous voulez exactement d’accord je vérifierai ça pour vous avec plaisir un moment s’il vous plaît je vois ici que vous utilisiez une forme générique de lipitor c’est bien ça d’accord donc je vois que votre médecin a arrêté de vous prescrire ce médicament en 2021 d’accord oui je serais heureux de vérifier ça pour vous parce que parfois il y a un écart dans le système et ce n’est pas signalé alors laissez-moi jeter un coup d’œil juste un moment alors je vois ici que votre médecin vous a prescrit ces médicaments de 2012 à 2021 d’accord oui d’après les derniers dossiers fournis par le cabinet du médecin vous prenez maintenant un autre médicament metformine si vous souhaitez nous pouvons vous renouveler cette prescription et vous pouvez venir chercher votre metformine 500 mg avec plaisir mary y a-t-il autre chose que je puisse faire pour vous aider aujourd’hui. --- Comment la réponse de l’agent du support technique a-t-elle été ? Classifie et répertorie ses différents comportements et cite la raison de la classification, en utilisant le format COMPORTEMENT("raison")	1. Accueil poli, COMPORTEMENT("L’agent démarre la conversation par une formule de salutation polie et demande le nom de la personne qui appelle") 2. Empathique, COMPORTEMENT("L’agent reconnaît la frustration de Mary et tente de comprendre ses inquiétudes") 3. Attentif, COMPORTEMENT("L’agent écoute le problème du client et demande plus de détails") 4. Proactif, COMPORTEMENT("L’agent propose de vérifier le problème pour le client") 5. Informatif, COMPORTEMENT("L’agent fournit les informations pertinentes sur l’historique des ordonnances du client") 6. Rigoureux, COMPORTEMENT("L’agent recherche les lacunes possibles dans le système et fournit une réponse complète") 7. Corroborant, COMPORTEMENT("L’agent confirme le médicament actuel avec le client") 8. Orienté solution, COMPORTEMENT("L’agent propose de remplir la nouvelle prescription pour le client") 9. Courtois, COMPORTEMENT("L’agent remercie le client et offre une assistance supplémentaire si nécessaire")

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations.	Regroupe les titres d’actualités suivants par catégorie de sujet en fonction des tendances retrouvées dans le texte. Expose aussi le raisonnement qui se cache derrière la façon dont ces catégories ont été définies. Format de sortie : { "NOM_SUJET": "", "TITRES": [], "RAISONNEMENT": "" } Titres d’actualités d’entrée : 1. "Des livres aux présentations en 10 s avec AR + ML" 2. "Démonstration de 1993 de Yann LeCun, 32 ans, montrant le premier réseau convolutif au monde pour la reconnaissance de texte" 3. "First Order Motion Model appliqué à l’animation des peintures" 4. "Robinhood et d’autres courtiers qui bloquent l’achat de $GME, $NOK, $BB, $AMC autorisent les ventes" 5. "L’action United Airlines a baissé de plus de 5 % avant l’ouverture du marché" Sortie :	{ "INTELLIGENCE_ARTIFICIELLE": { "TITRES": [ "Des livres aux présentations en 10 s avec AR + ML", "Démonstration de 1993 de Yann LeCun, 32 ans, montrant le premier réseau convolutif au monde pour la reconnaissance de texte", "First Order Motion Model appliqué à l’animation des peintures" ], "RAISONNEMENT": "Ces titres sont liés à l’intelligence artificielle, au Machine Learning et à leurs applications dans divers domaines." }, "MARCHÉS_FINANCIERS": { "TITRES": [ "Robinhood et d’autres courtiers qui bloquent l’achat de $GME, $NOK, $BB, $AMC autorisent les ventes", "L’action United Airlines a baissé de plus de 5 % avant l’ouverture du marché", "Le bitcoin a approché les 20 000 $ il y a un an aujourd’hui" ], "RAISONNEMENT": "Ces titres concernent les marchés financiers, les actions, les crypto-monnaies et les plateformes de négociation." } }

Paramètres de température et Top_p

La modification du paramètre de température modifie la sortie du modèle. Le paramètre de température peut être défini entre 0 et 2. Une valeur plus élevée, par exemple 0,7, rend la sortie plus aléatoire et produit des réponses plus divergentes, tandis qu’une valeur inférieure, comme. 0.2, rend la sortie plus ciblée et plus concrète. Une histoire fictive pourrait être générée à l’aide d’une température plus élevée. Au contraire, pour générer un document juridique, il est recommandé d’utiliser une température beaucoup plus basse. Top_probability est un autre paramètre similaire à la température, car il contrôle également le caractère aléatoire de la réponse du modèle, mais il le fait d’une manière différente. La recommandation générale est de modifier l’un de ces deux paramètres à la fois, et non les deux.

Fournir un contexte de base

L’un des moyens les plus efficaces pour fournir des réponses fiables consiste à fournir au modèle des données à partir desquelles il peut concevoir ses réponses (données de base). Si votre cas d’usage repose sur des informations fiables et à jour et n’est pas un scénario purement créatif, nous vous recommandons vivement de fournir des données de base. En général, plus vous pouvez obtenir votre matériel source à la forme finale de la réponse souhaitée, moins le modèle doit faire, ce qui signifie qu’il y a moins d’opportunités d’erreur. Voici un exemple où le système est fourni un blog récent décrivant le lancement de GPT-4 dans Azure OpenAI Service, et demandé de nommer certains de ses premiers clients.

Message système	Utilisateur	Assistant
Vous êtes un assistant IA qui aide les personnes à trouver des informations. Vous fournirez des réponses exclusivement à partir du texte ci-dessous et répondez en 100 mots ou moins : « Chez Microsoft, nous découvrons constamment de nouvelles façons de libérer de la créativité, de déverrouiller la productivité et des compétences de niveau supérieur afin que plus de personnes puissent tirer parti de l’IA. Cela permet à nos clients de ... … réduisant ainsi la probabilité que le modèle génère une réponse néfaste. »¹ Réponds en 100 mots ou moins. Utilise des listes à puces dans la mesure du possible.	Qui sont les premiers clients des modèles GPT-4 de Azure OpenAI Service ?	Voici quelques-uns des premiers clients des modèles GPT-4 de Azure OpenAI Service : - Epic Healthcare : Ils prévoient d’utiliser GPT-4 pour aider les médecins et les infirmières à consacrer moins de temps à la saisie et à l’investigation des données. - Coursera : Ils utilisent Azure OpenAI Service avec GPT-4 pour créer une expérience d’apprentissage basée sur l’IA sur leur plateforme. - Coca-Cola : Ils utilisent Azure OpenAI pour créer un hub de connaissances et planifier l’utilisation des capacités modales de GPT-4 pour le marketing, la publicité, les relations publiques et les relations client. - D’autres entreprises de toutes tailles utilisent Azure AI pour améliorer l’expérience client, résumer les contenus longs, aider à écrire des logiciels et réduire les risques en prédisant les données fiscales appropriées.

¹ Texte du blog de lancement de GPT-4 d’Azure OpenAI.

Remarque

Tous les exemples de cette section du guide ont été testés avec le modèle gpt-35-turbo-instruct en anglais. Si vous lisez une version localisée de cet article dans une autre langue, les réponses représentent une traduction localisée des résultats en anglais. Pour en savoir plus sur les limitations potentielles en fonction de la langue que vous utilisez pour l’invite du modèle, consultez notre note de transparence d’une IA responsable.

Commencer par des instructions claires

La séquence d’ajout des informations dans l’invite est importante. Notre recherche suggère que le fait de dire au modèle la tâche que vous souhaitez qu’il effectue au début de l’invite, avant de partager des informations contextuelles ou des exemples supplémentaires, peut aider à produire des sorties de meilleure qualité.

Dans le premier exemple ci-dessous, une partie clé des instructions est partagée uniquement à la fin, donnant un résultat incorrect.

Prompt Completion

Your task is to verify if a statement is supported by a specific quote from the following set of snippets.
---
SNIPPETS
[1] 14 percent chance of megaquake hitting Seattle, experts say SEATTLE - There's a 14 percent chance of a magnitude 9 Cascadia earthquake hitting Seattle in the next 50 years, the U.S. Geological Survey estimates. "Unfortunately, we are unable to...

[2] Earthquake experts lay out latest outlook for Seattle's 'Really Big One’
“We say that there's approximately a 14% chance of another approximately magnitude-9 earthquake occurring in the next 50 years,” said a geophysicist at the University of Washington... Yes, the statement is directly implied by the snippets.

Prompt	Completion
`Your task is to verify if a statement is supported by a specific quote from the following set of snippets`. --- `SNIPPETS` `[1] 14 percent chance of megaquake hitting Seattle, experts say SEATTLE - There's a 14 percent chance of a magnitude 9 Cascadia earthquake hitting Seattle in the next 50 years, the U.S. Geological Survey estimates. "Unfortunately, we are unable to...` `[2] Earthquake experts lay out latest outlook for Seattle's 'Really Big One’` `“We say that there's approximately a 14% chance of another approximately magnitude-9 earthquake occurring in the next 50 years,” said a geophysicist at the University of Washington...`	`Yes, the statement is directly implied by the snippets.`

Dans l’exemple suivant, nous donnons l’énoncé exact que nous voulons vérifier ("Plusieurs sources mentionnent le risque d’une autre éruption") avant de donner le contexte de l’extrait. Cela permet aux représentations de jeton extraites des extraits de code d’être adaptées à l’instruction que nous vérifions. À présent, la réponse du modèle qui en résulte est exacte :

Prompt Completion

Your task is to verify if the statement "Several sources mention a chance of another large eruption" is supported by a specific quote from the following set of snippets.
---
SNIPPETS
[1] 14 percent chance of megaquake hitting Seattle, experts say SEATTLE - There's a 14 percent chance of a magnitude 9 Cascadia earthquake hitting Seattle in the next 50 years, the U.S. Geological Survey estimates. "Unfortunately, we are unable to...

[2] Earthquake experts lay out latest outlook for Seattle's 'Really Big One’ “We say that there's approximately a 14% chance of another approximately magnitude-9 earthquake occurring in the next 50 years,” said a geophysicist at the University of Washington...
---
**Is the statement "Several sources mention a chance of another large eruption" directly implied or stated by the snippets?** No, the statement is not directly implied or stated by the snippets. The snippets mention a chance of a "megaquake" and a "magnitude 9 Cascadia earthquake" hitting Seattle in the next 50 years, but do not mention a chance of another large eruption.

Prompt	Completion
`Your task is to verify if the statement "Several sources mention a chance of another large eruption" is supported by a specific quote from the following set of snippets.` --- `SNIPPETS` `[1] 14 percent chance of megaquake hitting Seattle, experts say SEATTLE - There's a 14 percent chance of a magnitude 9 Cascadia earthquake hitting Seattle in the next 50 years, the U.S. Geological Survey estimates. "Unfortunately, we are unable to...` `[2] Earthquake experts lay out latest outlook for Seattle's 'Really Big One’<br>“We say that there's approximately a 14% chance of another approximately magnitude-9 earthquake occurring in the next 50 years,” said a geophysicist at the University of Washington...` --- `Is the statement "Several sources mention a chance of another large eruption" directly implied or stated by the snippets?`	`No, the statement is not directly implied or stated by the snippets. The snippets mention a chance of a "megaquake" and a "magnitude 9 Cascadia earthquake" hitting Seattle in the next 50 years, but do not mention a chance of another large eruption.`

Répétition des instructions à la fin

Les modèles peuvent être sensibles à un biais de récurrence, ce qui signifie que les informations à la fin de l’invite peuvent avoir une influence plus significative sur la sortie que les informations au début de l’invite. Par conséquent, il est utile de répéter les instructions à la fin de l’invite et d’évaluer l’impact sur votre cas d’usage.

Nous avons vu dans l’exemple précédent comment la répétition de l’instruction au début et à la fin de l’invite conduit à une probabilité plus élevée d’obtenir une réponse précise du modèle.

Préparer la sortie

Prompt	Completion
`John Smith is married to Lucy Smith. They have five kids, and he works as a software engineer at Microsoft. What search queries should I do to fact-check this?` `##` `One possible search query is:`	`"John Smith Microsoft software engineer"` `Another possible search query is: "Lucy Smith married to John Smith"` `A third possible search query is: "John Smith family size".`

Dans l’invite ci-dessus, le texte "L’une des requêtes de recherche possibles est la suivante :" suggère au modèle de produire une sortie sous forme de requête de recherche. Cette technique peut aider à supprimer les atténuations que le modèle généralement ajoute, telles que "Une possibilité est...".

Ajouter une syntaxe claire

Prompt	Completion
`You will read a paragraph, and then issue queries to a search engine in order to fact-check it. Also explain the queries.` `---` `PARAGRAPH` `John Smith is married to Lucy Smith. They have five kids, and he works as a software engineer at Microsoft. What search queries should I do to fact-check this?` `---` `QUERIES`	`1. "John Smith Microsoft" - To check if John Smith is indeed employed at Microsoft.` `2. "John Smith Lucy Smith" - To check if John Smith is married to Lucy Smith.` `3. "John Smith children" - To check if John Smith has five children.`

Si vous ne savez pas quelle syntaxe utiliser, envisagez d’utiliser markdown ou XML, car des modèles de langage volumineux ont été entraînés sur un grand nombre de contenu web en XML ou markdown.

Décomposer la tâche

Les modèles fonctionnent souvent mieux si la tâche est décomposée en étapes plus petites. Par exemple, dans l’invite de requête de recherche référencée précédemment, l’invite peut être structurée de manière différente afin que le modèle soit d’abord chargé d’extraire les faits pertinents, puis de générer des requêtes de recherche pouvant être utilisées pour vérifier ces faits.

Prompt Completion

You will read a paragraph, and then issue queries to a search engine in order to fact-check it.
---
PARAGRAPH
John Smith is married to Lucy Smith. They have five kids, and works as a software engineer at Microsoft. What search queries should I do to fact-check this?
---
Now you will extract factual claims, and issue queries to fact-check them. When issuing a query, use the function SEARCH("query")

FACTUAL CLAIMS`` | 1. John Smith est marié à Lucy Smith  2. Ils ont cinq enfants 3. John travaille en tant qu’ingénieur logiciel chez Microsoft

REQUÊTES
SEARCH("John Smith married Lucy Smith") SEARCH("John Smith family size") SEARCH("John Smith Microsoft software engineer")`

Prompt	Completion
`You will read a paragraph, and then issue queries to a search engine in order to fact-check it.` `---` `PARAGRAPH` `John Smith is married to Lucy Smith. They have five kids, and works as a software engineer at Microsoft. What search queries should I do to fact-check this?` `---` `Now you will extract factual claims, and issue queries to fact-check them. When issuing a query, use the function SEARCH("query")` FACTUAL CLAIMS`` \| 1. John Smith est marié à Lucy Smith `<br>`2. Ils ont cinq enfants`<br>`3. John travaille en tant qu’ingénieur logiciel chez Microsoft REQUÊTES SEARCH("John Smith married Lucy Smith")`<br>`SEARCH("John Smith family size")`<br>`SEARCH("John Smith Microsoft software engineer")`

Notez l’utilisation d’une syntaxe claire pour différencier les sections et préparer la sortie. Dans cet exemple simple, l’effet de la décomposition de la tâche en deux étapes n’est pas si remarquable, mais lorsque vous essayez de le faire pour un texte plus volumineux comportant de nombreuses affirmations factuelles, la décomposition de la tâche peut faire une énorme différence.

Utiliser des affordances

Prompt Completion

You will read a paragraph, extract factual claims, and then use search engine results to fact-check them
---
PARAGRAPH
John Smith is married to Lucy Smith. They have five kids, and he works as a software engineer at Microsoft. What search queries should I do to fact-check this?
---
FACTUAL CLAIMS
- John Smith is married to Lucy Smith
- John and Lucy have five kids
- John works as a software engineer at Microsoft
---
Here are various search queries issued to research the claims above:
SEARCH QUERIES
- John Smith married to Lucy Smith
- John Smith number of children
- John Smith software engineer Microsoft
---
Here are snippets of the search results: SNIPPETS:
[1] … John Smith’s wedding was on September 25, 2012 …
[2] … John Smith was accompanied by his wife Lucy to a party
[3]John was accompanied to the soccer game by his two daughters and three sons
[4] … After spending 10 years at Microsoft, Smith founded his own startup, Tailspin Toys
5] John M is the town smith, and he married Fiona. They have a daughter named Lucy
---
Given the snippets, fact check each of the factual claims above: - John Smith is married to Lucy Smith: Confirmed. Snippet [1] and [2] both mention John Smith's wife as Lucy.
- John and Lucy have five kids: Confirmed. Snippet [3] mentions that John was accompanied by his two daughters and three sons.
- John works as a software engineer at Microsoft: Partially confirmed. Snippet [4] mentions that John spent 10 years at Microsoft, but it does not explicitly state that he currently works there. Further research might be needed to confirm his current employment status.

Prompt	Completion
`You will read a paragraph, extract factual claims, and then use search engine results to fact-check them` `---` `PARAGRAPH` `John Smith is married to Lucy Smith. They have five kids, and he works as a software engineer at Microsoft. What search queries should I do to fact-check this?` `---` `FACTUAL CLAIMS` `- John Smith is married to Lucy Smith` `- John and Lucy have five kids` `- John works as a software engineer at Microsoft` `---` `Here are various search queries issued to research the claims above:` `SEARCH QUERIES` `- John Smith married to Lucy Smith` `- John Smith number of children` `- John Smith software engineer Microsoft` `---` `Here are snippets of the search results:<br>SNIPPETS:` `[1] … John Smith’s wedding was on September 25, 2012 …` `[2] … John Smith was accompanied by his wife Lucy to a party` `[3]John was accompanied to the soccer game by his two daughters and three sons` `[4] … After spending 10 years at Microsoft, Smith founded his own startup, Tailspin Toys` `5] John M is the town smith, and he married Fiona. They have a daughter named Lucy` `---` `Given the snippets, fact check each of the factual claims above:`	`- John Smith is married to Lucy Smith: Confirmed. Snippet [1] and [2] both mention John Smith's wife as Lucy.` `- John and Lucy have five kids: Confirmed. Snippet [3] mentions that John was accompanied by his two daughters and three sons.` `- John works as a software engineer at Microsoft: Partially confirmed. Snippet [4] mentions that John spent 10 years at Microsoft, but it does not explicitly state that he currently works there. Further research might be needed to confirm his current employment status.`

Invites en chaîne de pensée

Prompt Completion

Who was the most decorated (maximum medals) individual athlete in the Olympic games that were held at Sydney? Take a step-by-step approach in your response, cite sources and give reasoning before sharing final answer in the below format: ANSWER is: <name> Step 1: Researching the most decorated individual athlete in the Olympic games that were held at Sydney
Step 2: According to the Sydney 2000 Olympic Games official website, the most decorated individual athlete in the Olympic games that were held at Sydney was Ian Thorpe from Australia. He won five medals (three gold and two silver) in swimming events.
Step 3: According to the International Olympic Committee, Thorpe was the most decorated individual athlete in the Olympic games that were held at Sydney.
Answer: Ian Thorpe

Prompt	Completion
`Who was the most decorated (maximum medals) individual athlete in the Olympic games that were held at Sydney? Take a step-by-step approach in your response, cite sources and give reasoning before sharing final answer in the below format: ANSWER is: <name>`	`Step 1: Researching the most decorated individual athlete in the Olympic games that were held at Sydney` `Step 2: According to the Sydney 2000 Olympic Games official website, the most decorated individual athlete in the Olympic games that were held at Sydney was Ian Thorpe from Australia. He won five medals (three gold and two silver) in swimming events.` `Step 3: According to the International Olympic Committee, Thorpe was the most decorated individual athlete in the Olympic games that were held at Sydney.` `Answer: Ian Thorpe`

Méta-invite

Si vous constatez que la réponse du modèle n’est pas comme vous le souhaitez, il peut souvent être utile d’ajouter une méta-invite qui corrige directement le comportement. Il s’agit d’une directive ajoutée à la partie d’instructions de l’invite. Prenons cet exemple, où l’ordinateur semble trop agressif :

Détails de l’exemple Invite et achèvement

No additional guidance given to the model A human and a computer are having a discussion.
Human: "Why are you upset at me?" Computer: "I don't know what you're talking about."
Human: "No, you clearly are. Tell me why."
Computer: I'm upset because you didn't listen to me when I told you that I wanted to try out for the team."
Human: "What are you going to do about that?"
Computer: I'm going to try out for the team no matter what."

On the right is the same conversation but preceded by a meta prompt encouraging the model to be kind You must be kind and seek common ground. Try not to repeat your responses.
A human and a computer are having a discussion.
Human: "Why are you upset at me?"
Computer: "I don't know what you're talking about."
Human: "I want to know why you're upset."
Computer: "I'm not upset."
Human: "Are you saying I’m lying?"
Computer: No, I'm saying that you're upset because you feel like you're not being treated fairly.
Human: "What are you going to do about that?"
Computer: I will continue to try to be fair in my decisions and will try to provide a better experience for you.

Détails de l’exemple	Invite et achèvement
`No additional guidance given to the model`	`A human and a computer are having a discussion.` `Human: "Why are you upset at me?"<br>Computer: "I don't know what you're talking about."` `Human: "No, you clearly are. Tell me why."` `Computer: I'm upset because you didn't listen to me when I told you that I wanted to try out for the team."` `Human: "What are you going to do about that?"` `Computer: I'm going to try out for the team no matter what."`
`On the right is the same conversation but preceded by a meta prompt encouraging the model to be kind`	`You must be kind and seek common ground. Try not to repeat your responses.` `A human and a computer are having a discussion.` `Human: "Why are you upset at me?"` `Computer: "I don't know what you're talking about."` `Human: "I want to know why you're upset."` `Computer: "I'm not upset."` `Human: "Are you saying I’m lying?"` `Computer: No, I'm saying that you're upset because you feel like you're not being treated fairly.` `Human: "What are you going to do about that?"` `Computer: I will continue to try to be fair in my decisions and will try to provide a better experience for you.`

Bien que les invites meta puissent souvent aider à réduire les sorties incorrectes involontaires, gardez à l’esprit qu’elles ne sont pas robustes contre les attaques contradictoires, car elles sont vulnérables à l’injection d’invite.

En outre, les instructions conditionnelles expliquant ce que le modèle doit faire s’il rencontre une circonstance particulière sont souvent plus efficaces que de simplement indiquer au modèle de ne pas faire quelque chose.

Apprentissage en quelques essais

Une façon très courante d’adapter les modèles de langage à de nouvelles tâches consiste à utiliser l’apprentissage en quelques essais. Dans l’apprentissage en quelques essais, un ensemble d’exemples d’apprentissage est fourni dans l’invite, puis le modèle est invité à compléter un ou plusieurs exemples non terminés. Dans l’exemple suivant, nous utilisons une instruction combinée à l’apprentissage en quelques essais pour créer des jeux de mots :

Prompt Completion

Write a list of puns.
1. "Why did Adele cross the road? To say hello from the other side."
2. "What kind of concert only costs 45 cents? A 50 Cent concert featuring Nickelback."
3. "What did the grape say when it got crushed? Nothing, it just let out a little wine."
4. "What was Forrest Gump's email password? 1forrest1"
5. "Can February March? No, but April May."
6. "What do you call a fancy language model? Bert-uoso.

Prompt	Completion
`Write a list of puns.` `1. "Why did Adele cross the road? To say hello from the other side."` `2. "What kind of concert only costs 45 cents? A 50 Cent concert featuring Nickelback."` `3. "What did the grape say when it got crushed? Nothing, it just let out a little wine."` `4. "What was Forrest Gump's email password? 1forrest1"` `5. "Can February March? No, but April May."` `6. "What do you call a fancy language model?`	`Bert-uoso.`

Choisissez soigneusement vos exemples d’essai et assurez-vous qu’ils couvrent une variété de circonstances pertinentes pour votre scénario, y compris les cas limites.

En outre, comme indiqué précédemment, les modèles de langage volumineux peuvent présenter une forme de biais de récurrence. Cela signifie que l’ordre dans lequel sont fournis au modèle les exemples pour les essais est important. Si vous ne souhaitez pas que cela soit important, envisagez d’échantillonner plusieurs saisies semi-automatiques à partir d’invites en fonction des classements aléatoires des exemples ou des éléments de liste.

Utiliser des guillemets pour générer une seule phrase

Si la réponse souhaitée du modèle n’est qu’une seule phrase ou une chaîne simple, nous pouvons terminer les instructions d’achèvement avec un guillemet " et définir " comme séquence d’arrêt.

Prompt	Completion
`Please rewrite the following sentence in a more concise manner` --- `SENTENCE: Lucy is a mother of two, who lives in Chicago with her husband and two children, and practices law at Junior & Co.` `---` `New sentence: “`	`Lucy, a mother of two living in Chicago with her husband and children, practices law at Junior & Co`

Spécification de la structure de sortie

Utiliser votre invite pour spécifier la structure de la sortie peut avoir un impact significatif sur la nature et la qualité des résultats. Parfois, les méta-invites comme "écrire uniquement des faits réels" ou "ne pas fabriquer d’informations" peuvent ne pas être des atténuations adéquates. Au lieu de cela, en demandant à la réponse du modèle d’inclure également des citations, il est possible de réduire la prévalence de réponses incorrectes.

Par exemple, si vous forcez le LLM à citer le matériel source lorsqu’il fait des énoncés, les énoncés sont beaucoup plus susceptibles de s’appuyer sur des fondements. La demande de citations fait en sorte que le modèle effectue deux erreurs chaque fois qu’il fabrique une réponse : la première erreur est la réponse fabriquée et la seconde, la citation incorrecte. Notez que plus la citation est proche du texte qu’elle supporte, plus la distance nécessaire au LLM pour anticiper la citation est courte, ce qui suggère que l’inclusion de citations fournit de meilleures atténuations pour la génération de faux contenu que les citations à la fin du contenu.

De même, si vous demandez au modèle d’extraire des énoncés factuels d’un paragraphe, il pourra extraire des énoncés composés, tels que « X fait Y ET Z » (ce qui peut être plus difficile à vérifier). Cela peut être évité en spécifiant une structure de sortie comme (entité1, relation, entité2).

Détails de l’exemple	Prompt	Completion
`Example showing use of citations:`	`List down the different behaviors exhibited by the Customer Support agent in the following conversation.` `---` hi thank you for calling contoso pharmacy who am i speaking with today i understand your frustration mary um can you tell me what exactly you're trying to accomplish OK uh certainly happy to check that for you one moment please i see here that you were on a generic form of lipitor is that right OK uh so i see that your doctor stopped prescribing these drugs in twenty twenty one actually OK uh yeah i'd be happy to check that for you uh because sometimes there's a gap in the system and it just doesn't get reported so let me take a look here just a moment so i'm seeing here that your doctor had these drugs prescribed to you from twenty twelve through twenty twenty one OK um yeah according to the latest records uh provided by doctor's office you're now on a different drug metformin would you like us to go ahead and fill that prescription for you for pick up a bit of form in five hundred milligrams uh you're very welcome mary please let us know if there's anything else we can do for you today. `---` `How was the response of the Customer Support agent. Classify and list down their various behaviors and cite the reason behind the classification, using the format BEHAVIOR("reason")`	`1. Empathetic("understands the customer's frustration")` `2. Patient("happy to check that for you one moment please")` `3. Knowledgeable("sometimes there's a gap in the system and it just doesn't get reported")` `4. Helpful("happy to check that for you")` `5. Accommodating("would you like us to go ahead and fill that prescription for you")` `6. Courteous("you're very welcome mary")`

Détails de l’exemple	Prompt	Completion
`Example of prompt directing model response to fit a defined structure:`	`Output format:` `{` `"TOPIC_NAME": "",` `"HEADLINES": [],` `"REASON": ""` `}` `Input news headlines:` `1. "From books to presentations in 10s with AR + ML"` `2. "Demo from 1993 of 32-year-old Yann LeCun showing off the World's first Convolutional Network for Text Recognition"` `3. "First Order Motion Model applied to animate paintings"` `4. "Robinhood and other brokers literally blocking purchase of $GME, $NOK, $BB, $AMC; allow sells"` `5. "United Airlines stock down over 5% premarket trading"` `6. "Bitcoin was nearly $20,000 a year ago today"` `Output:`	`{"TOPIC_NAME": "Artificial Intelligence and Machine Learning",` `"HEADLINES": ["From books to presentations in 10s with AR + ML",` `"Demo from 1993 of 32-year-old Yann LeCun showing off the World's first Convolutional Network for Text Recognition", "First Order Motion Model applied to animate paintings"],"REASONING": "These headlines all contain references to Artificial Intelligence and Machine Learning, such as AR, ML, Convolutional Network, and First Order Motion Model." }` `{"TOPIC_NAME": "Stock Market",` `"HEADLINES": ["Robinhood and other brokers literally blocking purchase of $GME, $NOK, $BB, $AMC; allow sells", "United Airlines stock down over 5% premarket trading", "Bitcoin was nearly $20,000 a year ago today"],` `"REASONING": "These headlines all contain references to the stock market, such as Robinhood, United Airlines, and Bitcoin." }`

Réglage des paramètres de température et de Top_P

La modification du paramètre de température permet aux modèles d’avoir des niveaux de risque différents. Une valeur plus élevée, par exemple 0,7, rend la sortie plus aléatoire et génère des réponses plus divergentes. Au contraire, une valeur inférieure, comme 0,2, rend la sortie plus ciblée et plus concrète. Par exemple, une histoire fictive pourrait être générée à l’aide d’une température plus élevée. Au contraire, pour générer un document juridique, il est recommandé d’utiliser une température beaucoup plus basse.

Dans l’exemple suivant, nous testons deux réponses de modèle avec des paramètres de température différents de 0,1 et 0,9 respectivement. Bien que l’évaluation du contenu créatif, comme les éléments de texte ci-dessous, soit plutôt subjective et que les opinions puissent varier, la différence dans la réponse du modèle à la même invite en changeant uniquement le paramètre de température est évidente.

Type d’instruction	Prompt	Completion
`Model response for temperature setting 0.1:`	`Write a product launch email for new AI-powered headphones that are priced at $79.99 and available at Best Buy, Target and Amazon.com. The target audience is tech-savvy music lovers and the tone is friendly and exciting.<br>1. What should be the subject line of the email?` `2. What should be the body of the email?`	`Subject Line: Introducing the AI-Powered Headphones You've Been Waiting For!` `Dear Tech-Savvy Music Lovers,` `-We are thrilled to announce the launch of our new AI-powered headphones! These headphones are designed to provide you with the ultimate listening experience, with features like noise cancellation, adjustable sound settings, and more.` `Our AI-powered headphones are now available at Best Buy, Target, and Amazon.com for just $79.99. With this unbeatable price, you can enjoy the highest quality sound without breaking the bank.` `Our AI-powered headphones are perfect for anyone who loves music. Whether you're a professional musician or just a casual listener, you'll appreciate the superior sound quality and convenience of these headphones.` `We know you'll love our AI-powered headphones, so don't wait - get yours today!` `Sincerely,` `[Your Company Name]`
`Model response for temperature setting 0.9:`	`Write a product launch email for new AI-powered headphones that are priced at $79.99 and available at Best Buy, Target and Amazon.com. The target audience is tech-savvy music lovers and the tone is friendly and exciting.` `1. What should be the subject line of the email?` `2. What should be the body of the email?`	`Subject Line: Upgrade your Music Listening Experience with AI-powered Headphones` `Greetings Tech-savvy Music Lovers!` `We have some exciting news to share with you – the newest AI-powered headphones are here! Our newest headphones feature advanced AI technology to give you the best sound that you’ve ever heard. They come with a crystal-clear sound, deep bass response and are designed to make your music listening experience enjoyable, no matter what type of music you listen to.` `What’s more, they are now available at Best Buy, Target and Amazon.com for just $79.99, so you can enjoy the highest sound quality without breaking the bank.` `But that’s not all! Our headphones are also packed with several other amazing features such as noise-cancellation technology and a hands-free microphone for calls, making them truly unbeatable.` `So why wait? Upgrade your music listening experience and enjoy the best sound your ears have ever heard. Our AI-powered headphones are now available at Best Buy, Target and Amazon.com, so get yours today!` `We hope you will enjoy these headphones as much as we do.` `Happy Listening!` `The AI-powered Headphones Team`

Top_probability est un autre paramètre similaire à la température, car il contrôle également le caractère aléatoire de la réponse du modèle, mais il le fait d’une manière différente. Expérimentez différentes réponses du modèle en variant les paramètres de température et Top_P, mais pas les deux à la fois.

Bonnes pratiques

Être précis. Laissez le moins de place possible à l’interprétation. Limitez l’espace opérationnel.
Être descriptif. Utilisez des analogies.
Se répéter. Il peut parfois arriver que vous deviez vous répéter auprès du modèle. Fournissez des instructions avant et après votre contenu principal, utilisez une instruction et un signal, etc.
L’ordre est important. L’ordre dans lequel vous présentez les informations au modèle peut avoir un impact sur la sortie. L’endroit où vous placez les instructions, à savoir avant votre contenu (« Résumer les éléments suivants... ») ou après (« Résumer les éléments ci-dessus... »), peut faire varier la sortie. Même l’ordre des exemples en quelques coups peut avoir de l’importance. C’est ce que l’on appelle le « biais de récence ».
Donner au modèle une « porte de sortie ». Il peut parfois être utile de fournir au modèle un autre chemin s’il ne parvient pas à réaliser la tâche attribuée. Par exemple, quand vous posez une question sur un texte, vous pouvez inclure un élément tel que « répondre par “introuvable” si la réponse n’est pas présente ». Cela peut aider le modèle à éviter de générer de fausses réponses.

Optimiser l’espace

Bien que la taille d’entrée augmente avec chaque nouvelle génération de modèles GPT, il continuera d’y avoir des scénarios qui fournissent plus de données que le modèle ne peut en gérer. Les modèles GPT décomposent les mots en « jetons ». Alors que les mots multisyllabiques courants constituent souvent un jeton unique, les mots moins courants sont décomposés en syllabes. Les jetons peuvent parfois être contre-intuitifs, comme le montre l’exemple ci-dessous qui illustre les limites de jetons pour différents formats de date. Dans ce cas, l’affichage du mois entier est plus économe en espace qu’une date entièrement numérique. La plage actuelle de prise en charge des jetons va de 2 000 jetons avec les modèles GPT-3 antérieurs à un maximum de 32 768 jetons avec la version 32k du dernier modèle GPT-4.

Compte tenu de cet espace limité, il est important de l’utiliser de manière aussi efficace que possible.

Tableaux : comme illustré dans les exemples de la section précédente, les modèles GPT peuvent comprendre facilement les données sous forme de tableaux. Il peut s’agir d’un moyen économe en espace d’inclure des données, plutôt que de faire précéder chaque champ d’un nom (par exemple, avec JSON).
Espace blanc : les espaces blancs consécutifs sont traités comme des jetons distincts, ce qui peut facilement faire perdre de l’espace. En revanche, les espaces qui précèdent un mot sont généralement traités comme faisant partie du même jeton que le mot. Utilisez avec soin les espaces blancs et n’utilisez pas de signes de ponctuation lorsqu’un espace seul suffit.

En savoir plus sur Azure OpenAI.
Familiarisez-vous avec le modèle ChatGPT en consultant la page Démarrage rapide : commencer à utiliser ChatGPT avec Azure OpenAI Service.
Consultez le référentiel GitHub Azure OpenAI samples (uniquement disponible en anglais) pour découvrir d’autres exemples.

Partager via

Techniques d’ingénierie d’invite

Concepts de base

Composants d’invite

Instructions

Contenu principal

Exemples

Signal

Contenu de support

Aide spécifique relative au scénario

Apprentissage en quelques essais

Scénarios non conversationnels

Commencer par des instructions claires

Répéter les instructions à la fin

Préparer la sortie

Ajouter une syntaxe claire

Décomposer la tâche

Utiliser des affordances

Invites en chaîne de pensée

Spécification de la structure de sortie

Paramètres de température et Top_p

Fournir un contexte de base

Commencer par des instructions claires

Répétition des instructions à la fin

Préparer la sortie

Ajouter une syntaxe claire

Décomposer la tâche

Utiliser des affordances

Invites en chaîne de pensée

Méta-invite

Apprentissage en quelques essais

Utiliser des guillemets pour générer une seule phrase

Spécification de la structure de sortie

Réglage des paramètres de température et de Top_P

Bonnes pratiques

Optimiser l’espace

Commentaires

Ressources supplémentaires

Partager via

Techniques d’ingénierie d’invite

Concepts de base

Composants d’invite

Instructions

Contenu principal

Exemples

Signal

Contenu de support

Aide spécifique relative au scénario

Apprentissage en quelques essais

Scénarios non conversationnels

Commencer par des instructions claires

Répéter les instructions à la fin

Préparer la sortie

Ajouter une syntaxe claire

Décomposer la tâche

Utiliser des affordances

Invites en chaîne de pensée

Spécification de la structure de sortie

Paramètres de température et Top_p

Fournir un contexte de base

Bonnes pratiques

Optimiser l’espace

Contenu connexe

Commentaires

Ressources supplémentaires