Api-referens för assistenter (förhandsversion)
Kommentar
- Filsökning kan mata in upp till 10 000 filer per assistent – 500 gånger mer än tidigare. Den är snabb, stöder parallella frågor via sökningar med flera trådar och funktioner för förbättrad omrankning och omskrivning av frågor.
- Vector Store är ett nytt objekt i API:et. När en fil har lagts till i ett vektorlager parsas den automatiskt, segmenteras och bäddas in och görs redo att sökas igenom. Vektorlager kan användas mellan assistenter och trådar, vilket förenklar filhantering och fakturering.
- Vi har lagt till stöd för parametern
tool_choice
som kan användas för att tvinga fram användningen av ett specifikt verktyg (till exempel filsökning, kodtolkare eller en funktion) i en viss körning.
Den här artikeln innehåller referensdokumentation för Python och REST för det nya ASSISTENT-API:et (förhandsversion). Mer detaljerad stegvis vägledning finns i komma igång-guiden.
Skapa en assistent
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/assistants?api-version=2024-05-01-preview
Skapa en assistent med en modell och instruktioner.
Begärandetext
Namn | Typ | Obligatoriskt | Beskrivning |
---|---|---|---|
modell | sträng | Obligatoriskt | Modelldistributionsnamn för den modell som ska användas. |
name | sträng eller null | Valfritt | Namnet på assistenten. Den maximala längden är 256 tecken. |
description | sträng eller null | Valfritt | Beskrivningen av assistenten. Den maximala längden är 512 tecken. |
instruktioner | sträng eller null | Valfritt | Systeminstruktionerna som assistenten använder. Den maximala längden är 256 000 tecken. |
verktyg | matris | Valfritt | Standardvärdet är []. En lista över verktyg som är aktiverade på assistenten. Det kan finnas högst 128 verktyg per assistent. Verktyg kan för närvarande vara av typer code_interpreter , eller function . En function beskrivning kan vara högst 1 024 tecken. |
metadata | map | Valfritt | Uppsättning med 16 nyckel/värde-par som kan kopplas till ett objekt. Detta kan vara användbart för att lagra ytterligare information om objektet i ett strukturerat format. Nycklar kan vara högst 64 tecken långa och värden kan vara högst 512 tecken långa. |
temperatur | tal eller null | Valfritt | Standardvärdet är 1. Avgör vilken samplingstemperatur som ska användas, mellan 0 och 2. Högre värden som 0,8 gör utdata mer slumpmässiga, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. |
top_p | tal eller null | Valfritt | Standardvärdet är 1. Ett alternativ till sampling med temperatur, som kallas kärnsampling, där modellen tar hänsyn till resultatet av token med top_p sannolikhetsmassa. Så 0,1 innebär att endast token som består av den översta 10 % sannolikhetsmassan beaktas. Vi rekommenderar vanligtvis att du ändrar detta eller temperatur men inte båda. |
response_format | sträng eller objekt | Valfritt | Anger det format som modellen måste mata ut. Kompatibel med GPT-4 Turbo och alla GPT-3.5 Turbo modeller sedan gpt-3.5-turbo-1106. Om du anger den här parametern till { "type": "json_object" } aktiverar du JSON-läge, vilket garanterar att meddelandet som modellen genererar är giltigt JSON. När du använder JSON-läge måste du också instruera modellen att skapa JSON själv med hjälp av ett system- eller användarmeddelande. Utan den här instruktionen kan modellen generera en avaktiverande ström av blanksteg tills genereringen når tokengränsen, vilket resulterar i en tidskrävande och till synes "fast" begäran. Dessutom kan meddelandeinnehållet vara delvis avskuret om du använder finish_reason="length" , vilket indikerar att genereringen överskreds max_tokens eller att konversationen överskred den maximala kontextlängden. |
tool_resources | objekt | Valfritt | En uppsättning resurser som används av assistentens verktyg. Resurserna är specifika för typen av verktyg. Verktyget kräver till exempel code_interpreter en lista över fil-ID:t, medan file_search verktyget kräver en lista över vektorarkiv-ID:t. |
response_format typer
sträng
auto
är standardvärdet.
objekt
Möjliga type
värden: text
, json_object
, json_schema
.
json_schema
Namn | Type | Beskrivning | Standard | Obligatoriskt/valfritt |
---|---|---|---|---|
description |
sträng | En beskrivning av vad svarsformatet är till för, som används av modellen för att avgöra hur du ska svara i formatet. | Valfritt | |
name |
sträng | Namnet på svarsformatet. Måste vara a-z, A-Z, 0-9, eller innehålla understreck och bindestreck, med en maximal längd på 64. | Obligatoriskt | |
schema |
objekt | Schemat för svarsformatet, som beskrivs som ett JSON-schemaobjekt. | Valfritt | |
strict |
booleskt värde eller null | Om du vill aktivera strikt schemaefterlevnad när utdata genereras. Om värdet är true följer modellen alltid det exakta schema som definierats i fältet schema . Endast en delmängd av JSON-schemat stöds när strict är true . |
falskt | Valfritt |
tool_resources egenskaper
code_interpreter
Namn | Type | Beskrivning | Standard |
---|---|---|---|
file_ids |
matris | En lista över fil-ID:t som gjorts tillgängliga för verktyget code_interpreter. Det kan finnas högst 20 filer som är associerade med verktyget. | [] |
file_search
Namn | Type | Beskrivning | Obligatoriskt/valfritt |
---|---|---|---|
vector_store_ids |
matris | Vektorarkivet som är kopplat till den här tråden. Det kan finnas högst 1 vektorlager kopplat till tråden. | Valfritt |
vector_stores |
matris | En hjälp för att skapa ett vektorlager med file_ids och koppla det till den här tråden. Det kan finnas högst 1 vektorlager kopplat till tråden. | Valfritt |
vector_stores
Namn | Type | Beskrivning | Obligatoriskt/valfritt |
---|---|---|---|
file_ids |
matris | En lista över fil-ID:t som ska läggas till i vektorarkivet. Det kan finnas högst 1 0000 filer i ett vektorlager. | Valfritt |
chunking_strategy |
objekt | Segmenteringsstrategin som används för att segmentera filen eller filerna. Om den inte har angetts använder du den automatiska strategin. | Valfritt |
metadata |
map | Uppsättning med 16 nyckel/värde-par som kan kopplas till ett vektorlager. Detta kan vara användbart för att lagra ytterligare information om vektorlagret i ett strukturerat format. Nycklar kan vara högst 64 tecken långa och värden kan vara högst 512 tecken långa. | Valfritt |
chunking_strategy
Namn | Type | Beskrivning | Obligatoriskt/valfritt |
---|---|---|---|
Auto Chunking Strategy |
objekt | Standardstrategin. Den här strategin använder för närvarande en max_chunk_size_tokens av 800 och chunk_overlap_tokens av 400 . type är alltid auto |
Obligatoriskt |
Static Chunking Strategy |
objekt | type Alltid static |
Obligatoriskt |
Strategi för statisk segmentering
Namn | Type | Beskrivning | Obligatoriskt/valfritt |
---|---|---|---|
max_chunk_size_tokens |
integer | Det maximala antalet token i varje segment. Standardvärdet är 800 . Det minsta värdet är 100 och det maximala värdet är 4096 . |
Obligatoriskt |
chunk_overlap_tokens |
integer | Antalet token som överlappar mellan segment. Standardvärdet är 400 . Observera att överlappningen inte får överstiga hälften av max_chunk_size_tokens . |
Obligatoriskt |
Returer
Ett assistentobjekt .
Exempel på begäran om att skapa assistent
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
assistant = client.beta.assistants.create(
instructions="You are an AI assistant that can write code to help answer math questions",
model="<REPLACE WITH MODEL DEPLOYMENT NAME>", # replace with model deployment name.
tools=[{"type": "code_interpreter"}]
)
Lista assistenter
GET https://YOUR_RESOURCE_NAME.openai.azure.com/openai/assistants?api-version=2024-05-01-preview
Returnerar en lista över alla assistenter.
Frågeparametrar
Parameter | Type | Obligatoriskt | Beskrivning |
---|---|---|---|
limit |
integer | Valfritt | En gräns för hur många objekt som ska returneras. Gränsen kan vara mellan 1 och 100 och standardvärdet är 20. |
order |
sträng | Valfritt – Standardinställningar för desc | Sortera ordning efter objektens created_at tidsstämpel. asc för stigande ordning och desc för fallande ordning. |
after |
sträng | Valfritt | En markör för användning i sidnumrering. after är ett objekt-ID som definierar din plats i listan. Om du till exempel gör en listbegäran och tar emot 100 objekt, som slutar med obj_foo, kan ditt efterföljande anrop inkludera after=obj_foo för att hämta nästa sida i listan. |
before |
sträng | Valfritt | En markör för användning i sidnumrering. before är ett objekt-ID som definierar din plats i listan. Om du till exempel gör en listbegäran och tar emot 100 objekt, som slutar med obj_foo, kan ditt efterföljande anrop inkludera före =obj_foo för att hämta föregående sida i listan. |
Returer
En lista över assistentobjekt
Exempel på listassistenter
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
my_assistants = client.beta.assistants.list(
order="desc",
limit="20",
)
print(my_assistants.data)
Hämta assistent
GET https://YOUR_RESOURCE_NAME.openai.azure.com/openai/assistants/{assistant_id}?api-version=2024-08-01-preview
Hämtar en assistent.
Sökvägsparametrar
Parameter | Type | Obligatoriskt | Beskrivning |
---|---|---|---|
assistant_id |
sträng | Obligatoriskt | ID:t för assistenten som ska hämtas. |
Returer
Assistentobjektet som matchar det angivna ID:t.
Exempel på hämtningsassistent
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
my_assistant = client.beta.assistants.retrieve("asst_abc123")
print(my_assistant)
Ändra assistent
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/assistants/{assistant_id}?api-version=2024-08-01-preview
Ändrar en assistent.
Sökvägsparametrar
Parameter | Type | Obligatoriskt | Beskrivning |
---|---|---|---|
assistant_id | sträng | Obligatoriskt | ID:t för assistenten som filen tillhör. |
Begärandetext
Parameter | Type | Obligatoriskt | Beskrivning |
---|---|---|---|
model |
Valfritt | Modelldistributionsnamnet för den modell som ska användas. | |
name |
sträng eller null | Valfritt | Namnet på assistenten. Den maximala längden är 256 tecken. |
description |
sträng eller null | Valfritt | Beskrivningen av assistenten. Den maximala längden är 512 tecken. |
instructions |
sträng eller null | Valfritt | Systeminstruktionerna som assistenten använder. Den maximala längden är 32768 tecken. |
tools |
matris | Valfritt | Standardvärdet är []. En lista över verktyg som är aktiverade på assistenten. Det kan finnas högst 128 verktyg per assistent. Verktyg kan vara av typer code_interpreter eller funktion. En function beskrivning kan vara högst 1 024 tecken. |
metadata |
map | Valfritt | Uppsättning med 16 nyckel/värde-par som kan kopplas till ett objekt. Detta kan vara användbart för att lagra ytterligare information om objektet i ett strukturerat format. Nycklar kan vara högst 64 tecken långa och värden kan vara högst 512 tecken långa. |
temperature |
tal eller null | Valfritt | Standardvärdet är 1. Avgör vilken samplingstemperatur som ska användas, mellan 0 och 2. Högre värden som 0,8 gör utdata mer slumpmässiga, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. |
top_p |
tal eller null | Valfritt | Standardvärdet är 1. Ett alternativ till sampling med temperatur, som kallas kärnsampling, där modellen tar hänsyn till resultatet av token med top_p sannolikhetsmassa. Så 0,1 innebär att endast token som består av den översta 10 % sannolikhetsmassan beaktas. Vi rekommenderar vanligtvis att du ändrar detta eller temperatur men inte båda. |
response_format |
sträng eller objekt | Valfritt | Anger det format som modellen måste mata ut. Kompatibel med GPT-4 Turbo och alla GPT-3.5 Turbo modeller sedan gpt-3.5-turbo-1106. Om du anger den här parametern till { "type": "json_object" } aktiverar du JSON-läge, vilket garanterar att meddelandet som modellen genererar är giltigt JSON. När du använder JSON-läge måste du också instruera modellen att skapa JSON själv med hjälp av ett system- eller användarmeddelande. Utan den här instruktionen kan modellen generera en avaktiverande ström av blanksteg tills genereringen når tokengränsen, vilket resulterar i en tidskrävande och till synes "fast" begäran. Dessutom kan meddelandeinnehållet vara delvis avskuret om du använder finish_reason="length" , vilket indikerar att genereringen överskreds max_tokens eller att konversationen överskred den maximala kontextlängden. |
tool_resources |
objekt | Valfritt | En uppsättning resurser som används av assistentens verktyg. Resurserna är specifika för typen av verktyg. Verktyget kräver till exempel code_interpreter en lista över fil-ID:t, medan file_search verktyget kräver en lista över vektorarkiv-ID:t. |
Returer
Det ändrade assistentobjektet.
Exempel på ändringsassistent
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
my_updated_assistant = client.beta.assistants.update(
"asst_abc123",
instructions="You are an HR bot, and you have access to files to answer employee questions about company policies. Always respond with info from either of the files.",
name="HR Helper",
tools=[{"type": "code-interpreter"}],
model="gpt-4", #model = model deployment name
)
print(my_updated_assistant)
Ta bort assistent
DELETE https://YOUR_RESOURCE_NAME.openai.azure.com/openai/assistants/{assistant_id}?api-version=2024-08-01-preview
Ta bort en assistent.
Sökvägsparametrar
Parameter | Type | Obligatoriskt | Beskrivning |
---|---|---|---|
assistant_id |
sträng | Obligatoriskt | ID:t för assistenten som filen tillhör. |
Returer
Borttagningsstatus.
Exempel på borttagningsassistent
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
response = client.beta.assistants.delete("asst_abc123")
print(response)
Api-referens för filuppladdning
Assistenter använder samma API för filuppladdning som finjustering. När du laddar upp en fil måste du ange ett lämpligt värde för syftesparametern.
Assistentobjekt
Fält | Type | Description |
---|---|---|
id |
sträng | Identifieraren, som kan refereras till i API-slutpunkter. |
object |
sträng | Objekttypen, som alltid är assistent. |
created_at |
integer | Unix-tidsstämpeln (i sekunder) för när assistenten skapades. |
name |
sträng eller null | Namnet på assistenten. Den maximala längden är 256 tecken. |
description |
sträng eller null | Beskrivningen av assistenten. Den maximala längden är 512 tecken. |
model |
sträng | Namnet på modelldistributionsnamnet som ska användas. |
instructions |
sträng eller null | Systeminstruktionerna som assistenten använder. Den maximala längden är 32768 tecken. |
tools |
matris | En lista över verktyg som är aktiverade på assistenten. Det kan finnas högst 128 verktyg per assistent. Verktyg kan vara av typer code_interpreter eller funktion. En function beskrivning kan vara högst 1 024 tecken. |
metadata |
map | Uppsättning med 16 nyckel/värde-par som kan kopplas till ett objekt. Detta kan vara användbart för att lagra ytterligare information om objektet i ett strukturerat format. Nycklar kan vara högst 64 tecken långa och värden kan vara högst 512 tecken långa. |
temperature |
tal eller null | Standardvärdet är 1. Avgör vilken samplingstemperatur som ska användas, mellan 0 och 2. Högre värden som 0,8 gör utdata mer slumpmässiga, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. |
top_p |
tal eller null | Standardvärdet är 1. Ett alternativ till sampling med temperatur, som kallas kärnsampling, där modellen tar hänsyn till resultatet av token med top_p sannolikhetsmassa. Så 0,1 innebär att endast token som består av den översta 10 % sannolikhetsmassan beaktas. Vi rekommenderar vanligtvis att du ändrar detta eller temperatur men inte båda. |
response_format |
sträng eller objekt | Anger det format som modellen måste mata ut. Kompatibel med GPT-4 Turbo och alla GPT-3.5 Turbo modeller sedan gpt-3.5-turbo-1106. Om du anger den här parametern till { "type": "json_object" } aktiverar du JSON-läge, vilket garanterar att meddelandet som modellen genererar är giltigt JSON. När du använder JSON-läge måste du också instruera modellen att skapa JSON själv med hjälp av ett system- eller användarmeddelande. Utan den här instruktionen kan modellen generera en avaktiverande ström av blanksteg tills genereringen når tokengränsen, vilket resulterar i en tidskrävande och till synes "fast" begäran. Dessutom kan meddelandeinnehållet vara delvis avskuret om du använder finish_reason="length" , vilket indikerar att genereringen överskreds max_tokens eller att konversationen överskred den maximala kontextlängden. |
tool_resources |
objekt | En uppsättning resurser som används av assistentens verktyg. Resurserna är specifika för typen av verktyg. Verktyget kräver till exempel code_interpreter en lista över fil-ID:t, medan file_search verktyget kräver en lista över vektorarkiv-ID:t. |