Upgrade von GitHub-Modellen auf den Azure KI-Modellinferenzdienst
Wenn Sie eine generative KI-Anwendung entwickeln möchten, können Sie GitHub-Modelle verwenden, um KI-Modelle zu suchen und kostenlos mit ihnen zu experimentieren. Der Playground und die kostenlose API-Nutzung sind für Anforderungen pro Minute, Anforderungen pro Tag, Token pro Anforderung und gleichzeitige Anforderungen ratenbegrenzt. Wenn Sie eine Ratenbegrenzung erreichen, müssen Sie warten, bis die erreichte Ratenbegrenzung zurückgesetzt wird, bevor Sie weitere Anforderungen machen können.
Sobald Sie bereit sind, Ihre Anwendung in die Produktion zu bringen, können Sie Ihre Erfahrung aktualisieren, indem Sie eine Azure KI Services-Ressource in einem Azure-Abonnement bereitstellen und mit der Verwendung des Azure KI-Modellinferenzdiensts beginnen. Sie brauchen in Ihrem Code nichts weiter zu ändern.
Im folgenden Artikel wird erläutert, wie Sie mit GitHub-Modellen in Azure KI-Modellen für Azure KI Services beginnen.
Voraussetzungen
Um die Schritte dieses Tutorials abzuschließen, benötigen Sie Folgendes:
Ein GitHub-Konto mit Zugriff auf GitHub-Modelle.
Ein Azure-Abonnement. Wenn Sie kein Konto haben, werden Sie aufgefordert, ein Azure-Konto zu erstellen oder Ihr Konto auf ein Vorausbezahlungskonto zu aktualisieren, wenn Sie bereit sind, Ihr Modell in der Produktion bereitzustellen.
Upgrade auf Azure KI Services
Die Ratenbeschränkungen für den Playground und die kostenlose API-Nutzung sollen Ihnen helfen, mit Modellen zu experimentieren und Ihre KI-Anwendung zu entwickeln. Sobald Sie bereit sind, Ihre Anwendung in die Produktion zu bringen, verwenden Sie einen Schlüssel und Endpunkt aus einem kostenpflichtigen Azure-Konto. Sie brauchen in Ihrem Code nichts weiter zu ändern.
So rufen Sie den Schlüssel und den Endpunkt ab:
Wählen Sie im Playground für Ihr Modell API-Schlüssel abrufen aus.
Wählen Sie Produktionsschlüssel abrufen aus.
Wenn Sie kein Azure-Konto haben, wählen Sie „Mein Konto erstellen“ aus, und führen Sie die Schritte zum Erstellen eines Kontos aus.
Wenn Sie über ein Azure-Konto verfügen, wählen Sie Wieder anmelden aus.
Wenn Ihr vorhandenes Konto ein kostenloses Konto ist, müssen Sie zuerst ein Upgrade auf einen Vorausbezahlungsplan durchführen. Nachdem Sie ein Upgrade durchgeführt haben, kehren Sie zum Playground zurück, und wählen Sie erneut API-Schlüssel abrufen aus, und melden Sie sich mit Ihrem aktualisierten Konto an.
Sobald Sie sich bei Ihrem Azure-Konto angemeldet haben, werden Sie zum Azure KI Foundry geführt.
Wählen Sie oben auf der Seite Zu Ihrer GitHub KI-Ressource wechseln aus, um zu Azure KI Foundry / Github](https://ai.azure.com/github) zu wechseln. Es kann ein oder zwei Minuten dauern, bis Ihre anfänglichen Modelldetails im Azure KI Foundry-Portal geladen werden.
Die Seite wird mit den Details Ihres Modells geladen. Wählen Sie die Schaltfläche Bereitstellung erstellen aus, um das Modell für Ihr Konto bereitzustellen.
Nach der Bereitstellung werden der API-Schlüssel und der Endpunkt Ihres Modells in der Übersicht angezeigt. Verwenden Sie diese Werte in Ihrem Code, um das Modell in Ihrer Produktionsumgebung zu verwenden.
An diesem Punkt ist das von Ihnen ausgewählte Modell bereit genutzt zu werden.
Tipp
Verwenden Sie den Parameter model="<deployment-name>
, um Ihre Anforderung an diese Bereitstellung weiterzuleiten. Bereitstellungen funktionieren als Alias eines gegebenen Modells unter bestimmten Konfigurationen. Auf der Konzeptseite Routing erfahren Sie, wie Azure KI Services Bereitstellungen weiterleitet.
Upgraden Ihres Codes für die Verwendung des neuen Endpunkts
Sobald Ihre Azure KI Services-Ressource konfiguriert wurde, können Sie diese aus Ihrem Code heraus nutzen. Sie benötigen dafür die Endpunkt-URL und den Schlüssel, die im Abschnitt Übersicht zu finden sind:
Sie können alle unterstützten SDKs verwenden, um Vorhersagen aus dem Endpunkt abzurufen. Die folgenden SDKs werden offiziell unterstützt:
- OpenAI SDK
- Azure OpenAI SDK
- Azure KI-Rückschluss-SDK
Weitere Details und Beispiele finden Sie im Abschnitt Unterstützte Sprachen und SDKs. Das folgende Beispiel zeigt, wie Sie das Azure KI-Modellinferenz-SDK mit dem neu bereitgestellten Modell verwenden:
Installieren Sie das Paket azure-ai-inference
mit Ihrem Paket-Manager, z. B. pip:
pip install azure-ai-inference>=1.0.0b5
Warnung
Azure KI Services-Ressource erfordert die Version azure-ai-inference>=1.0.0b5
für Python.
Anschließend können Sie das Paket verwenden, um das Modell zu nutzen. Das folgende Beispiel zeigt, wie Sie einen Client erstellen, um Chatvervollständigungen zu nutzen:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
client = ChatCompletionsClient(
endpoint=os.environ["AZUREAI_ENDPOINT_URL"],
credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)
Erkunden Sie unsere Beispiele,und lesen Sie die API-Referenzdokumentation für die ersten Schritte.
Generieren Sie Ihren ersten Chatabschluss:
from azure.ai.inference.models import SystemMessage, UserMessage
response = client.complete(
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
],
model="mistral-large"
)
print(response.choices[0].message.content)
Untersuchen weiterer Features
Azure KI-Modellinferenz unterstützt weitere Features, die in GitHub-Modellen nicht verfügbar sind, einschließlich:
- Erkunden Sie den Modellkatalog, um andere Modelle anzuzeigen, die in GitHub-Modellen nicht verfügbar sind.
- Konfigurieren Sie die Inhaltsfilterung.
- Konfigurieren Sie die Ratenbegrenzung (für bestimmte Modelle).
- Erkunden Sie weitere Bereitstellungs-SKUs (für bestimmte Modelle).
- Konfigurieren Sie ein privates Netzwerk.
Haben Sie Probleme?
Weitere Hilfe finden Sie im Abschnitt „Häufig gestellte Fragen“.
Nächste Schritte
- Fügen Sie Ihrem Endpunkt weitere Modelle hinzu.
- Erkunden Sie den Modellkatalog im Azure KI Foundry-Portal.