Welches Modell sollte verwendet werden

Abgeschlossen

Bei der Wahl des richtigen LLM müssen Sie viele Faktoren berücksichtigen, darunter Kosten, Verfügbarkeit, Leistung und Fähigkeiten. Im Allgemeinen sollten Sie die folgenden Richtlinien beachten:

  • gpt-35-turbo: Dieses Modell ist preiswert, leistungsfähig und kann trotz seines Namens (ChatGPT) für eine breite Palette von Aufgaben jenseits von Chat und Konversation verwendet werden.

  • gpt-35-turbo-16k, gpt-4 oder gpt-4-32k: Diese Modelle sind eine gute Wahl, wenn Sie mehr als 4.096 Token generieren müssen oder größere Prompts unterstützen müssen. Diese Modelle sind jedoch teurer, können langsamer sein und sind möglicherweise nur begrenzt verfügbar.

  • Einbettungsmodell: Wenn Ihre Aufgaben Suche, Clustering, Empfehlungen und die Erkennung von Anomalien umfassen, sollten Sie ein Einbettungsmodell verwenden. Computer können problemlos einen Vektor von Zahlen verwenden, die die Einbettung bilden. Die Einbettung ist eine sehr informationsreiche Darstellung der semantischen Bedeutung eines Textes. Der Abstand zwischen zwei Einbettungen im Vektorraum ist mit der semantischen Ähnlichkeit korreliert. Wenn zum Beispiel zwei Texte ähnlich sind, dann sind auch ihre Vektordarstellungen ähnlich.

  • DALL-E: Dieses Modell generiert Bilder aus Text-Prompts. DALL-E unterscheidet sich von anderen Sprachmodellen, weil die Ausgabe ein Bild und kein Text ist.

  • Whisper: Dieses Modell wurde auf einem großen Datensatz mit englischen Audio- und Textdaten trainiert. Whisper ist für Spracherkennungsfunktionen wie die Transkription von Audiodateien optimiert. Es kann verwendet werden, um Audiodateien zu transkribieren, die Sprache in anderen Sprachen als Englisch enthalten. Die Ausgabe des Modells ist jedoch englischer Text. Verwenden Sie Whisper, um Audiodateien schnell einzeln zu transkribieren, Audiodateien aus anderen Sprachen ins Englische zu übersetzen oder dem Modell Ihren Prompt zu übermitteln, um die Ausgabe zu steuern.