Erste Schritte mit benutzerdefinierten Projekten in Dokument Intelligenz Studio
Dieser Inhalt gilt für: Version 4.0 (GA) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA)
Dokument Intelligenz-Studio ist ein Onlinetool für das visuelle Erkunden, Verstehen und Integrieren der Features des Dokument Intelligenz-Diensts in Ihre Anwendungen. In diesem Schnellstart finden Sie einen Leitfaden zum Einrichten eines benutzerdefinierten Projekts in Dokument Intelligenz Studio.
Voraussetzungen für neue Benutzer
Weitere Informationen zur Abonnement- und Ressourcenerstellung sowie zum Authentifizierungssetup finden Sie in der folgenden Dokumentation.
Zusätzliche Voraussetzungen für benutzerdefinierte Projekte
Zusätzlich zum Azure-Konto und einer Dokument Intelligenz- oder Azure KI Services-Ressource benötigen Sie Folgendes:
Azure Blob Storage-Container
Ein Azure Blob Storage-Konto mit Standardleistung. Sie erstellen Container zum Speichern und Organisieren Ihrer Trainingsdokumente unter Ihrem Speicherkonto. Wenn Sie nicht wissen, wie Sie ein Azure Speicherkonto mit einem Container erstellen können, befolgen Sie diese Schnellstarts:
- Informationen zu Azure-Speicherkonten Stellen Sie bei der Erstellung Ihres Speicherkontos sicher, dass Sie Leistung Standard im Feld Instanzdetails -> Leistung auswählen.
- Erstellen Sie einen Container. Stellen Sie bei der Erstellung Ihres Containers das Feld Öffentliche Zugriffsebene auf Container(anonymer Lesezugriff für Container und Blobs) im dem Fenster Neuer Container.
Azure-Rollenzuweisungen
Für benutzerdefinierte Projekte sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich:
Grundlegend
- Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um das benutzerdefinierte Modell zu trainieren oder Analysen mit trainierten Modellen durchzuführen.
- Mitwirkender an Storage-Blobdaten: Sie benötigen diese Rolle für das Speicherkonto, um ein Projekt zu erstellen und Daten zu beschriften.
Erweitert
- Speicherkontomitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen einzurichten (diese Aktion muss nur einmal ausgeführt werden, wenn dasselbe Speicherkonto wiederverwendet wird).
- Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen.
Hinweis
Wenn die lokale (schlüsselbasierte) Authentifizierung für Ihr Dokument Intelligenz-Dienstressourcen- und Speicherkonto deaktiviert ist, müssen Sie die Rollen Cognitive Services-Benutzer bzw. Storage Blob-Datenmitwirkender abrufen, sodass Sie über ausreichende Berechtigungen zum Verwenden von Dokument Intelligenz-Studio verfügen. Die Rollen Speicherkontomitwirkender und Mitwirkender erlauben Ihnen nur das Auflisten von Schlüsseln, geben Ihnen aber nicht das Recht, die Ressourcen zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.
Konfigurieren von CORS
Für Ihr Azure-Speicherkonto muss CORS (Cross Origin Resource Sharing) konfiguriert sein, damit es über das Dokument Intelligenz-Studio zugänglich ist. Zum Konfigurieren von CORS im Azure-Portal benötigen Sie Zugriff auf die Registerkarte „CORS“ Ihres Speicherkontos.
Wählen Sie die Registerkarte „CORS“ für das Speicherkonto aus.
Erstellen Sie zunächst einen neuen CORS-Eintrag im Blob-Dienst.
Setzen Sie die Erlaubten Ursprünge auf
https://documentintelligence.ai.azure.com
.Tipp
Sie können anstelle der Domäne auch das Platzhalterzeichen „*“ verwenden, um allen Ursprungsdomänen die Ausführung von CORS-Anforderungen zu erlauben.
Wählen Sie für Zulässige Methoden alle verfügbaren acht Optionen aus.
Genehmigen Sie die Angaben für Zulässige Header und Verfügbar gemachte Header, indem Sie in jedes Feld ein Sternchen (*) eingeben.
Legen Sie für Max. Alter 120 Sekunden oder einen anderen gültigen Wert ein.
Wählen Sie oben auf der Seite die Schaltfläche „Speichern“ aus, um die Änderungen zu speichern.
CORS sollte jetzt für die Verwendung des Speicherkontos über Dokument Intelligenz-Studio konfiguriert sein.
Gruppe von Beispieldokumenten
Melden Sie sich beim Azure-Portal an, und navigieren Sie zu Ihr Speicherkonto>Datenspeicher>Container.
Wählen Sie einen Container aus der Liste aus.
Wählen Sie Hochladen aus dem Menü am oberen Rand der Seite.
Das Fenster Blob hochladen wird angezeigt.
Wählen Sie Ihre Dateien zum Hochladen aus.
Hinweis
Standardmäßig verwendet Studio Dokumente, die sich im Stammverzeichnis Ihres Containers befinden. Sie können aber auch Daten verwenden, die in Ordnern angeordnet sind, indem Sie den Pfad zum Ordner in den Schritten zum Erstellen des Projekts für benutzerdefinierte Formulare angeben. Siehe Organisieren Sie Ihre Daten in Unterordnern
Verwenden von Dokument Intelligenz Studio-Features
Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder die von Ihnen trainierten Modelle beschriften.
Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.
Automatisches Bezeichnen von Tabellen
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.
Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset
Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.
Wenn für einige Beschriftungen eine niedrige Konfidenzbewertung zurückgegeben wird, vergewissern Sie sich, dass Ihre Inhalte korrekt beschriftet sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.
Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten
Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells, um mühelos durch Ihre Schulungsdokumente zu navigieren, indem Sie die Such-, Filter- und Sortierfeatures verwenden.
Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.
Projektfreigabe
Geben Sie mühelos benutzerdefinierte Extraktionsprojekte frei. Weitere Informationen finden Sie unter Projektfreigabe mit benutzerdefinierten Modellen.
Nächste Schritte
- Folgen Sie unserer Migrationsanleitung zu Dokument Intelligenz v3.1, um die Unterschiede zur vorherigen Version der REST-API kennenzulernen.
- Erkunden Sie die Schnellstarts für das SDK von v4.0, um die Features von v3.0 in Ihren Anwendungen mithilfe der neuen Clientbibliotheken auszuprobieren.
- Sehen Sie sich unsere Schnellstartanleitungen zur REST-API für v4.0 an, um die Funktionen von v3.0 mithilfe der neuen REST-API auszuprobieren.