Freigeben über


Erste Schritte mit benutzerdefinierten Projekten in Dokument Intelligenz Studio

Dieser Inhalt gilt für:Häkchen Version 4.0 (GA) | Vorherige Versionen: Blaues Häkchen Version 3.1 (GA) Blaues Häkchen Version 3.0 (GA)

Dokument Intelligenz-Studio ist ein Onlinetool für das visuelle Erkunden, Verstehen und Integrieren der Features des Dokument Intelligenz-Diensts in Ihre Anwendungen. In diesem Schnellstart finden Sie einen Leitfaden zum Einrichten eines benutzerdefinierten Projekts in Dokument Intelligenz Studio.

Voraussetzungen für neue Benutzer

Weitere Informationen zur Abonnement- und Ressourcenerstellung sowie zum Authentifizierungssetup finden Sie in der folgenden Dokumentation.

Zusätzliche Voraussetzungen für benutzerdefinierte Projekte

Zusätzlich zum Azure-Konto und einer Dokument Intelligenz- oder Azure KI Services-Ressource benötigen Sie Folgendes:

Azure Blob Storage-Container

Ein Azure Blob Storage-Konto mit Standardleistung. Sie erstellen Container zum Speichern und Organisieren Ihrer Trainingsdokumente unter Ihrem Speicherkonto. Wenn Sie nicht wissen, wie Sie ein Azure Speicherkonto mit einem Container erstellen können, befolgen Sie diese Schnellstarts:

  • Informationen zu Azure-Speicherkonten Stellen Sie bei der Erstellung Ihres Speicherkontos sicher, dass Sie Leistung Standard im Feld Instanzdetails -> Leistung auswählen.
  • Erstellen Sie einen Container. Stellen Sie bei der Erstellung Ihres Containers das Feld Öffentliche Zugriffsebene auf Container(anonymer Lesezugriff für Container und Blobs) im dem Fenster Neuer Container.

Azure-Rollenzuweisungen

Für benutzerdefinierte Projekte sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich:

  • Grundlegend

    • Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um das benutzerdefinierte Modell zu trainieren oder Analysen mit trainierten Modellen durchzuführen.
    • Mitwirkender an Storage-Blobdaten: Sie benötigen diese Rolle für das Speicherkonto, um ein Projekt zu erstellen und Daten zu beschriften.
  • Erweitert

    • Speicherkontomitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen einzurichten (diese Aktion muss nur einmal ausgeführt werden, wenn dasselbe Speicherkonto wiederverwendet wird).
    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen.

    Hinweis

    Wenn die lokale (schlüsselbasierte) Authentifizierung für Ihr Dokument Intelligenz-Dienstressourcen- und Speicherkonto deaktiviert ist, müssen Sie die Rollen Cognitive Services-Benutzer bzw. Storage Blob-Datenmitwirkender abrufen, sodass Sie über ausreichende Berechtigungen zum Verwenden von Dokument Intelligenz-Studio verfügen. Die Rollen Speicherkontomitwirkender und Mitwirkender erlauben Ihnen nur das Auflisten von Schlüsseln, geben Ihnen aber nicht das Recht, die Ressourcen zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.

Konfigurieren von CORS

Für Ihr Azure-Speicherkonto muss CORS (Cross Origin Resource Sharing) konfiguriert sein, damit es über das Dokument Intelligenz-Studio zugänglich ist. Zum Konfigurieren von CORS im Azure-Portal benötigen Sie Zugriff auf die Registerkarte „CORS“ Ihres Speicherkontos.

  1. Wählen Sie die Registerkarte „CORS“ für das Speicherkonto aus.

    Screenshot des CORS-Einstellungsmenüs im Azure-Portal.

  2. Erstellen Sie zunächst einen neuen CORS-Eintrag im Blob-Dienst.

  3. Setzen Sie die Erlaubten Ursprünge auf https://documentintelligence.ai.azure.com.

    Screenshot: CORS-Konfiguration für ein Speicherkonto

    Tipp

    Sie können anstelle der Domäne auch das Platzhalterzeichen „*“ verwenden, um allen Ursprungsdomänen die Ausführung von CORS-Anforderungen zu erlauben.

  4. Wählen Sie für Zulässige Methoden alle verfügbaren acht Optionen aus.

  5. Genehmigen Sie die Angaben für Zulässige Header und Verfügbar gemachte Header, indem Sie in jedes Feld ein Sternchen (*) eingeben.

  6. Legen Sie für Max. Alter 120 Sekunden oder einen anderen gültigen Wert ein.

  7. Wählen Sie oben auf der Seite die Schaltfläche „Speichern“ aus, um die Änderungen zu speichern.

CORS sollte jetzt für die Verwendung des Speicherkontos über Dokument Intelligenz-Studio konfiguriert sein.

Gruppe von Beispieldokumenten

  1. Melden Sie sich beim Azure-Portal an, und navigieren Sie zu Ihr Speicherkonto>Datenspeicher>Container.

    Screenshot des Menüs Datenspeicher im Azure-Portal

  2. Wählen Sie einen Container aus der Liste aus.

  3. Wählen Sie Hochladen aus dem Menü am oberen Rand der Seite.

    Screenshot der Schaltfläche zum Hochladen von Containern im Azure-Portal

  4. Das Fenster Blob hochladen wird angezeigt.

  5. Wählen Sie Ihre Dateien zum Hochladen aus.

    Screenshot des Blob-Upload-Fensters im Azure-Portal

Hinweis

Standardmäßig verwendet Studio Dokumente, die sich im Stammverzeichnis Ihres Containers befinden. Sie können aber auch Daten verwenden, die in Ordnern angeordnet sind, indem Sie den Pfad zum Ordner in den Schritten zum Erstellen des Projekts für benutzerdefinierte Formulare angeben. Siehe Organisieren Sie Ihre Daten in Unterordnern

Verwenden von Dokument Intelligenz Studio-Features

Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder die von Ihnen trainierten Modelle beschriften.

    Animierter Screenshot: automatische Beschriftung in Studio

  • Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.

    Screenshot: Warnung zu doppelter Beschriftung nach automatischer Beschriftung

Automatisches Bezeichnen von Tabellen

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.

    Animierter Screenshot: automatische Tabellenbeschriftung in Studio

Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset

  • Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.

  • Wenn für einige Beschriftungen eine niedrige Konfidenzbewertung zurückgegeben wird, vergewissern Sie sich, dass Ihre Inhalte korrekt beschriftet sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.

    Animierter Screenshot: Hinzufügen von Testdateien zum Trainingsdataset

Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten

  • Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells, um mühelos durch Ihre Schulungsdokumente zu navigieren, indem Sie die Such-, Filter- und Sortierfeatures verwenden.

  • Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.

    Screenshot: Optionen und Filter der Dokumentlistenansicht

Projektfreigabe

Geben Sie mühelos benutzerdefinierte Extraktionsprojekte frei. Weitere Informationen finden Sie unter Projektfreigabe mit benutzerdefinierten Modellen.

Nächste Schritte

Erste Schritte mit dem Dokument Intelligenz-Studio.