Freigeben über


Anzeige des Anruftranskriptionstatus auf dem Client

Sie müssen die Zustimmung aller Anrufteilnehmer einholen, bevor Sie diese transkribieren können. Mit Microsoft Teams können Benutzer und Benutzerinnen die Transkription in Besprechungen oder Anrufen starten. Beim Start der Transkription erhalten Sie ein Ereignis. Sie können den Transkriptionsstatus überprüfen, wenn die Transkription gestartet wurde, bevor Sie dem Anruf oder der Besprechung beigetreten sind. Sie können explizit in die Transkription einwilligen, wenn eine Besprechung oder ein Anruf dies erfordert und Sie die Einwilligung bereits eingeholt haben.

Voraussetzungen

Unterstützung

In den folgenden Tabellen wird die Unterstützung der Anruftranskription in Azure Communication Services definiert.

Identitäten und Anruftypen

Die folgenden Tabellen zeigen die Unterstützung der Transkription für bestimmte Anruftypen und Identitäten.

Identities Teams-Besprechung Raum 1:1-Anruf Gruppenanruf 1:1 Teams-Interoperabilitätsanruf Gruppenteams-Interoperabilitätsanruf
Communication Services-Benutzer ✔️ ✔️ ✔️
Microsoft 365-Benutzer ✔️ ✔️ ✔️

Vorgänge

Die folgenden Tabellen zeigen die Unterstützung einzelner APIs beim Aufruf des SDK für einzelne Identitätstypen.

Vorgänge Communication Services-Benutzer Microsoft 365-Benutzer
Abrufen des Ereignisses, dass die Transkription begonnen wurde ✔️ ✔️
Abrufen des Transkriptionsstatus ✔️ ✔️
Starten oder Beenden der Transkription
Erfahren, ob eine explizite Einwilligung erforderlich ist ✔️[1] ✔️[1]
Explizite Einwilligung in die Transkription ✔️[1] ✔️[1]

[1] Diese Funktionalität ist nur in Teams-Besprechungen und -Interoperabilitätsgruppenanrufen verfügbar.

SDKs

Die folgenden Tabellen zeigen die Unterstützung der Transkription in einzelnen Azure Communication Services-SDKs.

Plattformen Web Web-Benutzeroberfläche iOS iOS-Benutzeroberfläche Android Android-Benutzeroberfläche Windows
Unterstützt ✔️ ✔️[1] ✔️[1] ✔️[1] ✔️[1] ✔️[1] ✔️[1]

[1] Diese SDKs unterstützen keine explizite Einwilligung.

Das SDK installieren

Verwenden Sie den Befehl npm install, um die Common und Calling SDKs von Azure Communication Services für JavaScript zu installieren:

npm install @azure/communication-common --save
npm install @azure/communication-calling --save

Initialisieren erforderlicher Objekte

Für die meisten Anrufvorgänge ist eine CallClient-Instanz erforderlich. Wenn Sie eine neue CallClient-Instanz erstellen, können Sie diese mit benutzerdefinierten Optionen wie einer Logger-Instanz konfigurieren.

Mit der CallClient-Instanz können Sie eine CallAgent-Instanz erstellen, indem Sie den Agent für die Anruferstellung (createCallAgent) aufrufen. Durch diese Methode wird ein CallAgent-Instanzobjekt asynchron zurückgegeben.

Die Methode createCallAgent verwendet CommunicationTokenCredential als Argument, welches ein Benutzerzugriffstoken akzeptiert.

Sie können die Methode getDeviceManager für die Instanz CallClient verwenden, um auf deviceManager zuzugreifen.

const { CallClient } = require('@azure/communication-calling');
const { AzureCommunicationTokenCredential} = require('@azure/communication-common');
const { AzureLogger, setLogLevel } = require("@azure/logger");

// Set the logger's log level
setLogLevel('verbose');

// Redirect log output to console, file, buffer, REST API, or whatever location you want
AzureLogger.log = (...args) => {
    console.log(...args); // Redirect log output to console
};

const userToken = '<USER_TOKEN>';
callClient = new CallClient(options);
const tokenCredential = new AzureCommunicationTokenCredential(userToken);
const callAgent = await callClient.createCallAgent(tokenCredential, {displayName: 'optional Azure Communication Services user name'});
const deviceManager = await callClient.getDeviceManager()

Optimale Verwaltung der Konnektivität zwischen SDK und Microsoft-Infrastruktur

Die Call Agent-Instanz unterstützt Sie bei der Verwaltung von Anrufen (Annehmen oder Starten von Anrufen). Damit Ihr Calling SDK funktioniert, muss eine Verbindung mit der Microsoft-Infrastruktur hergestellt werden, um Benachrichtigungen über eingehende Anrufe zu erhalten und andere Anrufdetails zu koordinieren. Ihre Call Agent-Instanz kann zwei Status haben:

Connected (Verbunden) – Der connectionState-Wert Connected für Call Agent bedeutet, dass das Client-SDK verbunden ist und Benachrichtigungen von der Microsoft-Infrastruktur empfangen kann.

Disconnected (Getrennt) – Der connectionState-Wert Disconnected für Call Agent weist darauf hin, dass das SDK nicht ordnungsgemäß verbunden werden kann. Call Agent muss neu erstellt werden.

  • invalidToken: Wenn ein Token abgelaufen oder ungültig ist, wird die Call Agent-Instanz mit diesem Fehler getrennt.
  • connectionIssue: Wenn ein Problem mit der Verbindung zwischen dem Client und der Microsoft-Infrastruktur auftritt, gibt Call Agent nach mehreren Versuchen den connectionIssue-Fehler zurück.

Sie können überprüfen, ob Ihre lokale Call Agent-Instanz mit der Microsoft-Infrastruktur verbunden ist, indem Sie den aktuellen Wert der connectionState-Eigenschaft prüfen. Während eines aktiven Anrufs können Sie auf das connectionStateChanged-Ereignis lauschen, um zu bestimmen, ob sich der Call Agent-Status von Connected in Disconnected ändert.

const connectionState = callAgentInstance.connectionState;
console.log(connectionState); // it may return either of 'Connected' | 'Disconnected'

const connectionStateCallback = (args) => {
    console.log(args); // it will return an object with oldState and newState, each of having a value of either of 'Connected' | 'Disconnected'
    // it will also return reason, either of 'invalidToken' | 'connectionIssue'
}
callAgentInstance.on('connectionStateChanged', connectionStateCallback);

Warnung

Aufgrund von Änderungen in Microsoft Teams werden durch JavaScript-Aufrufe von SDKs mit Version 1.21 und niedriger die Transkription von Teams beendet und Teams-Benutzer und -Benutzerinnen daran gehindert, eine Transkription zu starten. Wenn Sie die Teams-Transkription in den Anrufen und Besprechungen nutzen möchten, müssen Sie Ihr Anruf-SDK auf mindestens Version 1.22 aktualisieren.

Anruftranskription

Transcription ist ein erweitertes Feature der Klasse Call. Sie müssen zunächst das API-Objekt des Transkriptionsfeatures abrufen:

const callTranscriptionFeature = call.feature(Features.Transcription);

Sie können den Status der Transkription in der Eigenschaft isTranscriptionActiveüberprüfen. Wenn der Wert auf true festgelegt wird, ist die Transkription aktiv.

const isTranscriptionActive = callTranscriptionFeature.isTranscriptionActive;

Sie können Ereignisse abonnieren, die ausgelöst werden, wenn sich der Status der Transkription ändert:

const isTranscriptionActiveChangedHandler = () => {
  console.log(callTranscriptionFeature.isTranscriptionActive);
};
callTranscriptionFeature.on('isTranscriptionActiveChanged', isTranscriptionActiveChangedHandler);

Sie können das Ereignisabonnement mit dem folgenden Code kündigen:

callTranscriptionFeature.off('isTranscriptionActiveChanged', isTranscriptionActiveChangedHandler);

Wenn Ihre Teams-Besprechung oder Ihr Anruf so konfiguriert ist, dass eine explizite Einwilligung für Aufzeichnung oder Transkription erforderlich ist, müssen Sie die explizite Einwilligung der Benutzer einholen, um die Transkription oder Aufzeichnung zuzulassen. Sie können proaktiv einwilligen, wenn Sie an der Besprechung teilnehmen, oder reaktiv beim Starten der Aufzeichnung oder Transkription. Bis zur ausdrücklichen Einwilligung wird die Audio-, Video- und Bildschirmfreigabe der Teilnehmer während der Transkription deaktiviert.

Sie können anhand der Eigenschaft isTeamsConsentRequired überprüfen, ob für die Besprechungstranskription die explizite Einwilligung erforderlich ist. Wenn der Wert auf true festgelegt ist, ist für call eine explizite Einwilligung erforderlich.

const isTranscriptionConsentRequired = callTranscriptionFeature.isTeamsConsentRequired;

Wenn Sie die Einwilligung des Benutzers für die Transkription bereits erhalten haben, können Sie die grantTeamsConsent()-Methode aufrufen, um die explizite Einwilligung zum Dienst anzugeben. Diese Einwilligung gilt nur für eine call-Sitzung, und Benutzer müssen erneut einwilligen, wenn sie erneut an der Besprechung teilnehmen.

callTranscriptionFeature.grantTeamsConsent();

Versuche zum Aktivieren von Audio-, Video- oder Bildschirmfreigabe schlagen fehl, wenn die Transkription aktiv und die explizite Einwilligung erforderlich ist, aber noch nicht gegeben wurde. Sie erkennen diese Situation, indem Sie die Eigenschaft reason der Klasse ParticipantCapabilities auf die Funktionen turnVideoOn, unmuteMic und shareScreen überprüfen. Sie finden diese Funktionen im Feature call.feature(Features.Capabilities). Diese Funktionen geben den Grund ExplicitConsentRequired zurück, da Benutzer ihre explizite Einwilligung erteilen müssen.

Das SDK installieren

Wählen Sie Ihre Datei build.gradle auf Projektebene aus, und fügen Sie mavenCentral() der Liste der Repositorys unter buildscript und allprojects hinzu:

buildscript {
    repositories {
    ...
        mavenCentral()
    ...
    }
}
allprojects {
    repositories {
    ...
        mavenCentral()
    ...
    }
}

Fügen Sie anschließend in der Datei build.gradle auf Modulebene die folgenden Zeilen im Abschnitt dependencies hinzu:

dependencies {
    ...
    implementation 'com.azure.android:azure-communication-calling:1.0.0'
    ...
}

Initialisieren der erforderlichen Objekte

Zum Erstellen einer CallAgent-Instanz müssen Sie die createCallAgent-Methode für eine CallClient-Instanz aufrufen. Dieser Aufruf gibt asynchron ein CallAgent-Instanzobjekt zurück.

Die createCallAgent-Methode verwendet CommunicationUserCredential als Argument, womit ein Zugriffstoken gekapselt wird.

Um auf DeviceManager zuzugreifen, müssen Sie zuerst eine callAgent-Instanz erstellen. Anschließend können Sie die CallClient.getDeviceManager-Methode zum Abrufen von DeviceManager verwenden.

String userToken = '<user token>';
CallClient callClient = new CallClient();
CommunicationTokenCredential tokenCredential = new CommunicationTokenCredential(userToken);
android.content.Context appContext = this.getApplicationContext(); // From within an activity, for instance
CallAgent callAgent = callClient.createCallAgent(appContext, tokenCredential).get();
DeviceManager deviceManager = callClient.getDeviceManager(appContext).get();

Zum Festlegen eines Anzeigenamens für den Anrufer verwenden Sie diese alternative Methode:

String userToken = '<user token>';
CallClient callClient = new CallClient();
CommunicationTokenCredential tokenCredential = new CommunicationTokenCredential(userToken);
android.content.Context appContext = this.getApplicationContext(); // From within an activity, for instance
CallAgentOptions callAgentOptions = new CallAgentOptions();
callAgentOptions.setDisplayName("Alice Bob");
DeviceManager deviceManager = callClient.getDeviceManager(appContext).get();
CallAgent callAgent = callClient.createCallAgent(appContext, tokenCredential, callAgentOptions).get();

Warnung

Bis zur Version 1.1.0 und der Betaversion 1.1.0-beta.1 des Azure Communication Services Calling Android SDK sind isTranscriptionActive und addOnIsTranscriptionActiveChangedListener Teil des Call-Objekts. Für die neuen Betaversionen wurden diese APIs als erweitertes Feature von Call verschoben, wie unten beschrieben.

Die Anruftranskription ist ein erweitertes Feature des zentralen Call-Objekts. Sie müssen zunächst das Objekt des Transkriptionsfeatures abrufen:

TranscriptionCallFeature callTranscriptionFeature = call.feature(Features.TRANSCRIPTION);

Um anschließend herauszufinden, ob der Anruf transkribiert wird, prüfen Sie die Eigenschaft isTranscriptionActive von callTranscriptionFeature. Er gibt boolean zurück.

boolean isTranscriptionActive = callTranscriptionFeature.isTranscriptionActive();

Sie können auch Transkriptionsänderungen abonnieren:

private void handleCallOnIsTranscriptionChanged(PropertyChangedEvent args) {
    boolean isTranscriptionActive = callTranscriptionFeature.isTranscriptionActive();
}

callTranscriptionFeature.addOnIsTranscriptionActiveChangedListener(handleCallOnIsTranscriptionChanged);

Einrichten des Systems

Führen Sie die unten angegebenen Schritte aus, um Ihr System einzurichten.

Erstellen des Xcode-Projekts

Erstellen Sie in Xcode ein neues iOS-Projekt, und wählen Sie die Vorlage Single View App (Einzelansicht-App) aus. In diesem Artikel wird das SwiftUI-Framework verwendet. Legen Sie daher Sprache auf Swift und Schnittstelle auf SwiftUI fest.

Sie werden in diesem Artikel keine Tests erstellen. Sie können das Kontrollkästchen Tests einschließen deaktivieren.

Screenshot: Fenster zum Erstellen eines Projekts in Xcode

Installieren des Pakets und der Abhängigkeiten mithilfe von CocoaPods

  1. Erstellen Sie eine Podfile-Datei für die Anwendung, wie in diesem Beispiel:

    platform :ios, '13.0'
    use_frameworks!
    target 'AzureCommunicationCallingSample' do
        pod 'AzureCommunicationCalling', '~> 1.0.0'
    end
    
  2. Führen Sie pod install aus.

  3. Öffnen Sie .xcworkspace mithilfe von Xcode.

Anfordern des Zugriffs auf das Mikrofon

Um auf das Mikrofon des Geräts zuzugreifen, müssen Sie die Liste der Informationseigenschaften Ihrer App mithilfe von NSMicrophoneUsageDescription aktualisieren. Legen Sie den zugehörigen Wert auf eine Zeichenfolge fest. Diese wird in den Dialog aufgenommen, mit dem das System den Zugriff beim Benutzer anfordert.

Klicken Sie mit der rechten Maustaste auf den Eintrag info.plist in der Projektstruktur, und wählen Sie dann Öffnen als>Quellcode aus. Fügen Sie im Abschnitt <dict> der obersten Ebene die folgenden Zeilen hinzu, und speichern Sie dann die Datei.

<key>NSMicrophoneUsageDescription</key>
<string>Need microphone access for VOIP calling.</string>

Einrichten des App-Frameworks

Öffnen Sie die Datei ContentView.swift Ihres Projekts. Fügen Sie am Anfang der Datei eine import-Deklaration hinzu, um die AzureCommunicationCalling-Bibliothek zu importieren. Importieren Sie außerdem AVFoundation. Sie ist für Audioberechtigungsanforderungen im Code erforderlich.

import AzureCommunicationCalling
import AVFoundation

Initialisieren von „CallAgent“

Um eine CallAgent-Instanz auf der Grundlage von CallClient zu erstellen, müssen Sie eine Methode vom Typ callClient.createCallAgent verwenden, die asynchron ein Objekt vom Typ CallAgent zurückgibt, nachdem es initialisiert wurde.

Übergeben Sie für die Erstellung eines Anrufclients ein Objekt vom Typ CommunicationTokenCredential:

import AzureCommunication

let tokenString = "token_string"
var userCredential: CommunicationTokenCredential?
do {
    let options = CommunicationTokenRefreshOptions(initialToken: token, refreshProactively: true, tokenRefresher: self.fetchTokenSync)
    userCredential = try CommunicationTokenCredential(withOptions: options)
} catch {
    updates("Couldn't created Credential object", false)
    initializationDispatchGroup!.leave()
    return
}

// tokenProvider needs to be implemented by Contoso, which fetches a new token
public func fetchTokenSync(then onCompletion: TokenRefreshOnCompletion) {
    let newToken = self.tokenProvider!.fetchNewToken()
    onCompletion(newToken, nil)
}

Übergeben Sie das von Ihnen erstellte Objekt vom Typ CommunicationTokenCredential an CallClient, und legen Sie den Anzeigenamen fest:

self.callClient = CallClient()
let callAgentOptions = CallAgentOptions()
options.displayName = " iOS Azure Communication Services User"

self.callClient!.createCallAgent(userCredential: userCredential!,
    options: callAgentOptions) { (callAgent, error) in
        if error == nil {
            print("Create agent succeeded")
            self.callAgent = callAgent
        } else {
            print("Create agent failed")
        }
})

Warnung

Bis zur Version 1.1.0 und der Betaversion 1.1.0-beta.1 des Azure Communication Services Calling iOS SDK wird isTranscriptionActive als Teil des Call-Objekts verwendet und didChangeTranscriptionState ist Teil des CallDelegate-Delegaten. Für die neuen Betaversionen wurden diese APIs als erweitertes Feature von Call verschoben, wie unten beschrieben.

Die Anruftranskription ist ein erweitertes Feature des zentralen Call-Objekts. Sie müssen zunächst das Objekt des Transkriptionsfeatures abrufen:

let callTranscriptionFeature = call.feature(Features.transcription)

Um anschließend herauszufinden, ob der Anruf transkribiert wird, prüfen Sie die Eigenschaft isTranscriptionActive von callTranscriptionFeature. Er gibt Bool zurück.

let isTranscriptionActive = callTranscriptionFeature.isTranscriptionActive;

Sie können die Transkriptionsänderungen auch abonnieren, indem Sie den TranscriptionCallFeatureDelegate-Delegaten für Ihre Klasse mit dem Ereignis didChangeTranscriptionState implementieren:

callTranscriptionFeature.delegate = self

// didChangeTranscriptionState is a member of TranscriptionCallFeatureDelegate
public func transcriptionCallFeature(_ transcriptionCallFeature: TranscriptionCallFeature, didChangeTranscriptionState args: PropertyChangedEventArgs) {
    let isTranscriptionActive = callTranscriptionFeature.isTranscriptionActive
}

Einrichten des Systems

Führen Sie die unten angegebenen Schritte aus, um Ihr System einzurichten.

Erstellen des Visual Studio-Projekts

Erstellen Sie für eine UWP-App (Universelle Windows-Plattform) in Visual Studio 2022 ein neues Projekt vom Typ Leere App (universelles Windows). Nachdem Sie den Projektnamen eingegeben haben, können Sie ein beliebiges Windows SDK höher als Version 10.0.17763.0 auswählen.

Für eine WinUI 3-App erstellen Sie ein neues Projekt mit der Vorlage Leere App, Gepackt (WinUI 3 in Desktop), um eine WinUI 3-Single-Page-Webanwendung einzurichten. Windows-App SDK-Version 1.3 oder höher ist erforderlich.

Installieren Sie das Paket und die Abhängigkeiten mit dem NuGet-Paket-Manager

Die Calling SDK-APIs und -Bibliotheken sind über ein NuGet-Paket öffentlich verfügbar.

So können Sie das NuGet-Paket für das Calling SDK suchen, herunterladen und installieren:

  1. Öffnen Sie den NuGet-Paket-Manager, indem Sie Tools>NuGet-Paket-Manager>NuGet-Pakete für Lösung verwalten auswählen.
  2. Wählen Sie Durchsuchen aus, und geben Sie dann Azure.Communication.Calling.WindowsClient in das Suchfeld ein.
  3. Stellen Sie sicher, dass das Kontrollkästchen Vorabversion einbeziehen aktiviert ist.
  4. Wählen Sie das Paket Azure.Communication.Calling.WindowsClient und dann Azure.Communication.Calling.WindowsClient 1.4.0-beta.1 oder eine neuere Version aus.
  5. Aktivieren Sie das Kontrollkästchen für das Azure Communication Services-Projekt im rechten Bereich.
  6. Wählen Sie Installieren aus.

Die Anruftranskription ist ein erweitertes Feature des zentralen Call-Objekts. Sie müssen zunächst das Objekt des Transkriptionsfeatures abrufen:

TranscriptionCallFeature transcriptionFeature = call.Features.Transcription;

Um anschließend herauszufinden, ob der Anruf transkribiert wird, prüfen Sie die Eigenschaft IsTranscriptionActive von transcriptionFeature. Er gibt boolean zurück.

boolean isTranscriptionActive = transcriptionFeature.isTranscriptionActive;

Sie können auch Transkriptionsänderungen abonnieren:

private async void Call__OnIsTranscriptionActiveChanged(object sender, PropertyChangedEventArgs args)
    boolean isTranscriptionActive = transcriptionFeature.IsTranscriptionActive();
}

transcriptionFeature.IsTranscriptionActiveChanged += Call__OnIsTranscriptionActiveChanged;

Nächste Schritte