Compartilhar via


Datasets - Create

Carrega e cria um novo conjunto de dados obtendo os dados de uma URL especificada ou começa a aguardar o carregamento de blocos de dados.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

Parâmetros de URI

Nome Em Obrigatório Tipo Description
endpoint
path True

string

Pontos de extremidade dos Serviços Cognitivos com suporte (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com).

Corpo da solicitação

Nome Obrigatório Tipo Description
displayName True

string

O nome para exibição do objeto.

kind True

DatasetKind

DatasetKind
Tipo de importação de dados.

locale True

string

A localidade dos dados contidos.

contentUrl

string

A URL dos dados do conjunto de dados.

customProperties

object

As propriedades personalizadas dessa entidade. O comprimento máximo permitido da chave é de 64 caracteres, o comprimento máximo de valor permitido é de 256 caracteres e a contagem de entradas permitidas é 10.

description

string

A descrição do objeto .

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

Respostas

Nome Tipo Description
201 Created

Dataset

A resposta contém informações sobre a entidade como conteúdo e sua localização como cabeçalho.

Cabeçalhos

Location: string

Other Status Codes

Error

Ocorreu um erro.

Segurança

Ocp-Apim-Subscription-Key

Forneça sua chave de conta de serviços cognitivos aqui.

Tipo: apiKey
Em: header

Authorization

Forneça um token de acesso do JWT retornado pelo STS desta região. Adicione o escopo de gerenciamento ao token adicionando a seguinte cadeia de caracteres de consulta à URL do STS: ?scope=speechservicesmanagement

Tipo: apiKey
Em: header

Exemplos

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Solicitação de exemplo

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Resposta de exemplo

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Solicitação de exemplo

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Resposta de exemplo

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definições

Nome Description
Dataset

Dataset

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Erro

ErrorCode

ErrorCode

InnerError

InnerError

Status

Status

TextNormalizationKind

TextNormalizationKind

Dataset

Dataset

Nome Tipo Description
contentUrl

string

A URL dos dados do conjunto de dados.

createdDateTime

string

O carimbo de data/hora quando o objeto foi criado. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

As propriedades personalizadas dessa entidade. O comprimento máximo permitido da chave é de 64 caracteres, o comprimento máximo de valor permitido é de 256 caracteres e a contagem de entradas permitidas é 10.

description

string

A descrição do objeto .

displayName

string

O nome para exibição do objeto.

kind

DatasetKind

DatasetKind
Tipo de importação de dados.

lastActionDateTime

string

O carimbo de data/hora em que o status atual foi inserido. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

A localidade dos dados contidos.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

O local dessa entidade.

status

Status

Status
Descrever o estado atual da API

DatasetKind

DatasetKind

Nome Tipo Description
Acoustic

string

Um conjunto de dados acústico.

AudioFiles

string

Um conjunto de dados de arquivos de áudio.

Language

string

Um conjunto de dados de linguagem.

LanguageMarkdown

string

Um conjunto de dados de markdown de idioma.

OutputFormatting

string

Conjunto de dados que contém regras para personalizar a normalização de texto inverso, uso de maiúsculas, reformulação, conteúdo ofensivo e também define testes para validação de conjunto de dados

Pronunciation

string

Um conjunto de dados de pronúncia.

DatasetLinks

Nome Tipo Description
commitBlocks

string

O local para confirmar a lista de blocos ao carregar um conjunto de dados usando blocos. Confira a operação "Datasets_CommitBlocks" para obter mais detalhes.

files

string

O local para obter todos os arquivos dessa entidade. Confira a operação "Datasets_ListFiles" para obter mais detalhes.

listBlocks

string

O local para listar os blocos já carregados dessa entidade ao carregar um conjunto de dados usando blocos. Confira a operação "Datasets_GetBlocks" para obter mais detalhes.

uploadBlocks

string

O local para o qual carregar blocos ao carregar um conjunto de dados usando blocos. Confira a operação "Datasets_UploadBlock" para obter mais detalhes.

DatasetProperties

DatasetProperties

Nome Tipo Description
acceptedLineCount

integer

O número de linhas aceitas para esse conjunto de dados.

duration

string

A duração total dos conjuntos de dados se ele contiver arquivos de áudio. A duração é codificada como duração ISO 8601 ("PnYnMnDTnHnMnS", consulte https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

O endereço de email para o qual enviar notificações por email caso a operação seja concluída. O valor será removido depois de enviar o email com êxito.

error

EntityError

EntityError

rejectedLineCount

integer

O número de linhas rejeitadas para esse conjunto de dados.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
O tipo de normalização de texto.

DetailedErrorCode

DetailedErrorCode

Nome Tipo Description
DataImportFailed

string

Falha na importação de dados.

DeleteNotAllowed

string

Exclusão não permitida.

DeployNotAllowed

string

Implantação não permitida.

DeployingFailedModel

string

Implantando um modelo com falha.

EmptyRequest

string

Solicitação vazia.

EndpointCannotBeDefault

string

O ponto de extremidade não pode ser padrão.

EndpointNotUpdatable

string

Ponto de extremidade não atualizável.

EndpointWithoutLogging

string

Ponto de extremidade sem registro em log.

ExceededNumberOfRecordingsUris

string

Número excedido de uris de gravações.

FailedDataset

string

Conjunto de dados com falha.

Forbidden

string

Negado.

InUseViolation

string

Violação de uso.

InaccessibleCustomerStorage

string

Armazenamento inacessível do cliente.

InvalidAdaptationMapping

string

Mapeamento de adaptação inválido.

InvalidBaseModel

string

Modelo base inválido.

InvalidCallbackUri

string

URI de retorno de chamada inválido.

InvalidCollection

string

Coleção inválida.

InvalidDataset

string

Conjunto de dados inválido.

InvalidDocument

string

Documento inválido.

InvalidDocumentBatch

string

Lote de Documentos Inválido.

InvalidLocale

string

Localidade inválida.

InvalidLogDate

string

Data de log inválida.

InvalidLogEndTime

string

Hora de término do log inválida.

InvalidLogId

string

ID de log inválida.

InvalidLogStartTime

string

Hora de início do log inválida.

InvalidModel

string

Modelo inválido.

InvalidModelUri

string

URI de modelo inválido.

InvalidParameter

string

Parâmetro inválido.

InvalidParameterValue

string

Valor de parâmetro inválido.

InvalidPayload

string

Conteúdo inválido.

InvalidPermissions

string

Permissões inválidas.

InvalidPrerequisite

string

Pré-requisito inválido.

InvalidProductId

string

ID do produto inválida.

InvalidProject

string

Projeto inválido.

InvalidProjectKind

string

Tipo de projeto inválido.

InvalidRecordingsUri

string

URI de gravações inválido.

InvalidRequestBodyFormat

string

Formato do corpo da solicitação inválido.

InvalidSasValidityDuration

string

Duração de validade sas inválida.

InvalidSkipTokenForLogs

string

Token de ignorar inválido para logs.

InvalidSourceAzureResourceId

string

ID de recurso do Azure de origem inválida.

InvalidSubscription

string

Assinatura inválida.

InvalidTest

string

Teste inválido.

InvalidTimeToLive

string

Tempo de vida inválido.

InvalidTopForLogs

string

Parte superior inválida para logs.

InvalidTranscription

string

Transcrição inválida.

InvalidWebHookEventKind

string

Tipo de evento de web hook inválido.

MissingInputRecords

string

Registros de entrada ausentes.

ModelCopyOperationExists

string

A operação de cópia de modelo existe.

ModelDeploymentNotCompleteState

string

O estado de implantação do modelo não foi concluído.

ModelDeprecated

string

Modelo preterido.

ModelExists

string

O modelo existe.

ModelMismatch

string

Incompatibilidade de modelo.

ModelNotDeployable

string

Modelo não implantável.

ModelVersionIncorrect

string

Versão do modelo Incorreta.

NoUtf8WithBom

string

Não utf8 com bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Apenas uma das URLs, contêiner ou conjunto de dados.

ProjectGenderMismatch

string

Incompatibilidade de gênero do projeto.

QuotaViolation

string

Violação de cota.

SingleDefaultEndpoint

string

Ponto de extremidade padrão único.

SkuLimitsExist

string

Existem limites de SKU.

SubscriptionNotFound

string

Assinatura não encontrada.

UnexpectedError

string

Erro inesperado.

UnsupportedClassBasedAdaptation

string

Adaptação baseada em classe sem suporte.

UnsupportedDelta

string

Delta sem suporte.

UnsupportedDynamicConfiguration

string

Configuração dinâmica sem suporte.

UnsupportedFilter

string

Filtro sem suporte.

UnsupportedLanguageCode

string

Código de idioma sem suporte.

UnsupportedOrderBy

string

Ordem sem suporte por.

UnsupportedPagination

string

Paginação sem suporte.

UnsupportedTimeRange

string

Intervalo de tempo sem suporte.

EntityError

EntityError

Nome Tipo Description
code

string

O código desse erro.

message

string

A mensagem para esse erro.

EntityReference

EntityReference

Nome Tipo Description
self

string

O local da entidade referenciada.

Error

Erro

Nome Tipo Description
code

ErrorCode

ErrorCode
Códigos de erro de alto nível.

details

Error[]

Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de erro interno que está em conformidade com as Diretrizes de API dos Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Ele contém as propriedades obrigatórias ErrorCode e message, bem como as propriedades opcionais target, details (par chave-valor) e inner error (pode ser aninhada).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documents" ou "document id" no caso de um documento inválido.

ErrorCode

ErrorCode

Nome Tipo Description
Conflict

string

Representando o código de erro de conflito.

Forbidden

string

Representando o código de erro proibido.

InternalCommunicationFailed

string

Representando o código de erro de falha de comunicação interna.

InternalServerError

string

Representando o código de erro interno do servidor.

InvalidArgument

string

Representando o código de erro de argumento inválido.

InvalidRequest

string

Representando o código de erro de solicitação inválido.

NotAllowed

string

Representando o código de erro não permitido.

NotFound

string

Representando o código de erro não encontrado.

PipelineError

string

Representando o código de erro do pipeline.

ServiceUnavailable

string

Representando o código de erro de serviço indisponível.

TooManyRequests

string

Representando o código de erro de muitas solicitações.

Unauthorized

string

Representando o código de erro não autorizado.

UnprocessableEntity

string

Representando o código de erro de entidade não processável.

UnsupportedMediaType

string

Representando o código de erro de tipo de mídia sem suporte.

InnerError

InnerError

Nome Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeração de código de erro detalhada.

details

object

Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de erro interno que está em conformidade com as Diretrizes de API dos Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Ele contém as propriedades obrigatórias ErrorCode e message, bem como as propriedades opcionais target, details (par chave-valor) e inner error (pode ser aninhada).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documents" ou "document id" no caso de um documento inválido.

Status

Status

Nome Tipo Description
Failed

string

A operação de execução prolongada falhou.

NotStarted

string

A operação de execução prolongada ainda não foi iniciada.

Running

string

A operação de execução prolongada está sendo processada no momento.

Succeeded

string

A operação de execução prolongada foi concluída com êxito.

TextNormalizationKind

TextNormalizationKind

Nome Tipo Description
Default

string

Normalização de texto padrão (por exemplo, '2 a 3' é substituída por 'dois a três' no en-US).

None

string

Nenhuma normalização de texto será aplicada ao texto de entrada. Essa é uma opção de substituição que só deve ser usada quando o texto é normalizado antes do upload.