Partilhar via


Score Vowpal Wabbit Model

Este artigo descreve como usar o componente Score Vowpal Wabbit Model no designer do Azure Machine Learning para gerar pontuações para um conjunto de dados de entrada, usando um modelo Vowpal Wabbit treinado existente.

Este componente fornece a versão mais recente da estrutura Vowpal Wabbit, versão 8.8.1. Use este componente para pontuar dados usando um modelo treinado salvo no formato VW versão 8.

Como configurar o modelo Score Vowpal Wabbit

  1. Adicione o componente Score Vowpal Wabbit Model ao seu experimento.

  2. Adicione um modelo Vowpal Wabbit treinado e conecte-o à porta de entrada esquerda. Você pode usar um modelo treinado criado no mesmo experimento ou localizar um modelo salvo na categoria Conjuntos de dados do painel de navegação esquerdo do designer. No entanto, o modelo deve estar disponível no Azure Machine Learning Designer.

    Nota

    Apenas os modelos Vowpal Wabbit 8.8.1 são suportados; Não é possível conectar modelos salvos que foram treinados usando outros algoritmos.

  3. Adicione o conjunto de dados de teste e conecte-o à porta de entrada à direita. Se o conjunto de dados de teste for um diretório, que contém o arquivo de dados de teste, especifique o nome do arquivo de dados de teste com Nome do arquivo de dados de teste. Se o conjunto de dados de teste for um único arquivo, deixe Nome do arquivo de dados de teste vazio.

  4. Na caixa de texto Argumentos VW, digite um conjunto de argumentos de linha de comando válidos para o executável Vowpal Wabbit.

    Para obter informações sobre quais argumentos Vowpal Wabbit são suportados e não suportados no Azure Machine Learning, consulte a seção Notas técnicas.

  5. Nome do arquivo de dados de teste: digite o nome do arquivo que contém os dados de entrada. Esse argumento só é usado quando o conjunto de dados de teste é um diretório.

  6. Especificar tipo de arquivo: indique o formato usado pelos dados de treinamento. Vowpal Wabbit suporta estes dois formatos de arquivo de entrada:

    • VW representa o formato interno usado por Vowpal Wabbit . Consulte a página wiki do Vowpal Wabbit para obter detalhes.
    • SVMLight é um formato usado por algumas outras ferramentas de aprendizado de máquina.
  7. Selecione a opção Incluir uma coluna extra contendo rótulos, se quiser produzir rótulos juntamente com as pontuações.

    Normalmente, ao manipular dados de texto, o Vowpal Wabbit não requer rótulos e retornará apenas as pontuações para cada linha de dados.

  8. Selecione a opção Incluir uma coluna extra contendo pontuações brutas, se quiser produzir pontuações brutas juntamente com os resultados.

  9. Envie o pipeline.

Resultados

Após a conclusão da formação:

  • Para visualizar os resultados, clique com o botão direito do mouse na saída do componente Score Vowpal Wabbit Model . A saída indica uma pontuação de previsão normalizada de 0 a 1.

  • Para avaliar os resultados, o conjunto de dados de saída deve conter nomes de colunas de pontuação específicos, que atendam aos requisitos do componente Avaliar modelo.

    • Para a tarefa de regressão, o conjunto de dados a ser avaliado deve ter uma coluna, chamada Regression Scored Labels, que representa os rótulos pontuados.
    • Para a tarefa de classificação binária, o conjunto de dados a ser avaliado deve ter duas colunas, denominadas Binary Class Scored Labels,Binary Class Scored Probabilities, que representam rótulos pontuados e probabilidades, respectivamente.
    • Para a tarefa de classificação múltipla, o conjunto de dados a ser avaliado deve ter uma coluna, chamada Multi Class Scored Labels, que representa os rótulos pontuados.

    Observe que os resultados do componente Score Vowpal Wabbit Model não podem ser avaliados diretamente. Antes de avaliar, o conjunto de dados deve ser modificado de acordo com os requisitos acima.

Notas técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Parâmetros

Vowpal Wabbit tem muitas opções de linha de comando para escolher e ajustar algoritmos. Não é possível um debate aprofundado destas opções neste caso; recomendamos que você veja a página wiki Vowpal Wabbit.

Os parâmetros a seguir não são suportados no Azure Machine Learning Studio (clássico).

  • As opções de entrada/saída especificadas em https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Essas propriedades já são configuradas automaticamente pelo componente.

  • Além disso, qualquer opção que gere várias saídas ou tenha várias entradas não é permitida. Estes incluem --cbt, --lda, e --wap.

  • Apenas algoritmos de aprendizagem supervisionada são suportados. Isto não permite estas opções: –active, --rank, --search etc.

Todos os argumentos que não os descritos acima são permitidos.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.