Converter em ARFF
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Converte a entrada de dados para o formato de arquivo de relação de atributo usado pelo conjunto de ferramentas Weka
Categoria: conversões de formato de dados
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descreve como usar o módulo converter para ARFF no Machine Learning Studio (clássico), para converter conjuntos de e resultados do formato de arquivo de relação de atributo usado pelo conjunto de ferramentas Weka. Esse formato é conhecido como ARFF.
A especificação de dados ARFF para weka dá suporte a várias tarefas de aprendizado de máquina, incluindo pré-processamento de dados, classificação e seleção de recursos. Nesse formato, os dados são organizados por entidades e seus atributos, e estão contidos em um único arquivo de texto. Você pode encontrar detalhes do formato de arquivo weka na seção observações técnicas .
em geral, a conversão para o formato de arquivo Weka é necessária apenas se você quiser usar Machine Learning e Weka e pretende mover seus dados de treinamento entre eles.
Para obter mais informações sobre o conjunto de ferramentas weka, consulte este artigo da Wikipédia: weka (Machine Learning)
Aviso
Não é possível substituir um arquivo ARFF existente no armazenamento do Azure.
Como usar Convert para ARFF
Adicione o módulo converter em ARFF ao seu experimento. você pode encontrar esse módulo na categoria de conversões de formato de dados no Machine Learning Studio (clássico).
Conecte-o a qualquer módulo que produza um conjunto de dados.
Execute o experimento ou clique no módulo converter para ARFF e clique em executar selecionado.
Resultados
Para criar uma cópia dos dados em uma pasta local, clique duas vezes na saída de converter em ARFFe selecione a opção baixar .
Se você não especificar uma pasta, um nome de arquivo padrão será aplicado e o arquivo será salvo na biblioteca de downloads local.
Observação
Este módulo não dá suporte à exportação para o código Python ou R.
Exemplos
Não há exemplos específicos para esse formato no Galeria de ia do Azure. No entanto, esses experimentos demonstram outros tipos de conversão de formato:
Compactação de imagem baseada em cores: exporta os conjuntos de valores usados para cada parte da análise para os arquivos para reprodução e use em outras plataformas de análise.
Validação cruzada para exemplo de classificação binária: exporta os resultados da validação cruzada para arquivos para que os resultados de vários modelos possam ser comparados usando uma ferramenta como Excel.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Exemplo de formato ARFF
Esta seção fornece um exemplo de como um conjunto de um DataSet típico seria exibido quando convertido em ARFF.
Normalmente, um arquivo de dados ARFF é composto de duas seções: um cabeçalho que define a fonte de dados e o esquema e a seção de dados , que contém as entidades reais e seus atributos.
Cabeçalho ARFF
O cabeçalho de um arquivo ARFF define a lista de atributos (em colunas) e seus tipos de dados. O cabeçalho também pode conter várias linhas de comentário que descrevem a origem de dados ou quaisquer outras notas.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Dica
Se o conjunto de módulos que você está convertendo não tiver nomes de coluna, use o módulo Editar metadados para adicionar nomes de coluna antes de usar a conversão em ARFF.
Dados do ARFF
A seção de dados consiste em valores separados por vírgulas e parece muito parecido com um arquivo CSV sem títulos de coluna.
@DATA 5.1,3.5,1.4,0.2,0
Para obter informações adicionais sobre esse formato de arquivo, consulte a página wiki do weka: ARFF (versão do desenvolvedor).
Versão atual do ARFF
Machine Learning Studio (clássico) salva os arquivos ARFF usando o formato ARFF 3,0.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Dataset | Tabela de Dados | Conjunto de dados de entrada |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | Arff | Conjunto de dados de saída |