Tabela de Dados
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Classe de tabela de dados
Um conjunto de dados inclui dados que foram atualizados no Machine Learning Studio (clássico), de forma que possam ser usados no processo de modelagem. Mesmo se você carrega dados em outro formato ou especifica um formato de armazenamento como CSV, ARFF ou TSV, os dados são implicitamente convertidos para um objeto DataTable
sempre que usados por um módulo em um experimento.
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
O conjuntos de dados é baseado na tabela de dados do .NET
Tipos de coluna
A DataTable
consiste em uma coleção de colunas com metadados associados. Essas colunas implementam a interface IArray
. As colunas de dados no Machine Learning Studio (clássico) são compreendidas como matrizes unidimensionais , ou seja, vetores.
A classe .NET Array implementa essas interfaces genéricas: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
e System.Collections.Generic.IEnumerable<T>
.
Colunas de tipos int
, double
, e Boolean
normalmente são representadas como matrizes densas numéricas. Se uma coluna densa contiver valores ausentes, ela será tratada como uma matriz de valores ausentes ou como uma matriz densa de objeto nulo.
Colunas que contêm cadeias de caracteres são tratadas como matrizes densas do objeto. Se houver valores ausentes, os valores ausentes serão representados como nulos ou como o tipo MissingValuesObjectArray<string>
.
Para obter mais informações, consulte Array Class (Biblioteca MSDN).
Obter colunas em uma DataTable
Você pode obter uma coluna chamando o GetColumn
método na DataTable. O GetColumn
método tem duas sobrecargas:
GetColumn(<Int64>)
obtém uma coluna por seu índice.GetColumn(<string>)
obtém uma coluna por seu nome.
Outras interfaces no Studio (clássico)
Esta seção também descreve as seguintes interfaces para Machine Learning Studio (clássico):
Tipo | Descrição |
---|---|
Interface ICluster | A interface ICluster define a estrutura de modelos de clustering. |
Interface IFilter | A interface IFilter define a estrutura dos filtros de processamento de sinal digital aplicados a uma série inteira de valores numéricos. Os filtros podem ser criados e salvos e aplicados a uma nova série. |
Interface ILearner | A interface ILearner fornece uma estrutura genérica para definir e salvar modelos analíticos, excluindo alguns tipos especiais, como modelos de clustering. |
Interface ITransform | A interface ITransform fornece uma estrutura genérica para definir e salvar transformações. Você pode criar um iTransform usando Machine Learning Studio (clássico) e aplicar a transformação a novos conjuntos de dados. |