Aplicar Filtro
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Aplica um filtro para as colunas especificadas de um conjunto de dados
Categoria: transformação/filtro de dados
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descries como usar o módulo aplicar filtro no Machine Learning Studio (clássico) para transformar uma coluna de valores aplicando um filtro previamente definido. Os filtros são usados no processamento de sinal digital para reduzir o ruído ou realçar um padrão. Assim, os valores que você transforma são sempre numéricos e normalmente representam algum tipo de áudio ou sinal visual.
Dica
Você está procurando um tipo diferente de filtro? o Studio (clássico) fornece esses módulos para dados de amostragem, obtenção de um subconjunto de dados, remoção de valores inválidos ou criação de conjuntos de teste e treinamento: dividir dados, limpar dados ausentes, partição e exemplo, aplicar SQL transformação, valores de clipe. Se você precisar filtrar os dados ao lê-los de uma fonte, consulte importar dados. As opções dependem do tipo de origem.
Depois de determinar qual tipo de filtro é melhor para sua fonte de dados, você deve especificar os parâmetros e usar aplicar filtro para transformar o DataSet. Como o design de filtros é separado do processo de aplicação de um filtro, os filtros são reutilizáveis. Por exemplo, se você trabalha frequentemente com dados usados para previsão, pode criar vários tipos de filtros de média de movimento para treinar e comparar vários modelos. Você também pode salvar o filtro para aplicar a outros experimentos ou a diferentes conjuntos de valores.
Como configurar aplicar filtro
Adicione o módulo aplicar filtro ao seu experimento. Você pode encontrar o módulo Filtro IIR em transformação de dados, na categoria filtros .
Para a entrada à direita, conecte um conjunto de dados que contém valores numéricos a uma entrada.
Para a entrada à esquerda, conecte um filtro existente. Você pode reutilizar um filtro salvo ou pode configurar um filtro usando um dos seguintes módulos de filtro: filtro de limite, filtro de média de movimentação, filtro mediano, filtro de IIR, filtro fir, filtro definido pelo usuário.
No painel Propriedades de aplicar filtro, clique em Iniciar seletor de coluna e escolha as colunas às quais o filtro deve ser aplicado.
Execute o experimento ou clique com o botão direito do mouse em aplicar filtro e clique em executar selecionado.
Resultados
A saída contém apenas os dados nas colunas selecionadas, transformados pela aplicação da transformação matemática predefinida especificada.
Se você quiser ver outras colunas no conjunto de linhas, você pode usar o módulo adicionar colunas para mesclar os conjuntos de valores originais e filtrados.
Observação
Os valores na coluna original não foram excluídos ou substituídos e ainda estão disponíveis no experimento para referência. No entanto, a saída do filtro geralmente é mais útil para modelagem.
Exemplos
Para obter exemplos de como os filtros são usados no aprendizado de máquina, consulte o Galeria de ia do Azure:
- Filtros: demonstra todos os tipos de filtro, usando um conjunto de forma de forma de onda com engenharia.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
O módulo aplicar filtro associa o tipo de filtro especificado às colunas selecionadas. Se você precisar aplicar diferentes tipos de filtros a colunas diferentes, deverá usar selecionar colunas no conjunto de linhas para isolar as colunas e aplicar diferentes tipos de filtro em fluxos de trabalho separados. Para obter mais informações, consulte selecionar colunas no conjuntode dados.
Os filtros não passam por colunas de dados que não são afetadas pelo filtro. Ou seja, a saída de Aplicar Filtro contém apenas os valores numéricos transformados. No entanto, você pode usar o módulo adicionar colunas para unir valores transformados com o conjunto de fonte de origem.
Períodos de filtro
O período de filtro é determinado em parte pelo tipo de filtro, da seguinte maneira:
Para resposta de impulso finito (FIR), filtros de média móvel simples e média móvel triangular, o período de filtro é finito.
Para resposta de impulso infinito (IIR), filtros de média móvel exponencial e média móvel cumulativa, o período de filtro é infinito.
Para filtros de limite, o período do filtro é sempre 1.
Para filtros de valor mediano, independentemente do período do filtro, NaNs e valores ausentes no sinal de entrada não produzem novos NaNs na saída.
Valores ausentes
Esta seção descreve o comportamento quando valores ausentes são encontrados, por tipo de filtro. Em geral, quando um filtro encontra um NaN ou um valor ausente no conjunto de dados de entrada, o conjunto de dados de saída torna-se danificado com NaNs para algum próximo número de amostras, dependendo do período do filtro. Isso tem as seguintes consequências:
Os filtros FIR, média móvel simples ou média móvel triangular têm um período finito. Como resultado, qualquer valor ausente será seguido por um número de NaNs igual à ordem do filtro menos um.
Os filtros IIR, média de movimentação exponencial ou média de movimentação cumulativa têm um período infinito. Como resultado, depois que o primeiro valor ausente for encontrado, o NaNs continuará a se propagar indefinidamente.
Em um filtro de limite, o período de um filtro de limite é 1. Como resultado, os valores ausentes e NaNs não se propagam.
Para filtros de valor mediano, os NaNs e valores ausentes encontrados no conjunto de dados de entrada não produzem novos NaNs na saída, independentemente do período do filtro.
Entradas esperadas
Nome | Tipo | DESCRIÇÃO |
---|---|---|
Filtrar | Interface IFilter | Implementação do filtro |
Dataset | Tabela de Dados | Conjunto de dados de entrada |
para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.
para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.
Parâmetros do módulo
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Conjunto de colunas | Qualquer | ColumnSelection | NumericAll | Selecione as colunas a serem filtradas |
Saída
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | Conjunto de dados de saída |