O ciclo de vida do Processo de Ciência de Dados de Equipe
O TDSP (Processo de Ciência de Dados da Equipe) fornece um ciclo de vida que a sua equipe pode usar para estruturar seus projetos de ciência de dados. O ciclo de vida descreve as etapas que você pode executar para concluir um projeto com êxito.
Você deve usar esse ciclo de vida se tiver um projeto de ciência de dados que faça parte de um aplicativo inteligente. Aplicativos inteligentes implantam modelos de aprendizado de máquina ou IA para análise preditiva. Você também pode usar esse processo para projetos exploratórios de ciência de dados e projetos de análise improvisados, mas talvez não seja necessário implementar todas as etapas do ciclo de vida.
Sua equipe pode combinar o TDSP baseado em tarefas com outros ciclos de vida da ciência de dados, como o processo padrão para mineração de dados (CRISP-DM) intersetorial, o processo de descoberta de conhecimento em bancos de dados, (KDD) ou o próprio processo personalizado da sua organização.
Propósito e credibilidade
O objetivo do TDSP é simplificar e padronizar sua abordagem para projetos de ciência de dados e IA. A Microsoft aplicou essa metodologia estruturada em centenas de projetos. Os pesquisadores estudaram o TDSP e publicaram suas conclusões na literatura revisada por pares. A estrutura arquitetônica do TDSP é exaustivamente testada e comprovadamente eficaz em muitas áreas.
Cinco estágios do ciclo de vida
O ciclo de vida do TDSP é composto por cinco estágios principais que sua equipe executa de forma iterativa. Esses estágios incluem:
- Noções básicas sobre negócios
- Aquisição de dados e entendimento
- Modelagem
- Implantação
- Aceitação do cliente
Esta é uma representação visual do ciclo de vida do TDSP:
O ciclo de vida do TDSP é uma sequência de etapas que fornece orientação para a criação de modelos preditivos. Sua equipe implanta os modelos preditivos no ambiente de produção que você planeja usar para criar aplicativos inteligentes. A meta deste ciclo de vida do processo é navegar por um projeto de ciência de dados em direção a um ponto de extremidade claro de engajamento. A ciência de dados é um exercício de pesquisa e descoberta. Quando você usa um processo bem definido para comunicar tarefas à sua equipe, você aumenta a chance de realizar com sucesso um projeto de ciência de dados.
Cada etapa tem seu próprio artigo que descreve:
- Metas: os objetivos da etapa.
- Como fazer: um esboço das tarefas que você executa na etapa e orientação sobre como concluí-las.
- Artefatos: os produtos que você precisa produzir durante a etapa e os recursos que você pode usar para criá-los.
Citações revisadas por pares
Os pesquisadores publicam literatura revisada por pares sobre o TDSP. Analise o material a seguir para investigar os recursos e aplicativos do TDSP.
Engenharia de Software para Machine Learning: Um Estudo de Caso (páginas 291-300)
Um Ciclo de Vida da Inteligência Artificial: Da Concepção à Produção
Ciência de Dados: Um Tratamento Sistemático (páginas 106–116)
Gerenciamento de Artefatos do Ciclo de Vida do Aprendizado de Máquina: Uma Pesquisa (páginas 18–35)
Construção de um Modelo de Qualidade para Sistemas de Aprendizado de Máquina (páginas 307–335)
Colaboradores
Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.
Autor principal:
- Mark Tabladillo | Arquiteto de soluções de nuvem sênior
Para ver perfis não públicos do LinkedIn, entre no LinkedIn.
Recursos relacionados
- Para a primeira etapa do ciclo de vida, consulte Reconhecimento empresarial.
- O que é o Processo de Ciência de Dados de Equipe?
- Compare os produtos e as tecnologias de machine learning