팀 데이터 과학 프로세스 수명 주기
TDSP(팀 데이터 과학 프로세스)는 팀이 데이터 과학 프로젝트를 구성하는 데 사용할 수 있는 수명 주기를 제공합니다. 수명 주기는 프로젝트를 성공적으로 완료하기 위해 수행할 수 있는 단계를 간략하게 설명합니다.
지능형 애플리케이션의 일부인 데이터 과학 프로젝트가 있는 경우 이 수명 주기를 사용해야 합니다. 지능형 애플리케이션은 예측 분석을 위해 기계 학습 또는 AI 모델을 배포합니다. 예비 데이터 과학 프로젝트 및 즉석 분석 프로젝트에 이 프로세스를 사용할 수도 있지만 수명 주기의 모든 단계를 구현할 필요는 없습니다.
팀은 작업 기반 TDSP를 CRISP-DM(데이터 마이닝에 대한 업계 간 표준 프로세스), KDD(데이터베이스의 지식 검색) 프로세스 또는 조직의 자체 사용자 지정 프로세스와 같은 다른 데이터 과학 수명 주기와 결합할 수 있습니다.
목적 및 신뢰성
TDSP의 목적은 데이터 과학 및 AI 프로젝트에 대한 접근 방식을 간소화하고 표준화하는 것입니다. Microsoft는 이 구조적 방법론을 수백 개의 프로젝트에 적용했습니다. 연구원은 TDSP를 공부하고 동료 검토한 문헌에 있는 그들의 사실 인정을 간행했습니다. TDSP의 아키텍처 프레임워크는 많은 영역에서 철저히 테스트되고 효과적인 것으로 입증되었습니다.
5가지 수명 주기 단계
TDSP 수명 주기는 팀이 반복적으로 수행하는 5가지 주요 단계로 구성됩니다. 이러한 단계에는 다음이 포함됩니다.
TDSP 수명 주기의 시각적 표현은 다음과 같습니다.
TDSP 수명 주기는 예측 모델을 만들기 위한 지침을 제공하는 일련의 단계입니다. 팀은 지능형 애플리케이션을 빌드하는 데 사용할 프로덕션 환경에 예측 모델을 배포합니다. 이 프로세스 수명 주기의 목표는 명확한 참여 엔드포인트로 데이터 과학 프로젝트를 탐색하는 것입니다. 데이터 과학은 연구 및 발견을 연습하는 과정입니다. 잘 정의된 프로세스를 사용하여 팀과 작업을 전달하는 경우 데이터 과학 프로젝트를 성공적으로 수행할 가능성이 높아질 수 있습니다.
각 단계에는 다음을 간략하게 설명하는 고유한 문서가 있습니다.
- 목표: 스테이지의 목표입니다.
- 방법: 단계에서 수행하는 작업의 개요 및 완료 방법에 대한 지침입니다.
- 아티팩트: 스테이지 중에 생성해야 하는 결과물과 이를 만드는 데 사용할 수 있는 리소스입니다.
피어 검토 인용
연구원은 TDSP에 관하여 동료 검토한 문헌을 간행합니다. 다음 자료를 검토하여 TDSP 기능 및 애플리케이션을 조사합니다.
데이터 과학 파이프라인의 예술 및 사례: 이론, 규모 및 규모가 큰 데이터 과학 파이프라인에 대한 포괄적인 연구(2091-2103페이지)
멕시코 환경법에서 전처리 작업 실행을 위한 CRISP-DM 및 TDSP를 기반으로 하는 하이브리드 방법론(볼륨 13613, 페이지 68-82)
정보 시스템 연구에서 엄격한 감독 기계 학습을 수행하는 방법: 감독되는 기계 학습 보고서 카드(589-615페이지)
Machine Learning 기반 혁신 관리: 개념적 프레임워크. 이벤트 절차: LUT 과학 및 전문 지식 간행물: ISPIM 혁신 컨퍼런스 – 공동의 미래 혁신
참가자
Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.
보안 주체 작성자:
- Mark Tabladillo | 선임 클라우드 솔루션 설계자
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.
관련 참고 자료
- 수명 주기의 첫 번째 단계는 비즈니스 이해를 참조하세요.
- Team Data Science Process란 무엇인가요?
- 기계 학습 제품 및 기술 비교