데이터 기반 정책 만들기 및 의사 결정 영향
기계 학습 모델은 데이터의 패턴을 식별하고 예측하는 데 강력합니다. 그렇지만 개입이 있을 때 실제 결과가 어떻게 변하는지 예측하는 기능은 거의 지원하지 못합니다.
실무자는 기록 데이터를 사용하여 미래의 결정과 비즈니스 개입을 알리는 데 점점 더 집중하고 있습니다. 예를 들어 기업에서 새로운 가격 책정 전략을 추진하는 경우 수익에 어떤 영향을 줄까요? 새로운 약물이 환자의 상태를 개선할 수 있을까요, 아니면 다른 모든 약물과 동일할까요?
책임 있는 AI 대시보드의 인과 관계 유추 구성 요소는 인구 또는 집단 및 개인 수준의 평균적인 관심 결과에 대한 기능의 영향을 예측하여 이러한 질문을 처리합니다. 또한 다양한 개입에 대한 기능 응답을 시뮬레이션하고 개입으로 혜택을 받을 인구 집단을 결정하는 규칙을 만들어 기대할 수 있는 개입을 구성하는 데 도움이 됩니다. 이러한 기능을 일괄하여 의사 결정자는 새 정책을 적용하고 실제 변화에 영향을 줄 수 있습니다.
이 구성 요소의 기능은 EconML 패키지에서 가져왔습니다. 이중 기계 학습 기술을 통해 관찰 데이터에서 다른 유형의 치료 효과를 예측합니다.
다음을 수행해야 하는 경우 인과 관계 유추를 사용합니다.
- 관심 결과에 가장 직접적인 영향을 주는 기능을 식별합니다.
- 관심 결과에 대한 실제 영향을 최대화하기 위해 수행할 전반적인 처리 정책을 결정합니다.
- 특정 기능 값이 있는 개인이 특정 처리 정책에 반응하는 방법을 이해합니다.
인과 관계 유추 인사이트는 어떻게 생성하나요?
참고 항목
인과 관계 인사이트를 생성하는 데는 기록 데이터만 필요합니다. 처리 기능을 기반으로 하여 계산된 인과 효과는 전적으로 데이터 속성입니다. 따라서 인과 효과를 계산할 때 학습된 모델은 선택 사항입니다.
이중 기계 학습은 모든 잠재적인 교란 요인/제어(수집된 데이터와 관찰된 결과에서 동시에 처리 결정에 직접적인 영향을 준 요인)가 관찰되지만 다음과 같은 문제점이 있습니다.
- 고전적인 통계 방법을 적용하기에 너무 많습니다. 즉, ‘고차원’입니다.
- 매개 변수 함수에서 처리 및 결과에 대한 영향을 만족스럽게 모델링할 수 없습니다. 즉, ‘비 매개 변수’입니다.
기계 학습 기술을 사용하여 두 문제를 모두 해결할 수 있습니다. 예제는 Chernozhukov2016을 참조하세요.
이중 기계 학습은 먼저 다음 두 가지 예측 작업을 예측하여 문제를 줄입니다.
- 제어에서 결과 예측
- 제어에서 처리 예측
그런 다음, 이 방법은 이러한 두 예측 모델을 최종 단계 예측에 결합하여 다른 유형의 처리 효과에 대한 모델을 만듭니다. 이 방법을 사용하면 임의의 기계 학습 알고리즘을 두 예측 작업에 사용할 수 있으며, 최종 모델과 관련된 많은 유리한 통계 속성을 유지 관리할 수 있습니다. 이러한 속성에는 작은 평균 제곱 오차, 근사 정규 분포 및 신뢰 구간 생성이 포함됩니다.
Microsoft에서 인과 관계 유추를 위해 제공하는 다른 도구는 무엇인가요?
Project Azua는 엔드투엔드 인과 관계 유추에 초점을 맞춘 새로운 프레임워크를 제공합니다.
Azua DECI(심층 엔드투엔드 인과 관계 유추) 기술은 인과 관계 검색과 인과 관계 유추를 동시에 수행할 수 있는 단일 모델입니다. 사용자가 데이터를 제공하며, 모델은 모든 변수 간의 인과 관계를 출력할 수 있습니다.
그 자체로 이 방법은 데이터에 대한 인사이트를 제공할 수 있습니다. ITE(개별 처리 효과), ATE(평균 처리 효과) 및 CATE(조건부 평균 처리 효과)와 같은 메트릭을 계산할 수 있습니다. 그런 다음, 이러한 계산을 사용하여 최적의 결정을 내릴 수 있습니다.
이 프레임워크는 변수 수와 데이터 요소 수 모두의 측면에서 대규모 데이터에 대해 확장할 수 있습니다. 또한 통계 유형이 혼합된 누락된 데이터 항목을 처리할 수도 있습니다.
EconML은 책임 있는 AI 대시보드의 인과 관계 유추 구성 요소 백 엔드를 구동합니다. 기계 학습 기술을 적용하여 관찰 또는 실험 데이터에서 개별화된 인과 관계 응답을 예측하는 것이 바로 Python 패키지입니다.
EconML의 예측 방법 제품군은 인과 관계 기계 학습의 최신 발전을 나타냅니다. 개별 기계 학습 단계를 해석 가능한 인과 관계 모델에 통합하면 이러한 방법에서 가상 예측의 안정성을 향상시키고 광범위한 사용자 집합에 대해 인과 관계 분석을 더 빠르고 쉽게 수행할 수 있습니다.
DoWhy는 인과 관계 사고 및 분석을 촉진하기 위한 Python 라이브러리입니다. DoWhy는 인과 관계 가정을 명시적으로 모델링하고 가능한 한 유효성을 검사하는 데 집중하는 인과 관계 유추에 대한 원칙적인 4단계 인터페이스를 제공합니다.
DoWhy의 주요 기능은 예측 방법에 대한 인과 관계 가정을 자동으로 테스트할 수 있는 최첨단 반박 API입니다. 따라서 더 강력한 유추를 수행할 수 있고 비전문가도 액세스할 수 있습니다.
DoWhy는 백도어, 프런트 도어, 계기 변수 및 기타 식별 방법에 대한 평균 인과 효과 추정을 지원합니다. 또한 EconML 라이브러리와의 통합을 통해 CATE의 예측을 지원합니다.
다음 단계
- CLI 및 SDK 또는 Azure Machine Learning 스튜디오 UI를 통해 책임 있는 AI 대시보드를 생성하는 방법을 알아봅니다.
- 책임 있는 AI 대시보드의 지원되는 인과 관계 유추 시각화에 대해 알아봅니다.
- 책임 있는 AI 대시보드에서 관찰된 인사이트를 기반으로 하여 책임 있는 AI 성과 기록표를 생성하는 방법을 알아봅니다.