디지털 발명을 사용한 데이터 민주화
석탄, 석유 및 인간의 잠재력은 산업 혁명 기간 동안 가장 중요한 세 가지 자산이었습니다. 이러한 자산은 기업을 설립하고, 시장을 변화시키고, 궁극적으로 국가를 변화시켰습니다. 디지털 경제에는 혁신을 위한 세 가지 중요한 자산인 데이터, 디바이스 및 인간의 잠재력이 있습니다. 이러한 자산은 뛰어난 혁신 잠재력을 보유하고 있습니다. 현대 시대의 혁신 노력에서 데이터는 새로운 석유입니다.
모든 회사에는 고객의 요구를 찾고 충족하는 데 사용할 수 있는 데이터가 있습니다. 아쉽게도 혁신을 주도하기 위해 데이터를 마이닝하는 프로세스는 비용이 많이 들고 시간이 오래 걸릴 수 있으므로 요구 사항이 발견되지 않고 솔루션이 만들어지지 않습니다. 데이터 민주화는 이 문제를 해결할 수 있습니다.
데이터 민주화란? 혁신을 추진하기 위해 데이터를 올바른 방식으로 확보하는 프로세스입니다. 이 민주화 프로세스는 여러 가지 형태를 취할 수 있지만 일반적으로 원시 데이터 수집 또는 통합, 데이터 중앙 집중화, 데이터 공유 및 데이터 보안 솔루션을 포함합니다. 데이터가 민주화되면 회사 주변의 전문가들은 이를 사용하여 가설을 형성하고 테스트할 수 있습니다. 대부분의 경우 클라우드 채택 팀은 데이터만 사용하여 고객 공감으로 구축하여 고객의 요구를 신속하게 충족할 수 있습니다.
데이터를 민주화하는 방법
데이터를 민주화하는 다양한 방법이 있지만 대부분 데이터 수집, 중앙 집중화, 관리 및 공유 방법이 포함됩니다. 다음 섹션에서는 이러한 방법 중 일부를 설명합니다. 고객 가설에 대한 솔루션을 빌드할 때 데이터를 민주화할지, 무엇을 확장할지, 어떻게 수행할지 평가해야 합니다.
데이터 공유
고객 공감으로 구축할 때 고객에게 솔루션을 안내해야 합니다. 데이터가 필요한 경우 고객이 IT 직원의 지원 없이 데이터를 직접 조사, 분석 및 보고할 수 있습니다.
많은 성공적인 혁신은 고객에게 데이터를 제공하는 MVP(최소 실행 가능 제품)로 시작됩니다. MVP는 고객이 사용할 수 있는 충분한 기능을 갖춘 제품 버전입니다. 고객으로부터 피드백을 수집하기 위해 제품의 가능한 잠재력을 보여줍니다. 이 컨시어지 모델에서 직원은 데이터 소비자입니다. 해당 직원은 데이터를 사용하여 고객을 지원합니다. 고객이 수동 지원에 참여할 때마다 가설을 테스트하고 유효성을 검사할 수 있습니다. 이 방법은 종종 통합 솔루션에 대규모로 투자하기 전에 고객 중심 가설을 테스트하는 비용 효율적인 수단이 됩니다.
데이터 소비자와 직접 데이터를 공유하기 위한 기본 도구에는 셀프 서비스 보고 또는 Power BI 같은 도구를 사용하여 다른 환경에 포함된 데이터가 포함됩니다.
참고 항목
데이터를 공유하기 전에 다음 섹션을 읽었는지 확인합니다. 데이터를 공유하려면 데이터에 대한 보호를 제공하기 위해 거버넌스가 필요할 수 있습니다. 데이터가 여러 클라우드에 걸쳐 있는 경우 중앙 집중화가 필요할 수도 있습니다. 데이터가 애플리케이션 내에 있는 경우 데이터를 공유하려면 데이터를 수집해야 합니다.
데이터 제어
데이터를 공유하면 고객 대화에 사용할 수 있는 최소 실행 가능 제품을 신속하게 생성할 수 있습니다. 그러나 공유 데이터를 유용하고 실행 가능한 지식으로 전환하려면 일반적으로 더 많은 것이 필요합니다.
데이터 공유를 통해 가설의 유효성을 검사한 후 개발의 다음 단계는 일반적으로 데이터 거버넌스입니다.
데이터 거버넌스는 클라우드 채택 프레임워크의 범위를 벗어난 자체 전용 프레임워크를 요구할 수 있는 광범위한 항목입니다.
고객 가설의 유효성을 검사하는 즉시 고려해야 할 데이터 거버넌스의 몇 가지 측면이 있습니다. 예시:
- 공유 데이터가 중요합니까? 고객과 회사의 이익을 보호하기 위해 공개적으로 공유되기 전에 데이터를 분류 해야 합니다.
- 데이터가 중요한 경우 보안이 유지되었나요? 중요한 데이터의 보호는 민주화된 데이터의 필수입니다. 데이터 보안 솔루션에서 설명하는 예제 워크로드는 데이터 보안에 대한 몇 가지 참조를 제공합니다.
- 데이터가 카탈로그화되어 있나요? 공유 데이터의 특성을 식별하면 장기적인 데이터 관리에 도움이 됩니다. Azure Data Catalog와 같은 데이터를 문서화하는 도구는 클라우드에서 이 프로세스를 훨씬 쉽게 처리합니다. 데이터 주석 및 데이터 원본 설명서에 대한 지침은 프로세스를 가속화할 수 있습니다.
데이터 민주화가 고객 중심 가설에 중요한 경우 공유 데이터의 거버넌스가 릴리스 계획에 있는지 확인합니다. 이를 통해 고객, 데이터 소비자 및 회사를 보호할 수 있습니다.
데이터 중앙 집중화
데이터 중앙 집중화는 보다 의미 있는 보고로 이어지고, 조직 전체에서 동일한 데이터를 사용할 수 있도록 보장하며, ROI를 증가시킵니다. IT 환경에 데이터가 분산되면 혁신 기회가 매우 제한되고, 비용이 많이 들고, 시간이 많이 걸릴 수 있습니다. 클라우드는 데이터를 중앙 집중화할 수 있는 새로운 기회를 제공합니다. 고객 공감으로 구축하기 위해 여러 데이터 원본의 중앙 집중화가 필요한 경우 클라우드는 가설 테스트를 가속화할 수 있습니다.
주의
데이터의 중앙 집중화는 모든 혁신 프로세스의 위험 지점을 나타냅니다. 데이터 중앙 집중화가 기술적인 급증이고 고객 가치의 소스가 아닌 경우 고객 가설의 유효성을 검사할 때까지 중앙 집중화를 지연하는 것이 좋습니다.
중앙 집중화할 때 중앙 집중식 데이터에 적합한 데이터 저장소가 필요합니다. 클라우드에서 데이터 웨어하우스를 설정하는 것이 좋은 사례입니다. 이 확장성 있는 옵션은 모든 데이터에 대한 중앙 위치를 제공합니다. 이러한 유형의 솔루션은 OLAP(온라인 분석 처리) 또는 빅 데이터 옵션에서 사용할 수 있습니다.
OLAP 및 빅 데이터 솔루션에 대한 참조 아키텍처는 Azure에서 가장 적절한 중앙 집중화 솔루션을 선택하는 데 도움이 될 수 있습니다. 하이브리드 솔루션이 필요한 경우 온-프레미스 데이터를 확장하기 위한 참조 아키텍처를 통해 솔루션 개발을 가속화할 수도 있습니다.
Important
일부 고객 요구 사항 및 솔루션의 경우 간단한 방법만으로 충분할 수 있습니다. 클라우드 설계자는 특히 초기 개발 중에 고객 가설의 유효성을 검사하기 위해 저비용 솔루션을 고려하도록 팀과 상의해야 합니다. 데이터 수집에 대한 이 섹션에서는 상황에 대한 다른 솔루션을 제안할 수 있는 시나리오에 대해 설명합니다.
데이터 수집
데이터 수집의 두 가지 기본 형식은 통합 및 수집입니다.
통합: 기존 데이터 저장소에 있는 데이터는 기존의 데이터 이동 기술을 사용하여 중앙 집중식 데이터 저장소에 통합할 수 있습니다. 이는 다중 클라우드 데이터 스토리지를 포함하는 시나리오에서 특히 일반적입니다. 이러한 기술에는 기존 데이터 저장소에서 데이터를 추출한 다음 중앙 데이터 저장소에 로드하는 작업이 포함됩니다. 이 프로세스의 어느 시점에서 데이터는 일반적으로 중앙 저장소에서 더 사용 가능하고 관련성이 높도록 변환됩니다.
클라우드 기반 도구는 이러한 기술을 종량제 도구로 전환하여 데이터 수집 및 중앙 집중화에 대한 진입 장벽을 줄입니다. Azure Database Migration Service 및 Azure Data Factory와 같은 도구가 두 가지 예시입니다. OLAP 데이터 저장소가 있는 Data Factory에 대한 참조 아키텍처는 이러한 솔루션 중 하나의 예입니다.
수집: 일부 데이터는 기존 데이터 저장소에 없습니다. 이러한 일시적인 데이터가 혁신의 주요 원본인 경우 대체 방법을 고려해야 합니다. 일시적인 데이터는 애플리케이션, API, 데이터 스트림, IoT 디바이스, 블록체인, 애플리케이션 캐시, 미디어 콘텐츠 또는 플랫 파일과 같은 다양한 기존 원본에서 찾을 수 있습니다.
이러한 다양한 형태의 데이터를 OLAP 또는 빅 데이터 솔루션의 중앙 데이터 저장소에 통합할 수 있습니다. 그러나 빌드-측정-학습 주기의 초기 반복의 경우 OLTP(온라인 트랜잭션 처리) 솔루션으로 고객 가설의 유효성을 검사하기에 충분할 수 있습니다. OLTP 솔루션은 보고 시나리오에 가장 적합한 옵션이 아닙니다. 그러나 고객 공감으로 구축하는 경우 기술 도구 의사 결정보다 고객의 요구에 집중하는 것이 더 중요합니다. 고객 가설의 유효성을 대규모로 검사한 후에는 더 적합한 플랫폼이 필요할 수 있습니다. OLTP 데이터 저장소의 참조 아키텍처는 솔루션에 가장 적합한 데이터 저장소를 결정하는 데 도움이 될 수 있습니다.
가상화: 데이터의 통합 및 수집은 때때로 혁신을 늦출 수 있습니다. 데이터 가상화에 대한 솔루션을 이미 사용할 수 있는 경우 보다 합리적인 접근 방식을 보여줄 수 있습니다. 수집 및 통합은 스토리지 및 개발 요구 사항 모두를 복제하고, 데이터 대기 시간을 추가하고, 공격 노출 영역을 늘리고, 품질 문제를 촉발하고, 거버넌스 노력을 증가시킬 수 있습니다. 데이터 가상화는 원본 데이터를 단일 위치에 두고 원본 데이터의 통과 또는 캐시된 쿼리를 만드는 보다 현대적인 대안입니다.
SQL Server 2017 및 Azure SQL Data Warehouse 모두 Azure에서 가장 일반적으로 사용되는 데이터 가상화에 대한 접근 방식인 PolyBase를 지원합니다.
다음 단계
데이터를 민주화하기 위한 전략을 사용하면 애플리케이션 개발에 대한 접근 방식을 평가할 수 있습니다.