デジタル発明によるデータの民主化
産業革命の間、石炭、石油、人間の潜在能力が最も重要な 3 つの資産でした。 このような資産によって企業が築かれ、市場が変貌し、最終的には国を変えました。 デジタル経済でも同様にイノベーションのための 3 つの重要な資産があります。それは、データ、デバイス、および人間の可能性です。 これらの資産には、イノベーションの大きな可能性があります。 現代におけるイノベーションへの取り組みでは、データが新たな石油です。
企業にはそれぞれ、顧客のニーズを見つけて満たすために使用できるデータがあります。 残念ながら、そういったデータをマイニングしてイノベーションを促進するプロセスにはコストと時間がかかることがあるため、ニーズがみつからず、ソリューションが作成されません。 データの民主化により、この問題を解決できます。
データの民主化とは、 イノベーションを推進するためにデータを適切な人が取得できるようにするプロセスです。 この民主化プロセスにはいくつかの形がありますが、通常は、生データの取り込みまたは統合、データの一元化、データの共有、データのセキュリティ保護のためのソリューションが含まれます。 データが民主化されると、社内の専門家がこれを使用して仮説の形成とテストを行うことができます。 多くの場合、クラウド導入チームがデータのみを使用して顧客の共感を構築して、顧客のニーズに迅速に対応することができます。
データを民主化する方法
データを民主化するにはさまざまな方法がありますが、ほとんどに含まれる方法がデータの収集、一元化、管理、および共有です。 以下のセクションでは、これらの方法のいくつかを説明します。 顧客の仮説に対してソリューションを構築するときは、データを民主化するか、どの程度まで、どのようにして行なうかを評価する必要があります。
データの共有
顧客の共感を構築するときは、顧客のニーズによりソリューションを導きます。 ニーズがデータの場合、顧客が IT スタッフによるサポートなしで直接データを照会、分析、レポートすることができるソリューションです。
成功するイノベーションの多くは、顧客にデータを提供する実用最小限の製品 (MVP) から始まります。 MVP とは、顧客が利用できる十分な機能を備えた製品のバージョンです。 それは、顧客からフィードバックを収集することを目的とした製品の潜在的な可能性を示しています。 このコンシェルジュ モデルでは、従業員がデータ コンシューマーです。 その従業員は、データを使用して顧客を支援します。 顧客が手動サポートに関与するたびに、仮説をテストして検証することができます。 多くの場合、このアプローチは、統合ソリューションに多大な投資を行う前に、顧客に重点を置いた仮説をテストするというコスト効率の高い方法です。
データをデータ コンシューマーと直接共有するための主要なツールには、Power BI などのツールを使用したセルフサービス レポートや他のエクスペリエンスへのデータの埋め込みなどが含まれます。
Note
データを共有する前に、以下のセクションを必ずお読みください。 データを共有する場合、データを保護するためのガバナンスが必要になることがあります。 また、データが複数のクラウドにまたがる場合は、一元化が必要になる可能性があります。 データがアプリケーション内に存在する場合は、共有するためにそれを収集する必要があります。
データの管理
データを共有することで、顧客との会話で使用するための実用最小限の製品を迅速に作成できます。 しかし、その共有データを有用で実用的な知識に変えるには、多くの場合、必要なことがまだまだあります。
データ共有によって仮説が検証されたら、通常、開発の次のフェーズはデータ ガバナンスです。
データ ガバナンスはそれ自体の専用フレームワークを必要とすることがある広範なトピックであり、クラウド導入フレームワークの範囲を超えた事柄です。
顧客の仮説を検証したらすぐに考慮すべきデータ ガバナンスの側面がいくつかあります。 次に例を示します。
- 共有データは機密情報ですか? 顧客と会社の利益を保護するために、一般公開の前はデータを機密扱いにする必要があります。
- データの機密性が高い場合、セキュリティで保護されていますか? 機密データの保護は、民主化されたデータにとって必須事項です。 データ保護ソリューションに重点を置いたワークロードの例では、データをセキュリティで保護するためのリファレンスがいくつか提供されています。
- データはカタログ化されていますか? 共有データの性質を特定することが、長期的なデータ管理に役立ちます。 Azure Data Catalog などのデータをドキュメント化するツールを使用すると、クラウド内でこのプロセスを行うのがはるかに簡単になります。 データの注釈とデータ ソースのドキュメントに関するガイダンスによって、このプロセスを加速化できます。
データの民主化が顧客に重点を置いた仮説にとって重要である場合は、共有データのガバナンスをリリース計画の中に必ず設定します。 これにより、顧客、データ コンシューマー、そして会社が保護されます。
データの一元管理
データの一元化によってより有意義なレポートが作成され、同じデータを組織全体で使用可能になり、ROI が向上します。 IT 環境でデータが分散していると、イノベーションの機会が非常に制約され、コストと時間がかかる可能性があります。 クラウドを利用すると、データを一元化する新たな機会が得られます。 顧客の共感を構築するために複数のデータ ソースを一元化する必要がある場合は、クラウドによって仮説のテストを迅速化できます。
注意事項
データの一元化は、どのイノベーション プロセスでもリスク ポイントになります。 データの一元化が技術的スパイクであり、顧客価値の源ではない場合は、顧客の仮説が検証されるまで、一元化を先延ばしにすることをお勧めします。
一元化するときは、一元化されたデータに適切なデータ ストアが必要です。 クラウドにデータ ウェアハウスを確立することをお勧めします。 このスケーラブルなオプションでは、すべてのデータのための中央の場所が提供されます。 この種のソリューションは、オンライン分析処理 (OLAP) オプションまたはビッグ データ オプションで使用できます。
OLAP およびビッグ データ ソリューションのリファレンス アーキテクチャは、Azure で最適な一元化ソリューションを選択するのに役立ちます。 ハイブリッド ソリューションが必要な場合は、オンプレミスのデータを拡張するためのリファレンス アーキテクチャも、ソリューション開発の加速化に役立ちます。
重要
お客様のニーズとソリューションによっては、単純なアプローチで十分かもしれません。 クラウド アーキテクトは、特に開発の初期段階で、顧客の仮説を検証する低コストのソリューションを検討するようチームに要求する必要があります。 データの収集に関するこのセクションでは、状況に合わせて別のソリューションが推奨される可能性のあるシナリオについて説明します。
データを収集する
2 つの主なデータ収集の形式として、統合とインジェストがあります。
統合: 既存のデータ ストアに存在するデータは、従来のデータ移動手法を使用して一元化されたデータ ストアに統合できます。 これは、マルチクラウド データ ストレージを必要とするシナリオでは特に一般的です。 これらの手法では、既存のデータ ストアからデータを抽出し、中央のデータ ストアに読み込みます。 このプロセスのある時点で、通常、データは中央ストア内でより使いやすい適切な形式に変換されます。
クラウド ベースのツールにより、これらの手法は従量課金制のツールに変わったため、データの収集と一元化を導入する際の障壁が削減されます。 たとえば、Azure Database Migration Service と Azure Data Factory という 2 つのツールがあります。 OLAP データ ストアを備えたデータ ファクトリのリファレンス アーキテクチャは、このようなソリューションの一例です。
インジェスト: 既存のデータ ストアに存在しないデータもあります。 この一時的なデータがイノベーションの主要なソースである場合は、別のアプローチを検討する必要があります。 一時的なデータは、アプリケーション、API、データ ストリーム、IoT デバイス、ブロックチェーン、アプリケーション キャッシュ、メディア コンテンツ、フラット ファイルなど、さまざまな既存のソース内にあります。
これらのさまざまな形式のデータは、OLAP ソリューションまたはビッグ データ ソリューションで中央のデータ ストアに統合できます。 しかし、構築-計測-学習サイクルの初期の反復では、オンライン トランザクション処理 (OLTP) ソリューションが顧客の仮説の検証に適していると言えるでしょう。 レポートのシナリオの場合、OLTP ソリューションは最適なオプションではありません。 ただし、顧客の共感を構築するときには、技術的なツールの決定よりも顧客のニーズに重点を置くことが重要です。 顧客の仮説が大規模に検証されたら、より適切なプラットフォームが必要になる場合があります。 OLTP データ ストア上のリファレンス アーキテクチャは、ご利用のソリューションに最適なデータ ストアを決定するのに役立ちます。
仮想化: データの統合とインジェストにより、イノベーションが遅くなることがあります。 データ仮想化のためのソリューションが既に利用可能な場合は、それがより合理的なアプローチとなる可能性があります。 インジェストと統合はどちらも、ストレージおよび開発の要件の重複、データ待機時間の増加、攻撃対象領域の拡大、品質の問題の発生、ガバナンス作業の増加の可能性があります。 データ仮想化は、元のデータを単一の場所に残し、ソース データのパススルーまたはキャッシュされたクエリを作成する、より新しい代替手段です。
SQL Server 2017 と Azure SQL Data Warehouse の両方で、PolyBase がサポートされています。これは、Azure で最もよく使用されるデータ仮想化へのアプローチです。
次のステップ
データを民主化する戦略を立てたら、次に、アプリケーション開発のアプローチを評価します。