将 Azure Data Lake Store 与 Azure Blob 存储进行比较

已完成

在 Azure Blob 存储中,可以在 Blob 容器内的平面命名空间中存储大量非结构化(“对象”)数据。 Blob 名称可以包含“/”字符,用于将 Blob 组织到虚拟“文件夹”中,但在 Blob 可管理性方面,Blob 作为单级层次结构存储在平面命名空间中。

具有平面命名空间的 Blob 存储的示意图。

可以通过使用 HTTP 或 HTTPs 来访问此数据

Azure Data Lake Storage Gen2 在 Blob 存储的基础上构建,通过使用分层命名空间将 Blob 数据组织到目录中,并存储每个目录及其中的文件的元数据,从而优化大批量数据的 I/O。 此结构允许在单个原子操作中执行目录重命名和删除之类的操作。 与此相反,平面命名空间需要与结构中的对象数成比例的多个操作。 分层命名空间使数据组织有序,从而为分析用例可形成更好的存储和检索性能,并可降低分析成本。

具有分层命名空间的 Blob 存储的示意图。

提示

如果要存储数据而不对数据执行分析,请将“分层命名空间”选项设置为“禁用”,以将存储帐户设置为 Azure Blob 存储帐户。 还可以使用 blob 存储来存档很少使用的数据或存储网站资产(如图像和媒体)。

如果对数据执行分析,请通过将“分层命名空间”选项设置为“启用”,将存储帐户设置为 Azure Data Lake Storage Gen2 帐户。 由于 Azure Data Lake Storage Gen2 已集成到 Azure 存储平台中,因此应用程序可以使用 Blob API 或 Azure Data Lake Storage Gen2 文件系统 API 访问数据。