Microsoft Fabric terminolojisi
Doku Veri Ambarı, Doku Veri Madenciliği, Doku Veri Bilimi, Gerçek Zamanlı Zeka, Data Factory ve Power BI'a özgü terimler de dahil olmak üzere Microsoft Fabric'te kullanılan terimlerin tanımlarını öğrenin.
Genel koşullar
Kapasite: Kapasite, belirli bir zamanda kullanılmak üzere kullanılabilen ayrılmış bir kaynak kümesidir. Kapasite, bir kaynağın etkinlik gerçekleştirme veya çıkış oluşturma becerisini tanımlar. Farklı öğeler belirli bir zamanda farklı kapasite tüketir. Fabric, Doku SKU'su ve Denemeler aracılığıyla kapasite sunar. Daha fazla bilgi için bkz. Kapasite nedir?
Deneyim: Belirli bir işlevi hedefleyen özellikler koleksiyonu. Doku deneyimleri arasında Doku Veri Ambarı, Doku Veri Madenciliği, Doku Veri Bilimi, Gerçek Zamanlı Zeka, Data Factory ve Power BI bulunur.
Öğe: Bir deneyim içindeki bir özellik kümesi olan bir öğe. Kullanıcılar bunları oluşturabilir, düzenleyebilir ve silebilir. Her öğe türü farklı özellikler sağlar. Örneğin, Veri Madenciliği deneyimi lakehouse, not defteri ve Spark iş tanımı öğelerini içerir.
Kiracı: Kiracı, bir kuruluş için tek bir Doku örneğidir ve Bir Microsoft Entra Kimliği ile hizalanır.
Çalışma alanı: Çalışma alanı, işbirliği için tasarlanmış tek bir ortamda farklı işlevleri bir araya getiren bir öğe koleksiyonudur. Yürütülen iş için kapasite kullanan ve içindeki öğelere kimlerin erişebileceğine yönelik denetimler sağlayan bir kapsayıcı işlevi görür. Örneğin, bir çalışma alanında kullanıcılar raporlar, not defterleri, anlam modelleri vb. oluşturur. Daha fazla bilgi için Çalışma alanları makalesine bakın.
Doku Veri Madenciliği
Lakehouse: Lakehouse, Apache Spark altyapısı ve SQL altyapısı tarafından büyük veri işleme için kullanılan bir veri gölü üzerindeki veritabanını temsil eden bir dosya, klasör ve tablo koleksiyonudur. Lakehouse, açık kaynak Delta biçimli tabloları kullanırken ACID işlemleri için gelişmiş özellikler içerir. Lakehouse öğesi, Microsoft OneLake'te benzersiz bir çalışma alanı klasöründe barındırılır. Klasörler ve alt klasörler halinde düzenlenmiş çeşitli biçimlerde (yapılandırılmış ve yapılandırılmamış) dosyalar içerir. Daha fazla bilgi için bkz. Göl evi nedir?
Not Defteri: Doku not defteri, zengin işlevlere sahip çok dilli etkileşimli bir programlama aracıdır. Kod ve markdown yazma, Spark işini çalıştırma ve izleme, sonucu görüntüleme ve görselleştirme ve ekiple işbirliği gibi özellikler. Veri mühendislerinin ve veri bilimcinin verileri keşfetmesine ve işlemesine ve hem kod hem de düşük kod deneyimiyle makine öğrenmesi denemeleri oluşturmasına yardımcı olur. Düzenleme için kolayca işlem hattı etkinliğine dönüştürülebilir.
Spark uygulaması: Apache Spark uygulaması, kullanıcı tarafından Spark'ın API dillerinden (Scala, Python, Spark SQL veya Java) veya Microsoft tarafından eklenen dillerden (C# veya F# ile.NET) birini kullanarak yazılmış bir programdır. Bir uygulama çalıştırıldığında, verileri daha hızlı işlemek için paralel olarak çalışan bir veya daha fazla Spark işine ayrılır. Daha fazla bilgi için bkz . Spark uygulaması izleme.
Apache Spark işi: Spark işi, uygulamadaki diğer işlerle paralel olarak çalıştırılacak bir Spark uygulamasının parçasıdır. bir iş birden çok görevden oluşur. Daha fazla bilgi için bkz . Spark işi izleme.
Apache Spark iş tanımı: Spark iş tanımı, bir Spark uygulamasının nasıl çalıştırılması gerektiğini belirten, kullanıcı tarafından ayarlanan bir parametre kümesidir. Spark kümesine toplu iş veya akış işleri göndermenizi sağlar. Daha fazla bilgi için bkz. Apache Spark iş tanımı nedir?
V sırası: Hızlı okuma ve maliyet verimliliği ile daha iyi performans sağlayan parquet dosya biçimine yönelik bir yazma iyileştirmesi. Tüm Doku altyapıları varsayılan olarak v sıralı parquet dosyaları yazar.
Data Factory
Bağlayıcı: Data Factory, farklı türlerdeki veri depolarına bağlanmanızı sağlayan zengin bir bağlayıcı kümesi sunar. Bağlandıktan sonra verileri dönüştürebilirsiniz. Daha fazla bilgi için bkz . bağlayıcılar.
Veri işlem hattı: Data Factory'de, veri taşıma ve dönüştürmeyi düzenlemeye yönelik bir veri işlem hattı kullanılır. Bu işlem hatları, Doku'daki dağıtım işlem hatlarından farklıdır. Daha fazla bilgi için bkz . Data Factory'ye genel bakış bölümünde İşlem hatları .
Veri Akışı 2. Nesil: Veri akışları, yüzlerce veri kaynağından veri almak ve verilerinizi dönüştürmek için düşük kodlu bir arabirim sağlar. Dokudaki veri akışları, Veri Akışı 2. Nesil olarak adlandırılır. Veri akışı 1. Nesil Power BI'da mevcuttur. Veri Akışı 2. Nesil, Azure Data Factory veya Power BI'daki Veri akışlarına kıyasla ek özellikler sunar. 1. Nesil'den 2. Nesil'e yükseltemezsiniz. Daha fazla bilgi için bkz . Data Factory'ye genel bakış bölümünde Veri akışları .
Tetikleyici: Data Factory'de zamanlamalar veya veri kullanılabilirliği gibi belirli koşullara göre işlem hatlarını başlatan bir otomasyon özelliği.
Doku Veri Bilimi
Data Wrangler: Data Wrangler, kullanıcılara keşif veri analizi gerçekleştirmek için çevreleyici bir deneyim sunan not defteri tabanlı bir araçtır. Bu özellik, kılavuz benzeri bir veri görüntüsünü dinamik özet istatistikleri ve bir dizi ortak veri temizleme işlemiyle birleştirir ve bunların tümü birkaç seçili simgeyle kullanılabilir. Her işlem, yeniden kullanılabilir bir betik olarak not defterine geri kaydedilebilen kod oluşturur.
Deneme: Makine öğrenmesi denemesi, tüm ilgili makine öğrenmesi çalıştırmaları için birincil kuruluş ve denetim birimidir. Daha fazla bilgi için bkz . Microsoft Fabric'te makine öğrenmesi denemeleri.
Model: Makine öğrenmesi modeli, belirli desen türlerini tanımak için eğitilmiş bir dosyadır. Modeli bir veri kümesi üzerinde eğitip bu veri kümesinden bilgi edinmek için kullandığı bir algoritma sağlarsınız. Daha fazla bilgi için bkz . Makine öğrenmesi modeli.
Çalıştırma: Çalıştırma, model kodunun tek bir yürütülmesine karşılık gelir. MLflow'da izleme, denemeleri ve çalıştırmaları temel alır.
Doku Veri Ambarı
SQL analizi uç noktası: Her Lakehouse'da, bir kullanıcının TDS üzerinden TSQL ile delta tablo verilerini sorgulamasına olanak tanıyan bir SQL analiz uç noktası vardır. Daha fazla bilgi için bkz . SQL analytics uç noktası.
Doku Veri Ambarı: Doku Veri Ambarı geleneksel bir veri ambarı olarak çalışır ve kurumsal veri ambarından bekleyebileceğiniz tam işlemsel T-SQL özelliklerini destekler. Daha fazla bilgi için bkz . Doku Veri Ambarı.
Gerçek Zamanlı Analiz
Etkinleştirici: Etkinleştirici, verileriniz üzerinde uyarılar, tetikleyiciler ve eylemler oluşturmanıza olanak tanıyan kod içermeyen, düşük kodlu bir araçtır. Etkinleştirici, veri akışlarınızda uyarı oluşturmak için kullanılır. Daha fazla bilgi için bkz . Etkinleştirici.
Eventhouse: Eventhouses, özellikle gerçek zamanlı analiz ve araştırma gerektiren senaryolarda büyük hacimli verileri işlemek ve analiz etmek için bir çözüm sağlar. Gerçek zamanlı veri akışlarını verimli bir şekilde işlemek için tasarlanmıştır ve bu sayede kuruluşlar verileri neredeyse gerçek zamanlı olarak alır, işler ve analiz eder. Tek bir çalışma alanı birden çok Eventhouse barındırabilir, bir olay evi birden çok KQL veritabanını barındırabilir ve her veritabanı birden çok tablo barındırabilir. Daha fazla bilgi için bkz . Eventhouse'a genel bakış.
Eventstream: Microsoft Fabric olay akışları özelliği, gerçek zamanlı olayları yakalamak, dönüştürmek ve kod içermeyen bir deneyime sahip hedeflere yönlendirmek için Doku platformunda merkezi bir yer sağlar. Olay akışı çeşitli akış veri kaynaklarından, alım hedeflerinden ve dönüştürme gerektiğinde bir olay işlemciden oluşur. Daha fazla bilgi için bkz . Microsoft Fabric olay akışları.
KQL Veritabanı: KQL Veritabanı, verileri KQL sorgularını yürütebileceğiniz bir biçimde tutar. KQL veritabanları bir Eventhouse altındaki öğelerdir. Daha fazla bilgi için bkz . KQL veritabanı.
KQL Sorgu Kümesi: KQL Sorgu Kümesi, Veri Gezgini veritabanınızdaki veriler üzerinde sorgu çalıştırmak, sonuçları görüntülemek ve sorgu sonuçlarını işlemek için kullanılan öğedir. Sorgu kümesi veritabanlarını ve tabloları, sorguları ve sonuçları içerir. KQL Queryset, sorguları gelecekte kullanmak üzere kaydetmenize veya sorguları dışarı aktarmanıza ve başkalarıyla paylaşmanıza olanak tanır. Daha fazla bilgi için bkz . KQL Sorgu Kümesindeki verileri sorgulama
Gerçek zamanlı merkez
- Gerçek Zamanlı hub: Gerçek Zamanlı hub, kuruluşunuzun tamamında hareket halindeki tüm veriler için tek bir yerdir. Her Microsoft Fabric kiracısı hub ile otomatik olarak sağlanır. Daha fazla bilgi için bkz . Gerçek zamanlı hub'a genel bakış.
OneLake
- Kısayol: Kısayollar, OneLake içinde diğer dosya deposu konumlarına işaret eden ekli başvurulardır. Bunlar, doğrudan kopyalamak zorunda kalmadan mevcut verilere bağlanmak için bir yol sağlar. Daha fazla bilgi için bkz . OneLake kısayolları.