Руководство по Lakehouse. Создание lakehouse, прием примеров данных и создание отчета
В этом руководстве вы создадите lakehouse, введите примеры данных в таблицу Delta, примените преобразование, где это необходимо, а затем создадите отчеты. Из этого руководства вы узнаете, как выполнять следующие задачи:
- Создание lakehouse из рабочей нагрузки Инжиниринг данных
- Скачивание и прием примеров данных клиента
- Добавление таблиц в семантику модели
- Создание отчета
Если у вас нет Microsoft Fabric, зарегистрируйтесь для бесплатной пробной версии.
Необходимые компоненты
- Перед созданием lakehouse необходимо создать рабочую область Fabric.
- Перед приемом CSV-файла необходимо настроить OneDrive. Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.
Создание озера данных
В этом разделе описано, как создать lakehouse из интерфейса Инжиниринг данных.
В Power BI выберите рабочие области в меню слева.
Чтобы открыть рабочую область, введите его имя в текстовое поле поиска, расположенное в верхней части и выберите его из результатов поиска.
В левом нижнем углу переключателя выберите Инжиниринг данных.
На экране Инжиниринг данных выберите Lakehouse, чтобы создать озеро.
В диалоговом окне New lakehouse введите wwilakehouse в поле "Имя".
Выберите "Создать", чтобы создать и открыть новый lakehouse.
Принятие демонстрационных данных
В этом разделе описано, как получить образец данных клиента в lakehouse.
Примечание.
Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.
Скачайте файл dimension_customer.csv из репозитория примеров Fabric.
На вкладке "Главная" в разделе "Получение данных в озерном доме" отображаются параметры загрузки данных в lakehouse. Выберите новый поток данных 2-го поколения.
На новом экране потока данных выберите "Импорт" из текстового или CSV-файла.
На экране "Подключиться к источнику данных" нажмите переключатель "Отправить файл". Перетащите файл dimension_customer.csv, скачанный на шаге 1. После отправки файла нажмите кнопку "Далее".
На странице данных предварительного просмотра просмотрите данные и выберите "Создать", чтобы продолжить и вернуться на холст потока данных.
В области параметров запроса обновите поле "Имя" до dimension_customer.
Примечание.
Структура добавляет пробел и число в конце имени таблицы по умолчанию. Имена таблиц должны быть нижним регистром и не должны содержать пробелы. Переименуйте его соответствующим образом и удалите все пробелы из имени таблицы.
В этом руководстве описано, как связать данные клиента с lakehouse. Если у вас есть другие элементы данных, которые вы хотите связать с Lakehouse, их можно добавить:
В меню выберите "Добавить назначение данных" и выберите Lakehouse. На экране "Подключение к назначению данных" войдите в учетную запись при необходимости и нажмите кнопку "Далее".
Перейдите к wwilakehouse в рабочей области.
Если таблица dimension_customer не существует, выберите параметр "Создать таблицу" и введите имя таблицы dimension_customer. Если таблица уже существует, выберите параметр существующей таблицы и выберите dimension_customer из списка таблиц в обозревателе объектов. Выберите Далее.
На панели "Выбор параметров назначения" выберите "Заменить как метод обновления". Выберите "Сохранить параметры", чтобы вернуться на холст потока данных.
На холсте потока данных можно легко преобразовать данные на основе бизнес-требований. Для простоты мы не делаем никаких изменений в этом руководстве. Чтобы продолжить, выберите "Опубликовать " в правом нижнем углу экрана.
Круг вращения рядом с именем потока данных указывает, что публикация выполняется в представлении элемента. После завершения публикации выберите ... и выберите "Свойства". Переименуйте поток данных в load Lakehouse Table и нажмите кнопку "Сохранить".
Выберите параметр "Обновить сейчас" рядом с именем потока данных, чтобы обновить поток данных. Этот параметр запускает поток данных и перемещает данные из исходного файла в таблицу Lakehouse. Пока он выполняется, в представлении элемента отображается круг спиннинга под обновленным столбцом.
После обновления потока данных выберите новый lakehouse в левой панели навигации, чтобы просмотреть таблицу dimension_customer Delta.
Выберите таблицу для предварительного просмотра данных. Вы также можете использовать конечную точку аналитики SQL в lakehouse для запроса данных с помощью инструкций SQL. Выберите конечную точку аналитики SQL в раскрывающемся меню Lakehouse в правом верхнем углу экрана.
Выберите таблицу dimension_customer , чтобы просмотреть данные или выбрать новый SQL-запрос для записи инструкций SQL.
Следующий пример запроса объединяет количество строк на основе столбца BuyingGroup таблицы dimension_customer. Файлы SQL-запросов сохраняются автоматически для будущей ссылки, и вы можете переименовать или удалить эти файлы в зависимости от необходимости.
Чтобы запустить скрипт, щелкните значок запуска в верхней части файла скрипта.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Создание отчета
В этом разделе вы создадите отчет из полученных данных.
Ранее все таблицы и представления lakehouse были автоматически добавлены в семантику модели. При последних обновлениях для новых озерных домов необходимо вручную добавить таблицы в семантику модели. Откройте lakehouse и перейдите в представление конечной точки аналитики SQL. На вкладке "Отчеты " выберите " Управление семантической моделью по умолчанию" и выберите таблицы, которые необходимо добавить в семантику. В этом случае выберите таблицу dimension_customer .
Чтобы обеспечить синхронизацию таблиц в семантической модели, перейдите в представление конечной точки аналитики SQL и откройте панель параметров lakehouse. Выберите семантику Power BI по умолчанию и включите синхронизацию семантической модели Power BI по умолчанию. Дополнительные сведения см. в разделе "Семантические модели Power BI по умолчанию".
После добавления таблицы Fabric создает семантику модели с тем же именем, что и lakehouse.
В области семантической модели можно просмотреть все таблицы. Вы можете создавать отчеты с нуля, с разбивкой на страницы или автоматически создавать отчет power BI на основе данных. В этом руководстве в разделе "Изучение этих данных" выберите "Автоматически создать отчет". В следующем руководстве мы создадим отчет с нуля.
Так как таблица является измерением и в нем отсутствуют меры, Power BI создает меру для счетчика строк и агрегирует ее по разным столбцам и создает различные диаграммы, как показано на следующем рисунке. Этот отчет можно сохранить в будущем, нажав кнопку "Сохранить " на верхней ленте. Вы можете внести дополнительные изменения в этот отчет в соответствии с вашими требованиями, включив или исключив другие таблицы или столбцы.