Поделиться через


Руководство по Lakehouse. Создание lakehouse, прием примеров данных и создание отчета

В этом руководстве вы создадите lakehouse, введите примеры данных в таблицу Delta, примените преобразование, где это необходимо, а затем создадите отчеты. Из этого руководства вы узнаете, как выполнять следующие задачи:

  • Создание lakehouse из рабочей нагрузки Инжиниринг данных
  • Скачивание и прием примеров данных клиента
  • Добавление таблиц в семантику модели
  • Создание отчета

Если у вас нет Microsoft Fabric, зарегистрируйтесь для бесплатной пробной версии.

Необходимые компоненты

Создание озера данных

В этом разделе описано, как создать lakehouse из интерфейса Инжиниринг данных.

  1. В Power BI выберите рабочие области в меню слева.

  2. Чтобы открыть рабочую область, введите его имя в текстовое поле поиска, расположенное в верхней части и выберите его из результатов поиска.

  3. В левом нижнем углу переключателя выберите Инжиниринг данных.

    Снимок экрана, показывающий, где выбрать переключатель и Инжиниринг данных.

  4. На экране Инжиниринг данных выберите Lakehouse, чтобы создать озеро.

  5. В диалоговом окне New lakehouse введите wwilakehouse в поле "Имя".

    Снимок экрана: диалоговое окно New Lakehouse.

  6. Выберите "Создать", чтобы создать и открыть новый lakehouse.

Принятие демонстрационных данных

В этом разделе описано, как получить образец данных клиента в lakehouse.

Примечание.

Если вы не настроили OneDrive, зарегистрируйтесь для бесплатной пробной версии Microsoft 365: бесплатная пробная версия — попробуйте Microsoft 365 в течение месяца.

  1. Скачайте файл dimension_customer.csv из репозитория примеров Fabric.

  2. На вкладке "Главная" в разделе "Получение данных в озерном доме" отображаются параметры загрузки данных в lakehouse. Выберите новый поток данных 2-го поколения.

    Снимок экрана: выбор параметра New Dataflow 2-го поколения для загрузки данных в lakehouse.

  3. На новом экране потока данных выберите "Импорт" из текстового или CSV-файла.

  4. На экране "Подключиться к источнику данных" нажмите переключатель "Отправить файл". Перетащите файл dimension_customer.csv, скачанный на шаге 1. После отправки файла нажмите кнопку "Далее".

    Снимок экрана, показывающий, где выбрать команду

  5. На странице данных предварительного просмотра просмотрите данные и выберите "Создать", чтобы продолжить и вернуться на холст потока данных.

  6. В области параметров запроса обновите поле "Имя" до dimension_customer.

    Примечание.

    Структура добавляет пробел и число в конце имени таблицы по умолчанию. Имена таблиц должны быть нижним регистром и не должны содержать пробелы. Переименуйте его соответствующим образом и удалите все пробелы из имени таблицы.

    Снимок экрана: область параметров запроса, показывающая, где ввести имя и выбрать место назначения данных.

  7. В этом руководстве описано, как связать данные клиента с lakehouse. Если у вас есть другие элементы данных, которые вы хотите связать с Lakehouse, их можно добавить:

    1. В меню выберите "Добавить назначение данных" и выберите Lakehouse. На экране "Подключение к назначению данных" войдите в учетную запись при необходимости и нажмите кнопку "Далее".

    2. Перейдите к wwilakehouse в рабочей области.

    3. Если таблица dimension_customer не существует, выберите параметр "Создать таблицу" и введите имя таблицы dimension_customer. Если таблица уже существует, выберите параметр существующей таблицы и выберите dimension_customer из списка таблиц в обозревателе объектов. Выберите Далее.

      Снимок экрана: выбор целевой таблицы.

    4. На панели "Выбор параметров назначения" выберите "Заменить как метод обновления". Выберите "Сохранить параметры", чтобы вернуться на холст потока данных.

  8. На холсте потока данных можно легко преобразовать данные на основе бизнес-требований. Для простоты мы не делаем никаких изменений в этом руководстве. Чтобы продолжить, выберите "Опубликовать " в правом нижнем углу экрана.

    Снимок экрана: панель параметров запроса, содержащая кнопку

  9. Круг вращения рядом с именем потока данных указывает, что публикация выполняется в представлении элемента. После завершения публикации выберите ... и выберите "Свойства". Переименуйте поток данных в load Lakehouse Table и нажмите кнопку "Сохранить".

  10. Выберите параметр "Обновить сейчас" рядом с именем потока данных, чтобы обновить поток данных. Этот параметр запускает поток данных и перемещает данные из исходного файла в таблицу Lakehouse. Пока он выполняется, в представлении элемента отображается круг спиннинга под обновленным столбцом.

    Снимок экрана: расположение значка

  11. После обновления потока данных выберите новый lakehouse в левой панели навигации, чтобы просмотреть таблицу dimension_customer Delta.

    Снимок экрана: панель навигации, из которой открывается lakehouse.

  12. Выберите таблицу для предварительного просмотра данных. Вы также можете использовать конечную точку аналитики SQL в lakehouse для запроса данных с помощью инструкций SQL. Выберите конечную точку аналитики SQL в раскрывающемся меню Lakehouse в правом верхнем углу экрана.

    Снимок экрана: таблица Delta, показывающая, где выбрать конечную точку аналитики SQL.

  13. Выберите таблицу dimension_customer , чтобы просмотреть данные или выбрать новый SQL-запрос для записи инструкций SQL.

    Снимок экрана: экран конечной точки аналитики SQL, на котором показано, где выбрать новый SQL-запрос.

  14. Следующий пример запроса объединяет количество строк на основе столбца BuyingGroup таблицы dimension_customer. Файлы SQL-запросов сохраняются автоматически для будущей ссылки, и вы можете переименовать или удалить эти файлы в зависимости от необходимости.

    Чтобы запустить скрипт, щелкните значок запуска в верхней части файла скрипта.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Создание отчета

В этом разделе вы создадите отчет из полученных данных.

  1. Ранее все таблицы и представления lakehouse были автоматически добавлены в семантику модели. При последних обновлениях для новых озерных домов необходимо вручную добавить таблицы в семантику модели. Откройте lakehouse и перейдите в представление конечной точки аналитики SQL. На вкладке "Отчеты " выберите " Управление семантической моделью по умолчанию" и выберите таблицы, которые необходимо добавить в семантику. В этом случае выберите таблицу dimension_customer .

    Снимок экрана: выбор таблиц для добавления в семантику модели.

  2. Чтобы обеспечить синхронизацию таблиц в семантической модели, перейдите в представление конечной точки аналитики SQL и откройте панель параметров lakehouse. Выберите семантику Power BI по умолчанию и включите синхронизацию семантической модели Power BI по умолчанию. Дополнительные сведения см. в разделе "Семантические модели Power BI по умолчанию".

    Снимок экрана: включение синхронизации данных с семантической моделью по умолчанию.

  3. После добавления таблицы Fabric создает семантику модели с тем же именем, что и lakehouse.

    Снимок экрана: семантическая модель по умолчанию, созданная при создании нового lakehouse.

  4. В области семантической модели можно просмотреть все таблицы. Вы можете создавать отчеты с нуля, с разбивкой на страницы или автоматически создавать отчет power BI на основе данных. В этом руководстве в разделе "Изучение этих данных" выберите "Автоматически создать отчет". В следующем руководстве мы создадим отчет с нуля.

    Снимок экрана: страница сведений о семантической модели, на которой показано, где выбрать команду

  5. Так как таблица является измерением и в нем отсутствуют меры, Power BI создает меру для счетчика строк и агрегирует ее по разным столбцам и создает различные диаграммы, как показано на следующем рисунке. Этот отчет можно сохранить в будущем, нажав кнопку "Сохранить " на верхней ленте. Вы можете внести дополнительные изменения в этот отчет в соответствии с вашими требованиями, включив или исключив другие таблицы или столбцы.

    Снимок экрана: страница

Следующий шаг