Настройка расположения хранилища результатов записной книжки
Требования к конфиденциальности вашей организации могут потребовать, чтобы все интерактивные записные книжки отображались в учетной записи хранения рабочей области в облачной учетной записи, а не в расположении уровня управления, управляемом Databricks, где хранятся некоторые результаты команды записной книжки.
Выходные данные команды записной книжки хранятся по-разному в зависимости от способа выполнения записной книжки.
По умолчанию при интерактивном запуске записной книжки нажмите кнопку "Выполнить " в записной книжке:
- Если результаты имеют небольшой размер, они хранятся в плоскости управления Azure Databricks, а также в содержимом и метаданных команд записной книжки.
- Более крупные результаты хранятся в учетной записи хранения рабочей области в подписке Azure. Azure Databricks автоматически создает учетную запись хранения рабочей области. Azure Databricks использует эту область хранилища для системных данных рабочей области и корневого каталога DBFS рабочей области. Результаты записной книжки хранятся в системном хранилище данных рабочей области, которое недоступно для пользователей. См . учетную запись хранения рабочей области.
При запуске записной книжки в качестве задания путем планирования или нажатия кнопки "Выполнить сейчас " на странице "Задания" все результаты хранятся в учетной записи хранения рабочей области.
Можно настроить рабочую область для хранения всех результатов интерактивной записной книжки в облачной учетной записи независимо от размера результата.
Настройка расположения хранилища для результатов интерактивной записной книжки
Вы можете настроить рабочую область для хранения всех результатов интерактивной записной книжки в подписке Azure, а не в плоскости управления. Эту функцию можно включить с помощью страницы параметров администратора или REST API. Эта конфигурация не влияет на записные книжки, которые выполняются как задания, результаты которых по умолчанию уже хранятся в подписке Azure.
Имейте в виду следующие моменты:
- Изменения в этой конфигурации действуют только для новых результатов. Результаты существующих записных книжек не перемещаются.
- Некоторые метаданные результатов, например имена столбцов диаграммы, по мере необходимости сохраняются на уровне управления.
- Ваш поставщик облачных служб может взимать повышенную плату за хранение.
- При чтении и записи результатов может наблюдаться увеличение задержки в работе сети и операциях ввода-вывода.
Сохранение всех результатов записной книжки в учетной записи с помощью страницы параметров администратора
Администратор рабочей области:
- Перейдите на страницу параметров.
- Перейдите на вкладку Безопасность .
- Щелкните интерактивную записную книжку Магазина, в результате которой вы запустите переключатель учетной записи клиента.
Сохраняйте все результаты записной книжки в учетной записи с помощью REST API
Чтобы настроить рабочую область для хранения всех результатов записной книжки в подписке Azure, используйте REST API:
- Вы должны быть администратором рабочей области.
- Вам потребуется личный маркер доступа. В рамках приведенных ниже инструкций предполагается, что вы настроили файл
.netrc
с помощью личного маркера доступа, чтобы можно было использовать параметр-n
в командахcurl
. Дополнительные сведения см. в указанной выше статье.
Чтобы получить текущую настройку, вызовите конечную точку GET /workspace-conf
и задайте для параметра keys
значение storeInteractiveNotebookResultsInCustomerAccount
:
curl -n --request GET \
'https://<databricks-instance>/api/2.0/workspace-conf?keys=storeInteractiveNotebookResultsInCustomerAccount'
Чтобы разрешить рабочей области сохранять результаты интерактивной записной книжки в подписке Azure, вызовите конечную точку PATCH /workspace-conf
и задайте для параметра storeInteractiveNotebookResultsInCustomerAccount
значение true
в тексте запроса:
curl -n --request PATCH \
'https://<databricks-instance>/api/2.0/workspace-conf' \
--header 'Content-Type: text/plain' \
--data-raw '{
"storeInteractiveNotebookResultsInCustomerAccount": "true"
}'
Чтобы отключить эту функцию, задайте для того же флага значение false
:
curl -n --request PATCH \
'https://<databricks-instance>/api/2.0/workspace-conf' \
--header 'Content-Type: text/plain' \
--data-raw '{
"storeInteractiveNotebookResultsInCustomerAccount": "false"
}'