Функция ai_summarize
Область применения: Databricks SQL Databricks Runtime
Внимание
Эта функция предоставляется в режиме общедоступной предварительной версии.
В предварительной версии:
- Базовая языковая модель может обрабатывать несколько языков, однако эти функции настраиваются для английского языка.
- Существует ограничение скорости для базовых API-интерфейсов модели Foundation. Изучите ограничения API модели Foundation и update этих ограничений.
- Из-за ограничения скорости эта функция предназначена для тестирования на небольших наборах данных, которые имеют менее 100 строк. Для вариантов использования с более чем 100 строками данных Databricks рекомендует использовать
ai_query
и подготовленную конечную точку пропускной способности. См. раздел Выполнение пакетного вывода LLM с помощью ai_query.
Функция ai_summarize()
позволяет вызывать генеративную модель искусственного интеллекта, чтобы generate сводку заданного текста с помощью SQL. Эта функция использует конечную точку обслуживания чата , доступную API модели Databricks Foundation.
Требования
Внимание
Базовые модели, которые могут использоваться в настоящее время, лицензируются в соответствии с лицензией Apache 2.0, © Apache Software Foundation или LLAMA 3.1 Community License Meta © Platform, Inc. Все права защищены. Клиенты отвечают за обеспечение соответствия применимым лицензиям модели.
Databricks рекомендует просматривать эти лицензии, чтобы обеспечить соответствие любым применимым условиям. Если в будущем появятся модели, обладающие лучшей производительностью по внутренним оценкам Databricks, Databricks может изменить модель (и list применимых лицензий, перечисленных на этой странице).
В настоящее время Meta-Llama-3.1-70B-Instruct является базовой моделью, которая управляет этими функциями ИИ.
- Эта функция доступна только в рабочих областях в функциях ИИ с помощью поддерживаемых регионов API модели Foundation.
- Эта функция недоступна в Классической версии SQL Azure Databricks.
- Проверьте страницу цен на Databricks SQL.
Примечание.
В Databricks Runtime 15.1 и более поздних версиях эта функция поддерживается в записных книжках Databricks, включая записные книжки, которые выполняются как задача в рабочем процессе Databricks.
Синтаксис
ai_summarize(content[, max_words])
Аргументы
-
content
STRING
: выражение, текст, сводные данные. -
max_words
: необязательное неотрицательное числовое выражение, представляющее целевое количество слов в возвращаемом сводном тексте. Значение по умолчанию — 50. Если set равен 0, слово limitотсутствует.
Возвраты
STRING
.
Если content
равно NULL
, то результат – NULL
.
Примеры
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."