SQL Server 언어 확장의 확장성 아키텍처
적용 대상: SQL Server 2019(15.x) 이상 버전
SQL Server에서 외부 코드를 실행할 수 있는 SQL Server 언어 확장에 사용되는 확장성 아키텍처를 알아봅니다. Java, Python, R은 SQL Server 2019(15.x) 이상 버전에서 지원됩니다. 이 코드는 언어 런타임 환경에서 코어 데이터베이스 엔진에 대한 확장으로 실행됩니다.
배경
확장성 프레임워크의 목적은 SQL Server와 외부 언어 간에 인터페이스를 제공하는 것입니다. 데이터베이스 관리자는 SQL Server로 관리되는 보안 프레임워크 내에서 신뢰할 수 있는 언어를 실행하여 데이터 과학자가 엔터프라이즈 데이터에 액세스하도록 허용하는 동시에 보안을 유지할 수 있습니다.
저장 프로시저를 호출하여 지원되는 모든 외부 언어를 실행할 수 있으며, 결과는 테이블 형식으로 SQL Server에 직접 반환됩니다. 이렇게 하면 SQL 쿼리를 보내고 결과를 처리할 수 있는 모든 애플리케이션의 외부 언어를 손쉽게 사용할 수 있습니다.
아키텍처 다이어그램
이 아키텍처는 외부 코드가 SQL Server와는 별도의 프로세스에서 실행되도록 설계되었지만, SQL Server에서 데이터와 작업에 대한 요청 체인을 내부적으로 관리하는 구성 요소를 사용합니다.
Windows의 구성 요소 아키텍처:
Linux의 구성 요소 아키텍처:
구성 요소에는 외부 런타임(예: Java)과 라이브러리 관련 논리를 호출하여 인터프리터와 라이브러리를 로드하는 데 사용되는 실행 패드 서비스가 포함됩니다.
실행 패드
SQL Server 실행 패드는 스크립트 실행을 담당하는 외부 프로세스의 수명, 리소스 및 보안 경계를 관리하는 서비스입니다. 이는 전체 텍스트 인덱싱 및 쿼리 서비스가 전체 텍스트 쿼리를 처리하기 위해 별도의 호스트를 시작하는 방식과 유사합니다. 실행 패드 서비스는 Microsoft에서 게시하거나 성능 및 리소스 관리 요구 사항을 충족시키는 것으로 Microsoft에서 인증한 신뢰할 수 있는 시작 관리자만 시작할 수 있습니다.
SQL Server 실행 패드 서비스는 실행 격리를 위해 AppContainers를 사용하는 SQLRUserGroup에서 실행됩니다.
SQL Server 컴퓨터 언어 확장을 추가한 각 데이터베이스 엔진 인스턴스에 대해 별도의 SQL Server 실행 패드 서비스가 생성됩니다. 데이터베이스 엔진 인스턴스마다 하나의 실행 패드 서비스가 있으므로 외부 스크립트를 지원하는 인스턴스가 여러 개인 경우 각 인스턴스에 대한 실행 패드 서비스가 제공됩니다. 데이터베이스 엔진 인스턴스는 해당 인스턴스에 대해 만들어진 실행 패드 서비스에 바인딩됩니다. 저장 프로시저 또는 T-SQL에서 외부 스크립트를 호출할 때마다 SQL Server 서비스에서 동일한 인스턴스에 대해 만들어진 실행 패드 서비스를 호출합니다.
지원되는 특정 언어로 작업을 실행하기 위해 실행 패드는 풀에서 보안 작업자 계정을 가져오고 외부 런타임을 관리하는 위성 프로세스를 시작합니다. 각 위성 프로세스는 실행 패드의 사용자 계정을 상속하고, 스크립트 실행 기간 동안 해당 작업자 계정을 사용합니다. 스크립트에서 병렬 프로세스를 사용하는 경우 동일한 단일 작업자 계정에서 만들어집니다.
구성 요소 간 통신 채널
이 섹션에서는 구성 요소 및 데이터 플랫폼 간의 통신 프로토콜에 대해 설명합니다.
TCP/IP
SQL Server와 SQL 위성 간의 내부 통신에서 기본적으로 TCP/IP를 사용합니다.
ODBC
외부 데이터 과학 클라이언트와 원격 SQL Server 인스턴스 간의 통신에서 ODBC를 사용합니다. 스크립트 작업을 SQL Server로 보내는 계정에는 인스턴스에 연결하고 외부 스크립트를 실행할 수 있는 두 가지 권한이 모두 있어야 합니다.
또한 작업에 따라 계정에 필요할 수 있는 권한은 다음과 같습니다.
- 작업에서 사용하는 데이터 읽기
- 테이블에 데이터 쓰기: 예를 들어 결과를 테이블에 저장하는 경우
- 데이터베이스 개체 만들기: 예를 들어 외부 스크립트를 새 저장 프로시저의 일부로 저장하는 경우
SQL Server가 원격 클라이언트에서 실행되는 스크립트의 컴퓨팅 컨텍스트로 사용되고 실행 파일이 외부 원본에서 데이터를 검색해야 하는 경우 ODBC가 쓰기 저장에 사용됩니다. SQL Server에서 원격 명령을 실행하는 사용자의 ID를 현재 인스턴스의 사용자 ID에 매핑하고, 해당 사용자의 자격 증명을 사용하여 ODBC 명령을 실행합니다. 이 ODBC 호출을 수행하는 데 필요한 연결 문자열은 클라이언트 코드에서 가져옵니다.
기타 프로토콜
"청크"로 작업하거나 데이터를 원격 클라이언트에 다시 전송해야 하는 프로세스도 XDF 파일 형식을 사용할 수 있습니다. 실제 데이터는 인코딩된 Blob을 통해 전송됩니다.