다음을 통해 공유


Azure Data Factory 또는 Azure Synapse Analytics를 사용하여 Amazon RDS for SQL Server에서 데이터 복사

이 문서에서는 Azure Data Factory 및 Azure Synapse 파이프라인의 복사 작업을 사용하여 Amazon RDS for SQL Server 데이터베이스의 데이터를 복사하는 방법을 간략하게 설명합니다. 자세한 내용은 Azure Data Factory 또는 Azure Synapse Analytics의 소개 문서를 참조하세요.

지원되는 기능

이 Amazon RDS for SQL Server 커넥터에서 지원하는 기능은 다음과 같습니다.

지원되는 기능 IR
복사 작업(원본/-) 3,4
조회 작업 3,4
GetMetadata 작업 3,4
저장 프로시저 작업 3,4

① Azure 통합 런타임 ② 자체 호스팅 통합 런타임

복사 작업의 원본 또는 싱크로 지원되는 데이터 저장소 목록은 지원되는 데이터 저장소 표를 참조하세요.

특히 이 Amazon RDS for SQL Server 커넥터는 다음을 지원합니다.

  • SQL Server 버전 2005 이상
  • SQL 또는 Windows 인증을 사용한 데이터 복사
  • SQL 쿼리 또는 저장 프로시저를 사용하여 데이터 검색(원본). Amazon RDS for SQL Server 원본에서 병렬 복사를 선택할 수도 있습니다. 자세한 내용은 SQL 데이터베이스에서 병렬 복사 섹션을 참조하세요.

SQL Server Express LocalDB는 지원되지 않습니다.

필수 조건

데이터 저장소가 온-프레미스 네트워크, Azure 가상 네트워크 또는 Amazon Virtual Private Cloud 내에 있는 경우 자체 호스팅된 통합 런타임을 구성하여 연결해야 합니다.

데이터 저장소가 관리형 클라우드 데이터 서비스인 경우 Azure Integration Runtime을 사용할 수 있습니다. 액세스가 방화벽 규칙에서 승인된 IP로 제한되는 경우 허용 목록에 Azure Integration Runtime IP를 추가할 수 있습니다.

또한 Azure Data Factory의 관리형 가상 네트워크 통합 런타임 기능을 사용하면 자체 호스팅 통합 런타임을 설치하고 구성하지 않고도 온-프레미스 네트워크에 액세스할 수 있습니다.

Data Factory에서 지원하는 네트워크 보안 메커니즘 및 옵션에 대한 자세한 내용은 데이터 액세스 전략을 참조하세요.

시작하기

파이프라인에 복사 작업을 수행하려면 다음 도구 또는 SDK 중 하나를 사용하면 됩니다.

UI를 사용하여 Amazon RDS for SQL Server 연결된 서비스 만들기

다음 단계를 사용하여 Azure Portal UI에서 Amazon RDS for SQL Server 연결된 서비스를 만듭니다.

  1. Azure Data Factory 또는 Synapse 작업 영역에서 관리 탭으로 이동하여 연결된 서비스를 선택하고 새로 만들기를 클릭합니다.

  2. Amazon RDS for SQL Server를 검색하고 Amazon RDS for SQL Server 커넥터를 선택합니다.

    Amazon RDS for SQL Server 커넥터의 스크린샷

  3. 서비스 세부 정보를 구성하고, 연결을 테스트하고, 새로운 연결된 서비스를 만듭니다.

    Amazon RDS for SQL Server 연결된 서비스 구성 스크린샷

커넥터 구성 세부 정보

다음 섹션에서는 Amazon RDS for SQL Server 데이터베이스 커넥터와 관련된 Data Factory 및 Synapse 파이프라인 엔터티를 정의하는 데 사용되는 속성에 대해 자세히 설명합니다.

연결된 서비스 속성

Amazon RDS for SQL Server 커넥터 권장 버전은 TLS 1.3을 지원합니다. Amazon RDS for SQL Server 커넥터 버전을 레거시 버전에서 업그레이드하려면 이 섹션을 참조하세요. 속성 세부 정보는 해당 섹션을 참조하세요.

참고 항목

Amazon RDS for SQL Server Always Encrypted는 데이터 흐름에서 지원되지 않습니다.

"UserErrorFailedToConnectToSqlServer" 오류 코드 및 "데이터베이스에 대한 세션 제한이 XXX이고 이에 도달했습니다."와 같은 메시지가 있는 오류가 발생하면 Pooling=false를 연결 문자열에 추가하고 다시 시도하세요.

권장 버전을 적용하면 Amazon RDS for SQL Server 연결된 서비스에 대해 다음과 같은 제네릭 속성이 지원됩니다.

속성 설명 필수
type 형식 속성은 AmazonRdsForSqlServer로 설정되어야 합니다.
server 연결하려는 SQL Server 인스턴스의 이름 또는 네트워크 주소입니다.
database 데이터베이스의 이름입니다.
authenticationType 인증에 사용되는 형식입니다. 허용되는 값은 SQL(기본값), Windows입니다. 특정 속성 및 필수 구성 요소에 대한 관련 인증 섹션으로 이동합니다.
alwaysEncryptedSettings 관리 ID 또는 서비스 주체를 사용하여 Amazon RDS for SQL Server에 저장된 중요한 데이터를 보호하기 위해 Always Encrypted를 사용하도록 설정하는 데 필요한 alwaysencryptedsettings 정보를 지정합니다. 자세한 내용은 표 다음에 나오는 JSON 예제와 Always Encrypted 사용 섹션을 참조하세요. 지정하지 않으면 기본 Always Encrypted 설정이 사용하도록 설정되지 않습니다. 아니요
encrypt 클라이언트와 서버 간에 전송되는 모든 데이터에 TLS 암호화가 필요한지 여부를 나타냅니다. 옵션: 필수(true의 경우 기본값)/선택(false의 경우)/엄격. 아니요
trustServerCertificate 신뢰의 유효성을 검사하기 위해 인증서 체인을 무시하면서 채널을 암호화할지 여부를 나타냅니다. 아니요
hostNameInCertificate 연결에 대한 서버 인증서의 유효성을 검사할 때 사용할 호스트 이름입니다. 지정하지 않으면 서버 이름이 인증서 유효성 검사에 사용됩니다. 아니요
connectVia Integration Runtime은 데이터 저장소에 연결하는 데 사용됩니다. 필수 구성 요소 섹션에서 자세히 알아보세요. 지정하지 않으면 기본 Azure 통합 런타임이 사용됩니다. 아니요

추가 연결 속성은 아래 표를 참조하세요.

속성 설명 필수
applicationIntent 서버에 연결할 때의 애플리케이션 워크로드 형식입니다. 허용되는 값은 ReadOnlyReadWrite입니다. 아니요
connectTimeout 연결 시도를 마치고 오류가 표시하기 전까지 서버 연결을 기다리는 시간(초)입니다. 아니요
connectRetryCount 유휴 연결 실패를 식별한 후 다시 연결을 시도한 횟수입니다. 값은 0에서 255 사이의 정수여야 합니다. 아니요
connectRetryInterval 유휴 연결 실패를 식별한 후 각 다시 연결 시도 사이의 시간(초)입니다. 값은 1에서 60 사이의 정수여야 합니다. 아니요
loadBalanceTimeout 연결이 끊어지기 전에 연결이 연결 풀에 유지되는 최소 시간(초)입니다. 아니요
commandTimeout 명령 실행 시도를 종료하고 오류를 생성하기 전의 기본 대기 시간(초)입니다. 아니요
integratedSecurity 허용되는 값은 true 또는 false입니다. false를 지정할 때 userName 및 암호가 연결에 지정되었는지 여부를 표시합니다. true를 지정할 때 현재 Windows 계정 자격 증명이 인증에 사용되는지 여부를 나타냅니다. 아니요
failoverPartner 주 서버가 다운된 경우 연결할 파트너 서버의 이름 또는 주소입니다. 아니요
maxPoolSize 특정 연결에 대해 연결 풀에 허용되는 최대 연결 수입니다. 아니요
minPoolSize 특정 연결에 대해 연결 풀에서 허용되는 최소 연결 수입니다. 아니요
multipleActiveResultSets 허용되는 값은 true 또는 false입니다. true를 지정하면 애플리케이션이 MARS(Multiple Active Result Set)를 유지할 수 있습니다. false를 지정하면 애플리케이션은 해당 연결에서 다른 일괄 처리를 실행하기 전에 하나의 일괄 처리에서 모든 결과 집합을 처리하거나 취소해야 합니다. 아니요
multiSubnetFailover 허용되는 값은 true 또는 false입니다. 애플리케이션이 다른 서브넷의 AlwaysOn AG(가용성 그룹)에 연결하는 경우 이 속성을 true로 설정하면 현재 활성 서버를 더 빠르게 검색하고 연결할 수 있습니다. 아니요
packetSize 서버 인스턴스와 통신하는 데 사용되는 네트워크 패킷의 크기(바이트)입니다. 아니요
풀링 허용되는 값은 true 또는 false입니다. true를 지정하면 연결이 풀링됩니다. false를 지정하면 연결이 요청될 때마다 연결이 명시적으로 열립니다. 아니요

SQL 인증

SQL 인증을 사용하려면 앞 섹션에서 설명한 일반 속성 외에 다음 속성을 지정합니다.

속성 설명 필수
userName 서버에 연결하는 데 사용되는 사용자 이름입니다.
password 사용자 이름의 암호입니다. 이 필드를 SecureString으로 표시하여 안전하게 저장합니다. 또는 Azure Key Vault에 저장된 비밀을 참조할 수 있습니다.

예제: SQL 인증 사용

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

예제: Azure Key Vault의 암호를 통한 SQL 인증 사용

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

예제: Always Encrypted 사용

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            },
            "alwaysEncryptedSettings": {
                "alwaysEncryptedAkvAuthType": "ServicePrincipal",
                "servicePrincipalId": "<service principal id>",
                "servicePrincipalKey": {
                    "type": "SecureString",
                    "value": "<service principal key>"
                }
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Windows 인증

Windows 인증을 사용하려면 앞 섹션에서 설명한 일반 속성 외에 다음 속성을 지정합니다.

속성 설명 필수
userName 사용자 이름을 지정합니다. domainname\username을 예로 들 수 있습니다.
password 사용자 이름으로 지정한 사용자 계정에 대한 암호를 지정합니다. 이 필드를 SecureString으로 표시하여 안전하게 저장합니다. 또는 Azure Key Vault에 저장된 비밀을 참조할 수 있습니다.

예: Windows 인증 사용

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "Windows",
            "userName": "<domain\\username>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

레거시 버전

레거시 버전을 적용하면 Amazon RDS for SQL Server 연결된 서비스에 대해 다음 제네릭 속성이 지원됩니다.

속성 설명 필수
type 형식 속성은 AmazonRdsForSqlServer로 설정되어야 합니다.
alwaysEncryptedSettings 관리 ID 또는 서비스 주체를 사용하여 Amazon RDS for SQL Server에 저장된 중요한 데이터를 보호하기 위해 Always Encrypted를 사용하도록 설정하는 데 필요한 alwaysencryptedsettings 정보를 지정합니다. 자세한 내용은 Always Encrypted 사용 섹션을 참조하세요. 지정하지 않으면 기본 Always Encrypted 설정이 사용하도록 설정되지 않습니다. 아니요
connectVia Integration Runtime은 데이터 저장소에 연결하는 데 사용됩니다. 필수 구성 요소 섹션에서 자세히 알아보세요. 지정하지 않으면 기본 Azure 통합 런타임이 사용됩니다. 아니요

이 Amazon RDS for SQL Server 커넥터는 다음 인증 유형을 지원합니다. 자세한 내용은 해당 섹션을 참조하세요.

레거시 버전에 대한 SQL 인증

SQL 인증을 사용하려면 앞 섹션에서 설명한 일반 속성 외에 다음 속성을 지정합니다.

속성 설명 필수
connectionString Amazon RDS for SQL Server 데이터베이스에 연결하는 데 필요한 connectionString 정보를 지정합니다. 로그인 이름을 사용자 이름으로 지정하고 연결하려는 데이터베이스가 이 로그인에 매핑되었는지 확인합니다.
password Azure Key Vault에 암호를 입력하려면 연결 문자열에서 password 구성을 가져옵니다. 자세한 내용은 Azure Key Vault에 자격 증명 저장을 참조하세요. 아니요

레거시 버전에 대한 Windows 인증

Windows 인증을 사용하려면 앞 섹션에서 설명한 일반 속성 외에 다음 속성을 지정합니다.

속성 설명 필수
connectionString Amazon RDS for SQL Server 데이터베이스에 연결하는 데 필요한 connectionString 정보를 지정합니다.
userName 사용자 이름을 지정합니다. domainname\username을 예로 들 수 있습니다.
password 사용자 이름으로 지정한 사용자 계정에 대한 암호를 지정합니다. 이 필드를 SecureString으로 표시하여 안전하게 저장합니다. 또는 Azure Key Vault에 저장된 비밀을 참조할 수 있습니다.

데이터 세트 속성

데이터 세트 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 데이터 세트 문서를 참조하세요. 이 섹션에서는 Amazon RDS for SQL Server 데이터 세트에서 지원하는 속성 목록을 제공합니다.

Amazon RDS for SQL Server 데이터베이스에서 데이터를 복사하기 위해 다음 속성이 지원됩니다.

속성 설명 필수
type 데이터 세트의 type 속성을 AmazonRdsForSqlServerTable로 설정해야 합니다.
schema(스키마) 스키마의 이름입니다. 아니요
table 테이블/뷰의 이름입니다. 아니요
tableName 스키마가 포함된 테이블/뷰의 이름입니다. 이 속성은 이전 버전과의 호환성을 위해 지원됩니다. 새 워크로드의 경우 schematable을 사용합니다. 아니요

예제

{
    "name": "AmazonRdsForSQLServerDataset",
    "properties":
    {
        "type": "AmazonRdsForSqlServerTable",
        "linkedServiceName": {
            "referenceName": "<Amazon RDS for SQL Server linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, retrievable during authoring > ],
        "typeProperties": {
            "schema": "<schema_name>",
            "table": "<table_name>"
        }
    }
}

복사 작업 속성

작업 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 파이프라인 문서를 참조하세요. 이 섹션에서는 Amazon RDS for SQL Server 원본에서 지원하는 속성 목록을 제공합니다.

원본인 Amazon RDS for SQL Server

데이터 분할을 사용하여 Amazon RDS for SQL Server에서 데이터를 효율적으로 로드하려면 SQL Database에서 병렬 복사에서 자세히 알아보세요.

Amazon RDS for SQL Server에서 데이터를 복사하려면 복사 작업의 원본 형식을 AmazonRdsForSqlServerSource로 설정합니다. 복사 작업 source 섹션에서 다음 속성이 지원됩니다.

속성 설명 필수
type 복사 작업 원본의 type 속성은 AmazonRdsForSqlServerSource로 설정해야 합니다.
SqlReaderQuery 사용자 지정 SQL 쿼리를 사용하여 데이터를 읽습니다. 예제는 select * from MyTable입니다. 아니요
sqlReaderStoredProcedureName 이 속성은 원본 테이블에서 데이터를 읽는 저장 프로시저의 이름입니다. 마지막 SQL 문은 저장 프로시저의 SELECT 문이어야 합니다. 아니요
storedProcedureParameters 저장 프로시저용 매개 변수입니다.
허용되는 값은 이름 또는 값 쌍입니다. 매개 변수의 이름 및 대/소문자는 저장 프로시저 매개 변수의 이름 및 대/소문자와 일치해야 합니다.
아니요
isolationLevel SQL 원본에 대한 트랜잭션 잠금 동작을 지정합니다. 허용되는 ReadCommitted, ReadUncommitted, RepeatableRead, Serializable, Snapshot입니다. 지정하지 않으면 데이터베이스의 기본 격리 수준이 사용됩니다. 자세한 내용은 이 문서를 참조하세요. 아니요
partitionOptions Amazon RDS for SQL Server에서 데이터를 로드하는 데 사용되는 데이터 분할 옵션을 지정합니다.
허용되는 값은 None(기본값), PhysicalPartitionsOfTableDynamicRange입니다.
파티션 옵션을 사용하도록 설정하는 경우(즉, None이 아님) Amazon RDS for SQL Server에서 데이터를 동시에 로드하는 병렬 처리 수준은 복사 작업의 parallelCopies 설정으로 제어됩니다.
아니요
partitionSettings 데이터 분할에 대한 설정 그룹을 지정합니다.
파티션 옵션이 None이 아닌 경우 적용됩니다.
아니요
partitionSettings에서:
partitionColumnName 병렬 복사를 위해 범위 분할에서 사용할 원본 열의 이름을 정수 또는 날짜/날짜/시간 형식(int, smallint, bigint, date, smalldatetime, datetime, datetime2 또는 datetimeoffset)으로 지정합니다. 지정하지 않으면 테이블의 인덱스 또는 기본 키가 자동으로 검색되어 파티션 열로 사용됩니다.
파티션 옵션이 DynamicRange인 경우에 적용됩니다. 쿼리를 사용하여 원본 데이터를 검색하는 경우 WHERE 절에서 ?DfDynamicRangePartitionCondition 를 후크합니다. 예제는 SQL 데이터베이스에서 병렬 복사 섹션을 참조하세요.
아니요
partitionUpperBound 파티션 범위 분할에 대한 파티션 열의 최댓값입니다. 이 값은 테이블의 행을 필터링하는 것이 아니라 파티션 진행 속도를 결정하는 데 사용됩니다. 테이블 또는 쿼리 결과의 모든 행이 분할되고 복사됩니다. 지정하지 않으면 복사 작업에서 값을 자동으로 검색합니다.
파티션 옵션이 DynamicRange인 경우에 적용됩니다. 예제는 SQL 데이터베이스에서 병렬 복사 섹션을 참조하세요.
아니요
partitionLowerBound 파티션 범위 분할에 대한 파티션 열의 최솟값입니다. 이 값은 테이블의 행을 필터링하는 것이 아니라 파티션 진행 속도를 결정하는 데 사용됩니다. 테이블 또는 쿼리 결과의 모든 행이 분할되고 복사됩니다. 지정하지 않으면 복사 작업에서 값을 자동으로 검색합니다.
파티션 옵션이 DynamicRange인 경우에 적용됩니다. 예제는 SQL 데이터베이스에서 병렬 복사 섹션을 참조하세요.
아니요

주의 사항:

  • AmazonRdsForSqlServerSource에 대해 sqlReaderQuery가 지정되면 복사 작업에서 Amazon RDS for SQL Server 원본에 대해 이 쿼리를 실행하여 데이터를 가져옵니다. 저장 프로시저가 매개 변수를 사용하는 경우에는 sqlReaderStoredProcedureNamestoredProcedureParameters를 지정하여 저장 프로시저를 지정할 수도 있습니다.
  • 원본에서 저장 프로시저를 사용하여 데이터를 검색하는 경우 다른 매개 변수 값이 전달될 때 저장 프로시저에서 다른 스키마를 반환하도록 설계되면 UI에서 스키마를 가져오거나 자동 테이블 만들기를 사용하여 데이터를 SQL 데이터베이스에 복사할 때 예기치 않은 결과가 발생할 수 있습니다.

예제: SQL 쿼리 사용

"activities":[
    {
        "name": "CopyFromAmazonRdsForSQLServer",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Amazon RDS for SQL Server input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "AmazonRdsForSqlServerSource",
                "sqlReaderQuery": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

예제: 저장 프로시저 사용

"activities":[
    {
        "name": "CopyFromAmazonRdsForSQLServer",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Amazon RDS for SQL Server input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "AmazonRdsForSqlServerSource",
                "sqlReaderStoredProcedureName": "CopyTestSrcStoredProcedureWithParameters",
                "storedProcedureParameters": {
                    "stringData": { "value": "str3" },
                    "identifier": { "value": "$$Text.Format('{0:yyyy}', <datetime parameter>)", "type": "Int"}
                }
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

저장 프로시저 정의

CREATE PROCEDURE CopyTestSrcStoredProcedureWithParameters
(
    @stringData varchar(20),
    @identifier int
)
AS
SET NOCOUNT ON;
BEGIN
    select *
    from dbo.UnitTestSrcTable
    where dbo.UnitTestSrcTable.stringData != stringData
    and dbo.UnitTestSrcTable.identifier != identifier
END
GO

SQL 데이터베이스에서 병렬 복사

복사 작업의 Amazon RDS for SQL Server 커넥터는 데이터를 병렬로 복사하는 기본 제공 데이터 분할을 제공합니다. 복사 작업의 원본 탭에서 데이터 분할 옵션을 찾을 수 있습니다.

파티션 옵션의 스크린샷

분할된 복사본을 사용하도록 설정하면 복사 작업에서 Amazon RDS for SQL Server 원본에 대해 병렬 쿼리를 실행하여 파티션별로 데이터를 로드합니다. 병렬 수준은 복사 작업의 parallelCopies 설정에 의해 제어됩니다. 예를 들어 parallelCopies의 값을 4로 설정하면 서비스는 지정된 파티션 옵션과 설정에 따라 4개의 쿼리를 동시에 생성하고 실행하며, 각 쿼리는 Amazon RDS for SQL Server에서 데이터의 일부를 검색합니다.

특히 Amazon RDS for SQL Server에서 대량의 데이터를 로드하는 경우 데이터 분할을 통해 병렬 복사를 사용하도록 설정하는 것이 좋습니다. 다양한 시나리오에 대해 권장되는 구성은 다음과 같습니다. 파일 기반 데이터 저장소에 데이터를 복사할 때 여러 파일로 폴더에 쓰는 것이 좋습니다(폴더 이름만 지정). 이 경우 단일 파일에 쓰는 것보다 성능이 좋습니다.

시나리오 제안된 설정
실제 파티션이 있는 대형 테이블에서 전체 로드 파티션 옵션: 테이블의 실제 파티션

실행하는 동안 서비스에서 실제 파티션을 자동으로 검색하여 데이터를 파티션별로 복사합니다.

실제 파티션이 테이블에 있는지 확인하려면 이 쿼리를 참조할 수 있습니다.
실제 파티션이 없지만 데이터 분할에 대한 정수 또는 날짜/시간 열이 있는 대형 테이블에서 전체 로드를 수행합니다. 파티션 옵션: 동적 범위 파티션입니다.
파티션 열(선택 사항): 데이터를 분할하는 데 사용되는 열을 지정합니다. 지정하지 않으면 기본 키 열이 사용됩니다.
파티션 상한파티션 하한(선택 사항): 파티션 진행 속도를 결정할지 여부를 지정합니다. 이는 테이블의 행을 필터링하기 위한 것이 아니며, 테이블의 모든 행을 분할하고 복사합니다. 지정하지 않으면 복사 작업에서 값을 자동으로 검색하고 MIN 및 MAX 값에 따라 시간이 오래 걸릴 수 있습니다. 상한 및 하한을 제공하는 것이 좋습니다.

예를 들어 "ID" 파티션 열의 값 범위가 1~100이고 하한을 20으로 설정하고 상한을 80으로 설정하고 병렬 복사를 4로 설정하면 서비스에서 4개의 파티션별로(각각 ID 범위: <=20, [21, 50], [51, 80] 및 >=81) 데이터를 검색합니다.
실제 파티션이 없지만 데이터 분할에 대한 정수, 날짜 또는 날짜/시간 열이 있는 사용자 지정 쿼리를 사용하여 많은 양의 데이터를 로드합니다. 파티션 옵션: 동적 범위 파티션입니다.
쿼리:SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>.
파티션 열: 데이터를 분할하는 데 사용되는 열을 지정합니다.
파티션 상한파티션 하한(선택 사항): 파티션 진행 속도를 결정할지 여부를 지정합니다. 이는 테이블의 행을 필터링하기 위한 것이 아니며, 쿼리 결과의 모든 행을 분할하고 복사합니다. 지정하지 않으면 복사 작업에서 값을 자동으로 검색합니다.

예를 들어 "ID" 파티션 열의 값 범위가 1~100이고 하한을 20으로 설정하고 상한을 80으로 설정하고 병렬 복사를 4로 설정하면 서비스에서 4개의 파티션별로(각각 ID 범위: <=20, [21, 50], [51, 80] 및 >=81) 데이터를 검색합니다.

다양한 시나리오에 대한 추가 샘플 쿼리는 다음과 같습니다.
1. 전체 테이블 쿼리:
SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition
2. 열을 선택하고 where 절 필터를 추가하여 테이블 쿼리:
SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>
3. 하위 쿼리를 사용하여 쿼리:
SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>
4. 하위 쿼리에서 파티션을 사용하여 쿼리:
SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T

파티션 옵션을 사용하여 데이터를 로드하는 모범 사례:

  1. 데이터 기울이기를 방지하려면 고유한 열(예: 기본 키 또는 고유 키)을 분할 열로 선택합니다.
  2. 테이블에 기본 제공 파티션이 있는 경우 "테이블의 실제 파티션" 파티션 옵션을 사용하여 성능을 향상시킵니다.
  3. Azure Integration Runtime을 사용하여 데이터를 복사하는 경우 더 많은 컴퓨팅 리소스를 활용할 수 있도록 더 큰 “DIU(데이터 통합 ​​단위)”(>4)를 설정할 수 있습니다. 여기서 적용 가능한 시나리오를 확인합니다.
  4. "복사 병렬 처리 수준"은 파티션 수를 제어합니다. 이 수를 너무 크게 설정하면 성능이 저하되는 경우가 있습니다. 이 수를 (DIU 또는 자체 호스팅 IR 노드 수) * (2~4)로 설정하는 것이 좋습니다.

예제: 실제 파티션이 있는 대형 테이블에서 전체 로드

"source": {
    "type": "AmazonRdsForSqlServerSource",
    "partitionOption": "PhysicalPartitionsOfTable"
}

예: 동적 범위 파티션이 있는 쿼리

"source": {
    "type": "AmazonRdsForSqlServerSource",
    "query": "SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>",
    "partitionOption": "DynamicRange",
    "partitionSettings": {
        "partitionColumnName": "<partition_column_name>",
        "partitionUpperBound": "<upper_value_of_partition_column (optional) to decide the partition stride, not as data filter>",
        "partitionLowerBound": "<lower_value_of_partition_column (optional) to decide the partition stride, not as data filter>"
    }
}

실제 파티션을 확인하기 위한 샘플 쿼리

SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, pf.name AS PartitionFunctionName, c.name AS ColumnName, iif(pf.name is null, 'no', 'yes') AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id 
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id 
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id 
LEFT JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id 
LEFT JOIN sys.partition_functions pf ON pf.function_id = ps.function_id 
WHERE s.name='[your schema]' AND t.name = '[your table name]'

실제 파티션이 테이블에 있는 경우 다음과 같이 "HasPartition"이 "yes"로 표시됩니다.

SQL 쿼리 결과

조회 작업 속성

속성에 대한 자세한 내용을 보려면 조회 작업을 확인하세요.

GetMetadata 작업 속성

속성에 대한 자세한 내용을 보려면 GetMetadata 작업을 확인하세요.

Always Encrypted 사용

Always Encrypted를 사용하여 Amazon RDS for SQL Server에서/로 데이터를 복사하는 경우 다음 단계를 수행합니다.

  1. Azure Key VaultCMK(열 마스터 키)를 저장합니다. Azure Key Vault를 사용하여 Always Encrypted를 구성하는 방법을 자세히 알아보세요.

  2. CMK(열 마스터 키)가 저장된 키 자격 증명 모음에 액세스할 수 있는지 확인합니다. 필요한 권한은 이 문서를 참조하세요.

  3. 연결된 서비스를 만들어 SQL 데이터베이스에 연결하고 관리 ID 또는 서비스 주체를 사용하여 ‘Always Encrypted’ 기능을 사용하도록 설정합니다.

연결 문제 해결

  1. 원격 연결을 허용하도록 Amazon RDS for SQL Server 인스턴스를 구성합니다. Amazon RDS for SQL Server Management Studio를 시작하고, 마우스 오른쪽 단추로 서버를 클릭하고, 속성을 선택합니다. 목록에서 연결을 선택하고, 이 서버에 대한 원격 연결 허용 확인란을 선택합니다.

    원격 연결 사용

    자세한 단계는 원격 액세스 서버 구성 옵션 구성을 참조하세요.

  2. Amazon RDS for SQL Server 구성 관리자를 시작합니다. 사용하려는 인스턴스에 대한 Amazon RDS for SQL Server 네트워크 구성을 확장하고 MSSQLSERVER용 프로토콜을 선택합니다. 오른쪽 창에 프로토콜이 표시됩니다. 마우스 오른쪽 단추로 TCP/IP를 클릭하고 사용을 선택하여 TCP/IP를 사용하도록 설정합니다.

    TCP/IP 사용

    자세한 내용 및 TCP/IP 프로토콜을 사용하도록 설정하는 다른 방법은 서버 네트워크 프로토콜 설정 또는 해제를 참조하세요.

  3. 동일한 창에서 TCP/IP를 두 번 클릭하여 TCP/IP 속성 창을 시작합니다.

  4. IP 주소 탭으로 전환합니다. 아래로 스크롤하여 IPAll 섹션을 확인합니다. TCP 포트를 적어 둡니다. 기본값은 1433입니다.

  5. 컴퓨터에 Windows 방화벽에 대한 규칙 을 만들어 이 포트를 통해 들어오는 트래픽을 허용합니다.

  6. 연결 확인: 정규화된 이름을 사용하여 Amazon RDS for SQL Server에 연결하려면 다른 컴퓨터의 Amazon RDS for SQL Server Management Studio를 사용합니다. 예제는 "<machine>.<domain>.corp.<company>.com,1433"입니다.

Amazon RDS for SQL Server 버전 업그레이드

Amazon RDS for SQL Server 버전을 업그레이드하려면 연결된 서비스 편집 페이지의 버전에서 권장을 선택하고 권장 버전의 연결 서비스 속성을 참조하여 연결 서비스를 구성합니다.

아래 표에서는 권장 버전과 레거시 버전을 사용하는 SQL Server용 Amazon RDS 간의 차이점을 보여 줍니다.

추천 버전 레거시 버전
strict(으)로 encrypt을(를) 통해 TLS 1.3을 지원합니다. TLS 1.3은 지원되지 않습니다.

복사 작업에서 원본 및 싱크로 지원되는 데이터 저장소 목록은 지원되는 데이터 저장소를 참조하세요.