다음을 통해 공유


Azure Time Series Insights Gen1의 데이터 보존 이해

메모

Time Series Insights 서비스는 2024년 7월 7일에 사용 중지됩니다. 가능한 한 빨리 기존 환경을 대체 솔루션으로 마이그레이션하는 것이 좋습니다. 사용 중단 및 마이그레이션에 대한 자세한 내용은 설명서를참조하세요.

주의

Gen1 문서입니다.

이 문서에서는 Azure Time Series Insights 환경의 데이터 보존에 영향을 주는 두 가지 기본 설정을 설명합니다.

비디오

다음 비디오에서는 Azure Time Series Insights 데이터 보존 및 이를 계획하는 방법을 요약합니다.

각 Azure Time Series Insights 환경에는 데이터 보존 시간을 제어하는 데 사용되는설정이 있습니다. 값의 범위는 1일부터 400일까지입니다. 데이터는 먼저 제공되는 환경 스토리지 용량 또는 보존 기간에 따라 삭제됩니다.

또한 Azure Time Series Insights 환경에는 저장소 제한 초과 시 동작 관련된 설정이 있습니다. 환경의 최대 용량에 도달하면 수신 및 제거 동작을 제어합니다. 구성할 때 선택할 수 있는 두 가지 동작이 있습니다.

  • 이전 데이터 제거(기본값)
  • 입장 일시 중지

메모

기본적으로 새 환경을 만들 때, 보존 설정은 이전 데이터 제거로구성됩니다. 이 설정은 생성 후 필요에 따라 Azure 포털의 Azure Time Series Insights 환경의 구성 페이지에서 전환할 수 있습니다.

  • 보존 정책을 구성하는 방법에 대한 정보는 "Azure Time Series Insights 보존 구성"을 참조하십시오.

두 데이터 보존 정책은 아래에 자세히 설명되어 있습니다.

이전 데이터 제거

  • 이전 데이터 제거는 Azure Time Series Insights 환경의 기본 설정입니다.
  • Azure Time Series Insights 환경에서 최신 데이터 항상 사용하려는 경우 이전 데이터 제거하는 것이 좋습니다.
  • 이전 데이터 제거 설정 환경의 제한(보존 시간, 크기 또는 개수 중 가장 먼저 오는 데이터)에 도달하면 데이터가 제거됩니다. 보존 기간은 기본적으로 30일로 설정됩니다.
  • 가장 오래된 입력된 데이터는 먼저 제거됩니다("선입선출" 방법).

예제 1

예제 환경을 고려해 보십시오. 보존 동작 : 데이터 유입을 지속하고 과거 데이터을 제거합니다.

데이터 보존 시간 400일로 설정됩니다. 용량 총 용량이 30GB인 S1 단위로 설정됩니다. 인바운드 데이터가 매일 평균 500MB로 누적된다고 가정해 보겠습니다. 이 환경은 최대 용량이 60일로 도달하므로 인바운드 데이터의 속도를 감안할 때 60일 분량의 데이터만 유지할 수 있습니다. 인바운드 데이터는 매일 500MB x 60일 = 30GB로 누적됩니다.

61일에는 환경에 가장 최신 데이터가 표시되지만 60일보다 오래된 가장 오래된 데이터를 제거합니다. 제거를 통해 새 데이터를 계속 탐색할 수 있도록 새 데이터 스트리밍을 위한 공간을 확보합니다. 사용자가 데이터를 더 오래 보존하려는 경우 추가 단위를 추가하여 환경의 크기를 늘리거나 더 적은 데이터를 푸시할 수 있습니다.

예제 2

보존 정책 이 구성된 환경을 고려하여 데이터 수신을 계속하고 이전 데이터을 제거하십시오. 이 예제에서 데이터 보존 시간 180일의 더 낮은 값으로 설정됩니다. 용량 총 용량이 30GB인 S1 단위로 설정됩니다. 전체 180일 동안 데이터를 저장하기 위해 일일 수신은 하루에 0.166GB(166MB)를 초과할 수 없습니다.

이 환경의 일일 수신 속도가 일일 0.166GB를 초과할 때마다 일부 데이터가 제거되므로 180일 동안 데이터를 저장할 수 없습니다. 바쁜 시간대에 같은 환경을 고려해 보세요. 환경의 수신 속도가 하루 평균 0.189GB로 증가할 수 있다고 가정합니다. 해당 사용 중인 시간 프레임에서 약 158일의 데이터가 보존됩니다(30GB/0.189 = 158.73일 보존). 이 시간은 원하는 데이터 보존 시간 프레임보다 작습니다.

수신 일시 중지

  • 수신 일시 중지 설정은 보존 기간 이전에 크기 및 개수 제한에 도달한 경우 데이터가 제거되지 않도록 설계되었습니다.

  • 진입 일시 중지 보존 기간 위반으로 인해 데이터가 삭제되기 전에 사용자가 환경의 용량을 늘릴 수 있는 추가 시간을 제공합니다.

  • 데이터 손실로부터 보호하는 데 도움이 되지만, 이벤트 원본의 보존 기간을 초과하여 수신이 일시 중지된 경우 가장 최근 데이터가 손실될 수 있습니다.

  • 그러나 환경의 최대 용량에 도달하면 환경은 다음 추가 작업이 발생할 때까지 데이터 수신을 일시 중지합니다.

    • Azure Time Series Insights 환경크기를 조정하는 방법에 설명된 대로 환경의 최대 용량을 늘림으로써 더 많은 스케일 단위를 추가합니다.
    • 데이터 보존 기간에 도달하고 데이터가 제거되어 환경이 최대 용량 아래로 떨어집니다.

예제 3

수신일시 중지하도록 보존 동작이 구성된 환경을 고려합니다. 이 예제에서는 데이터 보존 기간 60일로 구성됩니다. 용량은 S1의 3개 단위로 설정되어 있습니다. 이 환경에는 매일 2GB의 데이터가 수신된다고 가정합니다. 이 환경에서는 최대 용량에 도달하면 입력이 일시 중지됩니다.

이 시점에서 시스템은 수신이 다시 시작되거나 계속 수신이 활성화될 때까지 동일한 데이터 세트를 표시합니다(이전 데이터를 정리하여 새로운 데이터를 위한 공간을 마련합니다).

인그레스가 다시 시작되면:

  • 이벤트 원본에서 받은 순서대로 데이터가 흐른다.
  • 이벤트 원본에 대한 보존 정책을 초과하지 않는 한 이벤트는 타임스탬프를 기반으로 인덱싱됩니다. 이벤트 소스 보존 구성에 대한 자세한 내용은 Event Hubs FAQ.

중요하다

수신이 일시 중지되지 않도록 도움을 주기 위해 경고를 설정해야 합니다. Azure 이벤트 원본의 기본 보존 기간은 1일이므로 데이터 손실이 발생할 수 있습니다. 따라서 수신이 일시 중지되면 추가 작업이 수행되지 않는 한 가장 최근의 데이터가 손실될 수 있습니다. 데이터 손실 가능성을 방지하려면 용량을 늘리거나 이전 데이터 제거하도록 동작을 전환해야 합니다.

영향을 받은 Event Hubs에서 Azure Time Series Insights에서 일시 중지 수신이 발생할 때 데이터 손실을 최소화하도록 메시지 보존 속성을 조정하는 것이 좋습니다.

이벤트 허브 메시지 보존

이벤트 원본(timeStampPropertyName)에 속성이 구성되지 않은 경우 Azure Time Series Insights는 기본적으로 이벤트 허브에 도착하는 타임스탬프를 X축으로 사용합니다. timeStampPropertyName가 다른 것으로 설정되면, 환경은 이벤트가 구문 분석될 때 데이터 패킷에서 설정된 timeStampPropertyName을 찾습니다.

Azure Time Series Insights 환경 크기를 조정하여 추가 용량을 수용하거나 보존 기간을 늘리도록 환경을 확장하는 방법을 읽어보기.

다음 단계