다음을 통해 공유


PublicHolidaysOffline 클래스

공휴일 오프라인 공용 데이터 세트를 나타냅니다.

행에 대한 설명은 Microsoft Azure Open Datasets 카탈로그의 공휴일을 참조하세요.

필터링 필드를 초기화합니다.

상속
PublicHolidaysOffline

생성자

PublicHolidaysOffline(country_or_region: str = 'US', start_date: datetime = datetime.datetime(1970, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2099, 1, 1, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

매개 변수

Name Description
country_or_region
str

데이터를 반환할 국가 또는 지역입니다.

Default value: US
start_date

데이터 로드를 시작할 날짜(포함)입니다. None이면 default_start_date가 사용됩니다.

Default value: 1970-01-01 00:00:00
end_date

데이터 로드를 종료할 날짜(포함)입니다. None이면 default_end_date가 사용됩니다.

Default value: 2099-01-01 00:00:00
cols

데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트에서 사용 가능한 열에 대한 자세한 내용은 공휴일을 참조하세요.

Default value: None
enable_telemetry

이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다.

Default value: True
country_or_region
필수
str

쿼리할 국가 또는 지역입니다.

start_date
필수

포괄적으로 쿼리하려는 시작 날짜입니다.

end_date
필수

포괄적으로 쿼리하려는 종료 날짜입니다.

cols
필수

검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다.

enable_telemetry
필수

원격 분석을 보낼지 여부를 나타냅니다.

설명

아래 예제는 데이터 세트에 액세스하는 방법을 보여 줍니다.


   from azureml.opendatasets import PublicHolidaysOffline
   from datetime import datetime
   from dateutil.relativedelta import relativedelta

   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidaysOffline(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

메서드

filter

필터 시간입니다.

get_holidays_dates

휴일 날짜의 키를 사용하는 Dict를 가져옵니다.

get_holidays_in_range

지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.

get_holidays_in_range_by_country_or_region

지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.

get_pandas_limit

pandas 데이터 로드 제한 클래스의 인스턴스를 가져옵니다.

is_holiday

날짜가 휴일인지 여부를 검색합니다.

is_holiday_by_country_or_region

날짜가 휴일인지 여부를 검색합니다.

filter

필터 시간입니다.

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

매개 변수

Name Description
env
필수

런타임 환경입니다.

min_date
필수

최소 날짜입니다.

max_date
필수

최대 날짜입니다.

반환

형식 Description

필터링된 데이터 프레임입니다.

get_holidays_dates

휴일 날짜의 키를 사용하는 Dict를 가져옵니다.

get_holidays_dates(country_code: str | None = None, country_or_region: str | None = None) -> Dict[datetime, None] | None

매개 변수

Name Description
country_code

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: None
country_or_region

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: None

반환

형식 Description

휴일 날짜를 키로, None을 값으로 사용하는 dict입니다.

get_holidays_in_range

지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.

get_holidays_in_range(start_date: date, end_date: date, country_code: str = 'US') -> DataFrame

매개 변수

Name Description
start_date
필수

날짜 범위의 시작 날짜입니다.

end_date
필수

날짜 범위의 종료 날짜입니다.

country_code

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: US

반환

형식 Description

대상 날짜 범위의 휴일이 포함된 DataFrame입니다.

get_holidays_in_range_by_country_or_region

지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.

get_holidays_in_range_by_country_or_region(start_date: date, end_date: date, country_or_region: str = 'United States') -> DataFrame

매개 변수

Name Description
start_date
필수

날짜 범위의 시작 날짜입니다.

end_date
필수

날짜 범위의 종료 날짜입니다.

country_or_region

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: United States

반환

형식 Description

대상 날짜 범위의 휴일이 포함된 DataFrame입니다.

get_pandas_limit

pandas 데이터 로드 제한 클래스의 인스턴스를 가져옵니다.

get_pandas_limit()

is_holiday

날짜가 휴일인지 여부를 검색합니다.

is_holiday(target_date: date, country_code: str = 'US') -> bool

매개 변수

Name Description
target_date
필수

확인해야 하는 날짜입니다.

country_code

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: US

반환

형식 Description

target_date가 휴일인지 여부를 나타냅니다. True 또는 False

is_holiday_by_country_or_region

날짜가 휴일인지 여부를 검색합니다.

is_holiday_by_country_or_region(target_date: date, country_or_region: str = 'United States') -> bool

매개 변수

Name Description
target_date
필수

확인해야 하는 날짜입니다.

country_or_region

검사에 사용할 국가/지역의 휴일 정보를 나타냅니다.

Default value: United States

반환

형식 Description

target_date가 휴일인지 여부를 나타냅니다. True 또는 False

특성

HOLIDAYS_DF

HOLIDAYS_DF = countryOrRegion  ... isPaidTimeOff 0              Denmark  ...          None 1              Belgium  ...          None 2          Netherlands  ...          None 3              Croatia  ...          None 4                Czech  ...          None ...                ...  ...           ... 344981         Croatia  ...          None 344982          Norway  ...          None 344983          Sweden  ...          None 344984          Sweden  ...          None 344985          Norway  ...          None  [344986 rows x 5 columns]

data

data = None

default_country_or_region

default_country_or_region = 'US'

default_end_date

default_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(1970, 1, 1, 0, 0)