다음을 통해 공유


PublicHolidays 클래스

공휴일 공용 데이터 세트를 나타냅니다.

이 데이터 세트에는 PyPI 휴일 패키지 및 Wikipedia에서 가져온 1970년부터 2099년까지 38개 국가 및 지역에 대한 전 세계 공휴일 데이터가 포함됩니다. 각 행은 특정 날짜, 국가 또는 지역 및 대부분의 사람이 유급 휴가를 사용하는지 여부에 대한 휴일 정보를 나타냅니다. 열 설명, 데이터 세트에 액세스하는 다양한 방법, 예제를 비롯한 이 데이터 세트에 대한 자세한 내용은 Microsoft Azure Open Datasets 카탈로그의 공휴일을 참조하세요.

필터링 필드를 초기화합니다.

상속
PublicHolidays

생성자

PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

매개 변수

Name Description
country_or_region
필수
str

데이터를 반환할 국가 또는 지역입니다.

start_date

데이터 로드를 시작할 날짜(포함)입니다. None이면 default_start_date가 사용됩니다.

Default value: 2008-01-01 00:00:00
end_date

데이터 로드를 종료할 날짜(포함)입니다. None이면 default_end_date가 사용됩니다.

Default value: 2024-12-13 00:00:00
cols

데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트에서 사용 가능한 열에 대한 자세한 내용은 공휴일을 참조하세요.

Default value: None
enable_telemetry

이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다.

Default value: True
country_or_region
필수
str

쿼리할 국가 또는 지역입니다.

start_date
필수

포괄적으로 쿼리하려는 시작 날짜입니다.

end_date
필수

포괄적으로 쿼리하려는 종료 날짜입니다.

cols
필수

검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다.

enable_telemetry
필수

원격 분석을 보낼지 여부를 나타냅니다.

설명

아래 예제는 데이터 세트에 액세스하는 방법을 보여 줍니다.


   from azureml.opendatasets import PublicHolidays
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidays(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

메서드

filter

필터 시간입니다.

filter

필터 시간입니다.

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

매개 변수

Name Description
env
필수

런타임 환경입니다.

min_date
필수

최소 날짜입니다.

max_date
필수

최대 날짜입니다.

반환

형식 Description

필터링된 데이터 프레임입니다.

특성

country_or_region_column_name

country_or_region_column_name = 'countryOrRegion'

countrycode_column_name

countrycode_column_name = 'countryRegionCode'

default_end_date

default_end_date = datetime.datetime(2024, 12, 13, 0, 0)

default_max_end_date

default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2008, 1, 1, 0, 0)