PublicHolidaysOffline 클래스
공휴일 오프라인 공용 데이터 세트를 나타냅니다.
행에 대한 설명은 Microsoft Azure Open Datasets 카탈로그의 공휴일을 참조하세요.
필터링 필드를 초기화합니다.
- 상속
-
PublicHolidaysOffline
생성자
PublicHolidaysOffline(country_or_region: str = 'US', start_date: datetime = datetime.datetime(1970, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2099, 1, 1, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)
매개 변수
Name | Description |
---|---|
country_or_region
|
데이터를 반환할 국가 또는 지역입니다. Default value: US
|
start_date
|
데이터 로드를 시작할 날짜(포함)입니다. None이면 Default value: 1970-01-01 00:00:00
|
end_date
|
데이터 로드를 종료할 날짜(포함)입니다. None이면 Default value: 2099-01-01 00:00:00
|
cols
|
데이터 집합에서 로드할 열 이름 목록입니다. None이면 모든 열이 로드됩니다. 이 데이터 세트에서 사용 가능한 열에 대한 자세한 내용은 공휴일을 참조하세요. Default value: None
|
enable_telemetry
|
이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부를 나타냅니다. Default value: True
|
country_or_region
필수
|
쿼리할 국가 또는 지역입니다. |
start_date
필수
|
포괄적으로 쿼리하려는 시작 날짜입니다. |
end_date
필수
|
포괄적으로 쿼리하려는 종료 날짜입니다. |
cols
필수
|
검색하려는 열 이름 목록입니다. None은 모든 열을 가져옵니다. |
enable_telemetry
필수
|
원격 분석을 보낼지 여부를 나타냅니다. |
설명
아래 예제는 데이터 세트에 액세스하는 방법을 보여 줍니다.
from azureml.opendatasets import PublicHolidaysOffline
from datetime import datetime
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidaysOffline(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
메서드
filter |
필터 시간입니다. |
get_holidays_dates |
휴일 날짜의 키를 사용하는 Dict를 가져옵니다. |
get_holidays_in_range |
지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다. |
get_holidays_in_range_by_country_or_region |
지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다. |
get_pandas_limit |
pandas 데이터 로드 제한 클래스의 인스턴스를 가져옵니다. |
is_holiday |
날짜가 휴일인지 여부를 검색합니다. |
is_holiday_by_country_or_region |
날짜가 휴일인지 여부를 검색합니다. |
filter
필터 시간입니다.
filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)
매개 변수
Name | Description |
---|---|
env
필수
|
런타임 환경입니다. |
min_date
필수
|
최소 날짜입니다. |
max_date
필수
|
최대 날짜입니다. |
반환
형식 | Description |
---|---|
필터링된 데이터 프레임입니다. |
get_holidays_dates
휴일 날짜의 키를 사용하는 Dict를 가져옵니다.
get_holidays_dates(country_code: str | None = None, country_or_region: str | None = None) -> Dict[datetime, None] | None
매개 변수
Name | Description |
---|---|
country_code
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: None
|
country_or_region
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: None
|
반환
형식 | Description |
---|---|
휴일 날짜를 키로, None을 값으로 사용하는 dict입니다. |
get_holidays_in_range
지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.
get_holidays_in_range(start_date: date, end_date: date, country_code: str = 'US') -> DataFrame
매개 변수
Name | Description |
---|---|
start_date
필수
|
날짜 범위의 시작 날짜입니다. |
end_date
필수
|
날짜 범위의 종료 날짜입니다. |
country_code
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: US
|
반환
형식 | Description |
---|---|
대상 날짜 범위의 휴일이 포함된 DataFrame입니다. |
get_holidays_in_range_by_country_or_region
지정된 날짜 범위에 기반한 휴일 정보 기반 목록을 가져옵니다.
get_holidays_in_range_by_country_or_region(start_date: date, end_date: date, country_or_region: str = 'United States') -> DataFrame
매개 변수
Name | Description |
---|---|
start_date
필수
|
날짜 범위의 시작 날짜입니다. |
end_date
필수
|
날짜 범위의 종료 날짜입니다. |
country_or_region
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: United States
|
반환
형식 | Description |
---|---|
대상 날짜 범위의 휴일이 포함된 DataFrame입니다. |
get_pandas_limit
pandas 데이터 로드 제한 클래스의 인스턴스를 가져옵니다.
get_pandas_limit()
is_holiday
날짜가 휴일인지 여부를 검색합니다.
is_holiday(target_date: date, country_code: str = 'US') -> bool
매개 변수
Name | Description |
---|---|
target_date
필수
|
확인해야 하는 날짜입니다. |
country_code
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: US
|
반환
형식 | Description |
---|---|
target_date가 휴일인지 여부를 나타냅니다. True 또는 False |
is_holiday_by_country_or_region
날짜가 휴일인지 여부를 검색합니다.
is_holiday_by_country_or_region(target_date: date, country_or_region: str = 'United States') -> bool
매개 변수
Name | Description |
---|---|
target_date
필수
|
확인해야 하는 날짜입니다. |
country_or_region
|
검사에 사용할 국가/지역의 휴일 정보를 나타냅니다. Default value: United States
|
반환
형식 | Description |
---|---|
target_date가 휴일인지 여부를 나타냅니다. True 또는 False |
특성
HOLIDAYS_DF
HOLIDAYS_DF = countryOrRegion ... isPaidTimeOff 0 Denmark ... None 1 Belgium ... None 2 Netherlands ... None 3 Croatia ... None 4 Czech ... None ... ... ... ... 344981 Croatia ... None 344982 Norway ... None 344983 Sweden ... None 344984 Sweden ... None 344985 Norway ... None [344986 rows x 5 columns]
data
data = None
default_country_or_region
default_country_or_region = 'US'
default_end_date
default_end_date = datetime.datetime(2099, 1, 1, 0, 0)
default_start_date
default_start_date = datetime.datetime(1970, 1, 1, 0, 0)