OpenDatasetBase 클래스
상속할 데이터 세트 기본 클래스를 엽니다.
열린 데이터 세트를 생성합니다.
- 상속
-
OpenDatasetBase
생성자
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
매개 변수
Name | Description |
---|---|
cols
|
데이터 세트에서 로드할 열 이름 목록이며, 기본값은 없음입니다. Default value: None
|
enable_telemetry
|
이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부, 기본값은 True입니다. Default value: True
|
kwargs
필수
|
필터에 대한 인수 |
메서드
get_file_dataset |
공개 데이터 세트에 대한 파일 데이터 세트를 가져옵니다. |
get_tabular_dataset |
Blob URL을 사용하여 AbstractTabularOpenDataset를 초기화합니다. |
to_pandas_dataframe |
pandas 데이터 프레임으로. |
to_spark_dataframe |
spark 데이터 프레임으로. |
get_file_dataset
공개 데이터 세트에 대한 파일 데이터 세트를 가져옵니다.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
매개 변수
Name | Description |
---|---|
cls
필수
|
현재 클래스 |
start_date
필수
|
시작 날짜, 기본값은 None |
end_date
필수
|
종료 날짜, 기본값은 None |
enable_telemetry
필수
|
원격 분석을 사용할지 여부, 기본값은 True |
반환
형식 | Description |
---|---|
파일 데이터 세트 |
get_tabular_dataset
Blob URL을 사용하여 AbstractTabularOpenDataset를 초기화합니다.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
매개 변수
Name | Description |
---|---|
cls
필수
|
공개 데이터 세트의 형식 이름입니다. |
start_date
필수
|
포괄적으로 쿼리할 시작 날짜입니다. |
end_date
필수
|
포괄적으로 쿼리할 종료 날짜입니다. |
cols
필수
|
검색할 열 이름 목록입니다. None은 모든 열을 가져옵니다. |
enable_telemetry
필수
|
원격 분석을 사용할지 여부로, UT에 대해서만 사용 안 함입니다. |
반환
형식 | Description |
---|---|
TabularDataset |
to_pandas_dataframe
pandas 데이터 프레임으로.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
spark 데이터 프레임으로.
to_spark_dataframe()
특성
cols
검색할 열 이름 목록을 가져옵니다.
data
OpenDataset 개체의 데이터를 가져옵니다.
id
공개 데이터의 위치 ID를 가져옵니다.
log_properties
로그 속성을 가져옵니다.
registry_id
백 엔드에 등록된 이 퍼블릭 데이터 세트의 레지스트리 ID를 가져옵니다.
이 레지스트리 ID는 스토리지 위치와 같은 최신 메타데이터를 가져오는 데 사용됩니다. 모든 퍼블릭 데이터 서브클래스가 _registry_id를 할당할 것으로 예상합니다.
반환
형식 | Description |
---|---|
레지스트리 ID 문자열입니다. |
time_column_name
시간 열 이름입니다.