OpenDatasetBase 클래스

참조

상속할 데이터 세트 기본 클래스를 엽니다.

열린 데이터 세트를 생성합니다.

상속: PublicData

OpenDatasetBase

생성자

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

매개 변수

Name	Description
cols	list[str] 데이터 세트에서 로드할 열 이름 목록이며, 기본값은 없음입니다. Default value: None
enable_telemetry	bool 이 데이터 세트에서 원격 분석을 사용하도록 설정할지 여부, 기본값은 True입니다. Default value: True
kwargs 필수	dict 필터에 대한 인수

메서드

get_file_dataset	공개 데이터 세트에 대한 파일 데이터 세트를 가져옵니다.
get_tabular_dataset	Blob URL을 사용하여 AbstractTabularOpenDataset를 초기화합니다.
to_pandas_dataframe	pandas 데이터 프레임으로.
to_spark_dataframe	spark 데이터 프레임으로.

get_file_dataset

공개 데이터 세트에 대한 파일 데이터 세트를 가져옵니다.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

매개 변수

Name	Description
cls 필수	type 현재 클래스
start_date 필수	datetime 시작 날짜, 기본값은 None
end_date 필수	datetime 종료 날짜, 기본값은 None
enable_telemetry 필수	bool 원격 분석을 사용할지 여부, 기본값은 True

반환

형식	Description
FileDataset	파일 데이터 세트

get_tabular_dataset

Blob URL을 사용하여 AbstractTabularOpenDataset를 초기화합니다.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

매개 변수

Name	Description
cls 필수	type 공개 데이터 세트의 형식 이름입니다.
start_date 필수	datetime 포괄적으로 쿼리할 시작 날짜입니다.
end_date 필수	datetime 포괄적으로 쿼리할 종료 날짜입니다.
cols 필수	list[str] 검색할 열 이름 목록입니다. None은 모든 열을 가져옵니다.
enable_telemetry 필수	bool 원격 분석을 사용할지 여부로, UT에 대해서만 사용 안 함입니다.

반환

형식	Description
TabularDataset	TabularDataset

to_pandas_dataframe

pandas 데이터 프레임으로.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

spark 데이터 프레임으로.

to_spark_dataframe()

특성

cols

검색할 열 이름 목록을 가져옵니다.

data

OpenDataset 개체의 데이터를 가져옵니다.

id

공개 데이터의 위치 ID를 가져옵니다.

log_properties

로그 속성을 가져옵니다.

registry_id

백 엔드에 등록된 이 퍼블릭 데이터 세트의 레지스트리 ID를 가져옵니다.

이 레지스트리 ID는 스토리지 위치와 같은 최신 메타데이터를 가져오는 데 사용됩니다. 모든 퍼블릭 데이터 서브클래스가 _registry_id를 할당할 것으로 예상합니다.

반환

형식	Description
str	레지스트리 ID 문자열입니다.

time_column_name

시간 열 이름입니다.

다음을 통해 공유

OpenDatasetBase 클래스

생성자

매개 변수

메서드

get_file_dataset

매개 변수

반환

get_tabular_dataset

매개 변수

반환

to_pandas_dataframe

to_spark_dataframe

특성

cols

data

id

log_properties

registry_id

반환

time_column_name

피드백

추가 리소스