HDInsight Hadoop 클러스터에 Hue 설치 및 사용
HDInsight 클러스터에서 Hue를 설치하고 터널링을 사용하여 Hue로 요청을 라우팅하는 방법을 알아봅니다.
참고 항목
Hue는 HDInsight 4.0 이상에서 지원되지 않습니다.
Hue 정의
Hue는 Apache Hadoop 클러스터와 상호 작용하는 데 사용되는 웹 애플리케이션 세트입니다. Hue를 사용하여 Hadoop 클러스터(HDInsight 클러스터의 경우, WASB)와 연결된 스토리지를 찾아보고 Hive 작업 및 Pig 스크립트 등을 실행할 수 있습니다. HDInsight Hadoop 클러스터에서 Hue 설치는 다음 구성 요소를 지원합니다.
- Beeswax Hive 편집기
- Apache Pig
- 메타스토어 관리자
- Apache Oozie
- FileBrowser (WASB 기본 컨테이너로 전달)
- 작업 브라우저
Warning
HDInsight 클러스터와 함께 제공된 구성 요소는 완전히 지원되며 Microsoft 지원에서 이러한 구성 요소와 관련된 문제를 해결하는 데 도움을 드릴 것입니다.
사용자 지정 구성 요소는 문제 해결에 도움이 되는 합리적인 지원을 받습니다. 지원을 통해 문제를 해결하거나 해당 기술에 대한 전문 지식이 있는, 오픈 소스 기술에 대해 사용 가능한 채널에 참여하도록 요구할 수 있습니다. 예를 들어 HDInsight에 대한 Microsoft Q&A 질문 페이지, https://stackoverflow.com 같은 여러 커뮤니티 사이트를 사용할 수 있습니다. Apache 프로젝트는 https://apache.org에 프로젝트 사이트가 있습니다(예: Hadoop).
스크립트 동작을 사용하여 Hue 설치
아래 표의 정보를 사용하여 스크립트 작업을 수행합니다. 스크립트 작업 사용에 대한 자세한 지침은 스크립트 작업으로 HDInsight 클러스터 사용자 지정을 참조하세요.
참고 항목
HDInsight 클러스터에 Hue를 설치하려면 권장 헤드 노드 크기는 A4(8개 코어, 14GB 메모리) 이상입니다.
속성 | 값 |
---|---|
스크립트 유형: | - 사용자 지정 |
이름 | Hue 설치 |
Bash 스크립트 URI | https://hdiconfigactions.blob.core.windows.net/linuxhueconfigactionv02/install-hue-uber-v02.sh |
노드 유형: | Head |
HIVE 쿼리 실행
Hue 포털에서 쿼리 편집기를 선택한 다음 Hive를 선택하여 Hive 편집기를 엽니다.
지원 탭의 데이터베이스에서 hivesampletable이 표시되어야 합니다. HDInsight에서 모든 Hadoop 클러스터로 제공되는 예제 테이블입니다. 스크린 캡처에 표시된 것처럼 오른쪽 창에서 예제 쿼리를 입력하면 결과 탭에서 출력이 표시됩니다.
차트 탭을 사용하여 결과를 시각적으로 표시할 수 있습니다.
클러스터 스토리지 찾아보기
Hue 포털에서 메뉴 모음의 오른쪽 위에 있는 파일 브라우저를 선택합니다.
기본적으로 /user/myuser 디렉터리에서 파일 브라우저를 엽니다. 경로에서 사용자 디렉터리 바로 앞 슬래시를 선택하여 클러스터와 연결된 Azure Storage 컨테이너의 루트로 이동합니다.
파일 또는 폴더를 마우스 오른쪽 단추로 클릭하여 사용 가능한 작업을 참조하세요. 오른쪽 모서리에서 업로드 단추를 사용하여 현재 디렉터리에 파일을 업로드합니다. 새로 만들기 단추를 사용하여 새 파일 또는 디렉터리를 만듭니다.
참고 항목
Hue 파일 브라우저는 HDInsight 클러스터와 연결된 기본 컨테이너의 콘텐츠만을 표시할 수 있습니다. 클러스터와 연결된 모든 추가 스토리지 계정/컨테이너는 파일 브라우저를 사용하여 액세스할 수 없습니다. 그러나 클러스터와 관련된 추가 컨테이너는 항상 Hive 작업에 액세스할 수 있습니다. 예를 들어 하이브 편집기에 명령 dfs -ls wasbs://newcontainer@mystore.blob.core.windows.net
을 입력하는 경우 추가 컨테이너의 내용도 볼 수 있습니다. 이 명령에서 newcontainer 는 클러스터와 연결된 기본 컨테이너가 아닙니다.
중요 사항
Hue를 설치하는 데 사용한 스크립트는 클러스터의 기본 헤드 노드에만 설치합니다.
설치하는 동안 구성을 업데이트하기 위해 여러 Hadoop 서비스(HDFS, YARN, MR2, Oozie)를 다시 시작합니다. 스크립트가 Hue의 설치를 완료한 후에 다른 Hadoop 서비스를 시작하려면 시간이 걸릴 수 있습니다. 처음에 Hue의 성능이 달라질 수 있습니다. 모든 서비스를 시작하면 Hue는 완벽하게 작동합니다.
Hue는 Hive의 현재 기본값인 Apache Tez 작업을 인식하지 못합니다. MapReduce를 Hive 실행 엔진으로 사용하려는 경우 스크립트를 업데이트하여 스크립트에서 다음 명령을 사용합니다.
set hive.execution.engine=mr;
Linux 클러스터의 경우 보조 헤드 노드에서 Resource Manager를 실행하는 반면 기본 헤드 노드에서 서비스를 실행하는 시나리오가 있을 수 있습니다. Hue를 사용하여 클러스터에서 실행 중인 작업의 세부 정보를 보려면 이러한 시나리오에 오류가 발생할 수 있습니다. 그러나 작업이 완료되었을 때 작업 세부 정보를 볼 수 있습니다.
이는 알려진 문제 때문입니다. 해결 방법으로 Ambari를 수정하여 활성 Resource Manager가 기본 헤드 노드에서 실행되도록 합니다.
wasbs://
을 사용하여 HDInsight 클러스터가 Azure Storage를 사용하는 동안 Hue는 WebHDFS를 이해합니다. 따라서 스크립트 동작에 사용할 사용자 지정 스크립트는 WASB와 통신을 위한 WebHDFS와 호환 가능한 서비스인 WebWasb를 설치합니다. 따라서 Hue 포털이 HDFS가 제대로 있다고 하더라도( 파일 브라우저로 마우스를 이동할 때처럼) WASB로 해석되어야 합니다.