- 인쇄
- PDF
Tableau 연동
- 인쇄
- PDF
Tableau는 빠르고 쉬운 데이터 시각화를 지원하여 현재 많이 사용되는 BI 솔루션 중 하나입니다.
이 가이드는 네이버 클라우드 플랫폼의 Cloud Hadoop과 Tableau를 연동하는 방법을 소개합니다.
Tableau에 대한 자세한 내용은 Tableau 공식 홈페이지를 참조해 주십시오.
사전작업
- Cloud Hadoop 클러스터를 생성해 주십시오.
- Cloud Hadoop 클러스터 생성에 관한 자세한 내용은 Cloud Hadoop 시작 가이드를 참고해 주십시오.
- Object Storage를 생성해 주십시오.
- Object Storage 생성에 관한 자세한 내용은 Object Storage 개요를 참고해 주십시오.
- Windows 서버를 생성해 주십시오.
- Windows 서버 생성에 관한 자세한 내용은 Server 시작을 참고해 주십시오.
Cloud Hadoop과 Windows 서버는 같은 VPC 내에 생성하는 것을 권장합니다.
- ACG를 설정해 주십시오.
- Cloud Hadoop ACG 접근 소스에 Window 서버 IP를 입력하고, 허용 포트에는 8286 포트를 추가해 주십시오.
- Cloud Hadoop ACG 접근 소스에 Window 서버 IP를 입력하고, 허용 포트에는 8286 포트를 추가해 주십시오.
Hive에서 Table 생성
Object Storage에 샘플 데이터 파일을 업로드해 주십시오.
- 여기에서 샘플 데이터를 다운로드한 후 압축을 해제하고 Object Storage > Bucket Management 에
AllstarFull.csv
파일을 업로드해 주십시오.
- 여기에서 샘플 데이터를 다운로드한 후 압축을 해제하고 Object Storage > Bucket Management 에
Hue Hive 편집기에서 Table을 생성해 주십시오.
DROP table allstarfull;
CREATE external TABLE if not EXISTS `allstarfull` (
`playerID` VARCHAR(20),
`yearID` INT,
`gameNum` INT,
`gameID` VARCHAR(30),
`teamID` VARCHAR(4),
`lgID` VARCHAR(4),
`GP` INT,
`startingPos` INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
- 간단한 쿼리를 이용해서 테이블이 제대로 생성되었는지 확인해 주십시오.
SELECT * FROM allstarfull;
Presto Connector 추가
- Presto > [CONFIGS] > Advanced connectors.properties 에서 connector를 추가해 주십시오.
- Hive Connector를 추가해야 하므로 connectors.to.add에 다음과 같이 입력해 주십시오.
{"hive":["connector.name=hive-hadoop2",
"hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
"hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
"hive.s3.use-instance-credentials=false",
"hive.s3.aws-access-key=<API-ACCESS-KEY>",
"hive.s3.aws-secret-key=<API-SECRET-KEY>",
"hive.s3.endpoint=https://kr.object.private.fin-ncloudstorage.com"]
}
<METASTORE-HOST-IP>
는 마스터 노드(m-001)의 Private IP 주소입니다. Ambari > Hosts 메뉴에서 확인할 수 있습니다.
- 변경된 구성을 적용하기 위해 재시작이 필요합니다. 우측 상단의 [ACTIONS] > Restart All 을 클릭한 후, 팝업창의 [CONFIRM RESTART ALL] 버튼을 클릭해 주십시오.
Tableau 설치
아래 과정들은 모두 Windows 서버에서 진행됩니다.
- Tableau 홈페이지에서 Tableau Desktop을 다운로드해 주십시오.
- Presto 홈페이지에서 Presto JDBC 드라이버(presto-jdbc-0.268.jar)를 다운로드해 주십시오.
- Tableau가 설치된 경로의 Drivers 디렉터리에 Presto JDBC 드라이버를 옮겨 주십시오.
Tableau는 Presto 뿐만 아니라 스프레드시트부터 데이터베이스 등 다양한 데이터를 탐색할 수 있습니다. 지원되는 커넥터는 Tableau Desktop 및 웹 작성 도움말에서 확인할 수 있습니다.
nginx-ssl.crt 인증서 설치
Cloud Hadoop edge 노드에서 /etc/nginx/ssl/nginx-ssl.crt 인증서를 Window 서버로 가져오십시오.
- 엣지 노드에 접속하는 방법은 클러스터 노드에 SSH 접속하기 가이드를 참고해 주십시오.
- 엣지 노드에 접속하는 방법은 클러스터 노드에 SSH 접속하기 가이드를 참고해 주십시오.
nginx-ssl.crt 인증서를 더블 클릭한 뒤, [인증서 설치] 버튼을 클릭해 주십시오.
'로컬 컴퓨터'를 선택한 뒤, [다음] 버튼을 클릭해 주십시오.
'모든 인증서를 다음 저장소에 저장'을 선택 후 인증서 저장소를 선택해 주십시오.
- 인증서 저장소는 '신뢰할 수 있는 루트 인증 기관' 으로 설정합니다.
- 인증서 저장소는 '신뢰할 수 있는 루트 인증 기관' 으로 설정합니다.
[마침] 버튼을 클릭하여 인증서 설치를 완료해 주십시오.
Tableau Desktop에서 Presto 접속
Tableau Desktop 을 실행 후 서버에 연결 > 자세히 > Presto 를 선택해 주십시오.
접속 정보를 입력한 뒤 [로그인] 버튼을 클릭해 주십시오.
접속 정보
- 서버 : Presto 클러스터의 도메인
- 포트 : Presto Coordinator의 포트(8286)
- 카탈로그 : 사용할 카탈로그의 이름
- 스키마 : 사용할 스키마의 이름
- 사용자 이름 : 사용할 유저의 이름
- SSL 필요 : 체크
테이블 및 레코드 확인
포함을 클릭하고 검색하여 해당 스키마의 테이블을 확인해 주십시오.
[지금 업데이트] 버튼을 클릭하여 테이블 안의 데이터들을 불러와 주십시오.
새 시트를 만들어서 드래그 앤 드롭만으로 간단히 시각화할 수 있습니다.
Tableau 사용에 대한 더 자세한 내용은 Tableau 공식 홈페이지를 참고해 주십시오.