데이터 마트 - Azure Synapse Analytics
    • PDF

    데이터 마트 - Azure Synapse Analytics

    • PDF

    기사 요약

    개요

    Azure Synapse Analytics를 이용한 데이터 마트 정의 설정 도움말 페이지입니다.

    설정 항목

    STEP1 기본 설정

    품목명필수기본값내용
    Azure Synapse Analytics 연결 정보----------------------------------------------------------------------------------------------.미리 등록되어 있는 Azure Synapse Analytics의 연결 정보 중 이번 데이터 마트 정의에 필요한 권한을 가진 것을 선택합니다.
    사용자 지정 변수No----------------------------------------------------------------------------------------------.여기서 설정한 사용자 정의 변수를 데이터베이스 이름, 쿼리, 스키마 이름, 테이블 이름에 사용할 수 있습니다.
    데이터베이스----------------------------------------------------------------------------------------------.처리에 사용할 데이터베이스 이름을 지정합니다.

    쿼리 설정

    품목명필수기본값내용
    쿼리 실행 모드데이터 전송 모드아래 두 가지 모드 중에서 선택할 수 있습니다.
    데이터 전송 모드
     SQL과 출력 대상 테이블을 지정하기만 하면 쉽게 테이블에 대한 교체 및 추가를 실행할 수 있습니다.
    자유 기술 모드
     연결 대상 DWH에 대해 임의의 쿼리(DDL, DELETE, INSERT 등)를 자유롭게 실행할 수 있다.
    쿼리----------------------------------------------------------------------------------------------.Azure Synapse Analytics에서 전송 데이터를 가져오기 위한 SQL을 입력합니다.
    사용자 정의 변수를 이용하여 TROCCO 데이터 전송 시 동적으로 설정값을 결정하는 것도 가능하다.

    또한, 아래 설정은 쿼리 실행 모드가 데이터 전송 모드인 경우에만 지정할 수 있다.

    데이터 출력처 설정

    품목명필수기본값내용
    출력 대상 스키마----------------------------------------------------------------------------------------------.데이터 출력 대상 스키마 이름을 지정합니다.
    존재하는 스키마를 지정해 주세요.
    출력 대상 테이블----------------------------------------------------------------------------------------------.데이터 출력 대상 테이블 이름을 지정합니다.
    테이블이 존재하지 않는 경우 전송 시 새로 생성됩니다.
    출력 대상 테이블의 테이블 구조(HEAP)테이블 구조를 선택합니다.
    자세한 내용은 후술할 테이블 구조에 대한 내용을 참고하세요.
    출력 대상 테이블의 인덱스 키 열----------------------------------------------------------------------------------------------.테이블 구조에서 클러스터화 컬럼 스토어 인덱스(CLUSTERED COLUMNSTORE INDEX) 를 선택했을 때 입력한다.
    인덱스의 키 열 이름 입력 및 순서를 지정합니다.
    출력 대상 테이블의 테이블 분산라운드 로빈 분산 (ROUND_ROBIN)테이블 분산을 선택합니다.
    자세한 내용은 후술할 테이블 분산에 대해 참고하세요.
    출력 대상 테이블의 분포 열----------------------------------------------------------------------------------------------.테이블 분산에서 해시 분산(HASH) 을 선택했을 때 입력합니다.
    해시키가 될 배포 열 이름을 지정해 주세요.
    출력 대상 테이블 쓰기 설정----------------------------------------------------------------------------------------------.아래 쓰기 방법 중 하나를 선택합니다.
    • 추기
      • 기존 테이블의 레코드 뒤에 쿼리 실행 결과가 추가됩니다.
    • 전건 교체
      • 기존 테이블의 레코드가 삭제되고 쿼리 실행 결과로 대체됩니다.
    이미 Azure Synapse Analytics에 테이블이 존재하는 경우

    이미 Azure Synapse Analytics에 존재하는 테이블에 대해 추가를 할 경우, TROCCO 측의 아래 설정은 반영되지 않고 기존 테이블 측의 설정이 유지됩니다.

    • 출력 대상 테이블의 테이블 구조
    • 출력 대상 테이블의 테이블 분산

    테이블 구조에 대하여

    테이블 구조에 대한 자세한 내용은 Azure Synapse Analytics 공식 문서 - 테이블 구조 옵션에서 확인할 수 있습니다.

    테이블 구조내용
    (HEAP)테이블을 힙으로 저장합니다.
    클러스터화된 컬럼스토어 인덱스 (CLUSTERED COLUMNSTORE INDEX)테이블을 클러스터링된 열 저장소 인덱스로 저장합니다.
    클러스터링 인덱스 (CLUSTERED INDEX)테이블을 하나 이상의 키 열을 포함하는 클러스터링된 인덱스로 저장합니다.

    테이블 분산에 대하여

    테이블 분산에 대한 자세한 내용은 Azure Synapse Analytics 공식 문서 - 테이블 분산 옵션에서 확인할 수 있습니다.

    테이블 분산내용
    해시 분산 (HASH)최대 8열의 해시값을 기준으로 행을 분산시킵니다.
    라운드 로빈 분산 (ROUND_ROBIN)라운드 로빈 방식으로 행을 모든 배포에 균등하게 분배합니다.
    리플리케이트 (REPLICATE)각 컴퓨팅 노드에 테이블의 사본 1개를 저장한다.

    작업 시작 설정

    품목명필수기본값내용
    작업의 병렬 실행병렬로 작업을 실행하지 않음작업 실행 시점에 동일한 데이터마트 정의에 따른 다른 작업이 실행 중인 경우 작업 실행 여부를 선택합니다.
  • 병렬로 작업을 실행하지 않음: 작업은 실행되지 않고 건너뜁니다.
  • 병렬 작업 실행 허용: 작업이 실행됩니다.

  • 이 문서가 도움이 되었습니까?