입력 파일 형식 설정에 대하여
    • PDF

    입력 파일 형식 설정에 대하여

    • PDF

    기사 요약

    개요

    전송원 파일 및 저장소 계열 커넥터에서는 전송 설정의 STEP1에서 입력 파일 형식을 설정하고, STEP2의 입력 옵션에서 입력 파일에 대한 세부 설정을 할 수 있습니다.
    이 페이지에서는 TROCCO가 지원하는 입력 파일 형식과 커넥터, 그리고 입력 옵션의 각종 설정 항목에 대해 설명합니다.

    입력 파일 형식

    전송 설정 편집의 STEP1에서 다음 중에서 선택할 수 있습니다.
    * CSV/TSV
    * JSON Lines
    * JSONPath
    * LTSV
    * Microsoft Excel (xlsx 또는 xls 파일)
    * XML(베타 버전)

    XML 파일 전송에 대해

    XML 파일 형식 전송 기능은 베타 버전으로 제공되고 있습니다.
    정식 버전 출시 시에는 사양이 변경될 수 있습니다.

    본 기사의 대상 커넥터

    설정 항목

    입력 파일 형식에 따라 설정 항목이 달라집니다.

    CSV/TSV

    Embulk의 csv-parser-plugin을 사용하고 있습니다.

    STEP2 입력 옵션

    품목명기본값설명
    구분 기호, , , , , .CSV 데이터의 구분 문자를 설정합니다.
    따옴표"따옴표를 설정할 수 있습니다.
    이스케이프 문자\이스케이프 문자를 설정할 수 있습니다.
    NULL로 대체되는 문자열설정하지 않음NULL로 대체할 문자열을 설정할 수 있습니다.
    설정하기를 선택하면 대체할 문자열을 입력할 수 있습니다.
    건너뛸 헤더 줄 수0몇 번째 줄까지 건너뛸지 설정합니다.
    예를 들어, 첫 번째 행이 항목명이고 항목명 행을 전송 데이터에 포함하지 않으려면 1을 설정합니다.
    따옴표가 없는 경우 값에서 공백 제거하기아니요따옴표가 없는 경우 값에서 공백을 제거할지 여부를 설정할 수 있습니다.
    불규칙한 쿼트 처리 방식ACCEPT_ONLY_RFC4180_ESCAPED따옴표가 있는 필드에 불규칙한 따옴표가 존재할 경우 처리 방법을 설정합니다.
    자세한 내용은 csv-parser-plugin의quotes_in_quoted_fields를 참고하세요.
    코멘트 라인 마커----------------------------------------------------------------------------------------------.여기서 설정한 문자가 줄의 시작 부분에 있으면 해당 줄을 건너뜁니다.
    컬럼 수가 줄어든 행 처리부정한 기록으로 처리하기잘못된 레코드로 처리하기를 선택하면 컬럼 수가 부족한 레코드가 존재할 때 해당 행의 처리를 건너뜁니다.
    누락된 컬럼을 NULL로 보완 하기를 선택하면 컬럼 수가 부족한 레코드가 존재할 때 NULL 값을 보완하여 처리를 계속합니다.
    컬럼 수가 늘어난 행 처리부정한 기록으로 처리하기잘못된 레코드로 처리하기를 선택하면 컬럼 수가 초과된 레코드가 존재할 때 해당 행의 처리를 건너뜁니다.
    컬럼 무시 처리를 선택한 경우, 컬럼 수가 초과된 레코드가 존재할 때 넘친 컬럼을 무시하고 처리를 계속 진행합니다.
    따옴표로 묶을 수 있는 최대 데이터 양131072따옴표로 묶을 수 있는 최대 데이터 양(byte 단위)을 설정합니다.
    여기서 설정한 값보다 큰 데이터 양이 존재하는 경우, 해당 행의 처리를 건너뜁니다.
    부정한 레코드가 존재할 경우 전송 중단 여부전송 중단하기전송 중단을 선택하면 잘못된 레코드가 존재할 때 전송을 중단합니다.
    처리 계속을 선택하면 잘못된 레코드가 존재할 때 NULL 값을 보완하여 처리를 계속합니다.
    기본 시간대UTC불러온 데이터 자체에 타임존에 대한 정보가 없는 경우 타임스탬프형 열에서 사용할 타임존을 설정할 수 있습니다.
    날짜 초기화1970-01-01날짜 열에서 날짜를 인식하지 못할 경우 기본값을 설정할 수 있습니다.
    줄바꿈CRLF줄바꿈에 대한 규칙을 CRLF, LF, CR 중에서 설정합니다.
    문자 인코딩----------------------------------------------------------------------------------------------.문자 인코딩 방식을 설정할 수 있습니다.
    미입력 시 자동 데이터 설정 시 자동으로 추측됩니다.

    JSON Lines

    emulk-parser-jsonl을 사용하고 있습니다.

    STEP2 입력 옵션

    품목명기본값설명
    부정한 레코드가 존재할 경우 전송 중단 여부전송 중단하기전송 중단을 선택하면 잘못된 레코드가 존재할 때 전송을 중단합니다.
    처리 계속을 선택하면 잘못된 레코드가 존재할 때 NULL 값을 보완하여 처리를 계속합니다.
    기본 시간대UTC불러온 데이터 자체에 타임존에 대한 정보가 없는 경우 타임스탬프형 열에서 사용할 타임존을 설정할 수 있습니다.
    줄바꿈CRLF줄바꿈에 대한 규칙을 CRLF, LF, CR 중에서 설정할 수 있습니다.
    문자 인코딩----------------------------------------------------------------------------------------------.문자 인코딩 방식을 설정할 수 있습니다.
    미입력 시 자동 데이터 설정 시 자동으로 추측됩니다.

    JSONPath

    emulk-parser-jsonpath를 사용하고 있습니다.

    STEP1 기본 설정

    품목명기본값설명
    JSONPath----------------------------------------------------------------------------------------------.JSONPath 작성 방법은 Operators를 참고하세요.
    전체 지정 시 $. *로 지정해 주십시오.

    STEP2 입력 옵션

    품목명기본값설명
    경로----------------------------------------------------------------------------------------------.STEP1 기본 설정의 'JSONPath'와 동일한 설정입니다.
    기본 시간대UTC불러온 데이터 자체에 타임존에 대한 정보가 없는 경우 타임스탬프형 열에서 사용할 타임존을 설정할 수 있습니다.

    LTSV

    STEP2 입력 옵션

    품목명기본값설명
    줄바꿈CRLF줄바꿈에 대한 규칙을 CRLF, LF, CR 중에서 설정할 수 있습니다.
    문자 인코딩----------------------------------------------------------------------------------------------.문자 인코딩 방식을 설정할 수 있습니다.
    미입력 시 자동 데이터 설정 시 자동으로 추측됩니다.

    Microsoft Excel

    emulk-parser-poi_excel을 사용하고 있습니다.

    STEP1 기본 설정

    품목명기본값설명
    시트명----------------------------------------------------------------------------------------------.전송할 시트 이름을 입력합니다.
    건너뛸 헤더 줄 수1몇 번째 줄까지 건너뛸지 설정합니다.
    예를 들어, 첫 번째 행이 항목명이고 항목명 행을 전송 데이터에 포함하지 않으려면 1을 설정합니다.
    컬럼 설정----------------------------------------------------------------------------------------------.컬럼 이름, 컬럼 타입, 컬럼 값의 취득 방법을 설정합니다.
    값을 구하는 방법에 대해,
    • 현금 사용을 선택한 경우
      • 엑셀 파일이 로컬에 저장된 시점의 계산 결과를 이용하기 때문에 전송 처리 속도가 빨라집니다.
    • 전송 시 재계산을 선택한 경우
      • 전송 시 셀 내 수식을 다시 계산합니다.
    날짜 및 시간 열의 시간대Asia/Tokyo타임스탬프형 열에서 사용할 시간대를 설정할 수 있습니다.
    계산 결과가 매번 다른 함수

    컬럼 설정 값 가져오기 방법에서 캐시 활용을 선택하면 엑셀 파일이 로컬에 저장된 시점의 값을 이용하여 전송을 수행합니다.
    따라서 날짜/시간 함수(예: TODAY 함수)나 난수 생성 함수(예: RAND 함수)와 같이 매번 계산 결과가 달라지는 함수는 전송 실행 시 재계산되지 않습니다. 주의하시기 바랍니다.

    전송 실행 시 셀 내 수식을 다시 계산해야 하는 경우 전송 시 재 계산을 선택합니다.

    XML(베타)

    emulk-parser-xml을 사용하고 있습니다.

    STEP1 기본 설정

    품목명기본값설명
    경로 경로(XPath 형식)----------------------------------------------------------------------------------------------.Xpath 탐색의 기준이 되는 노드로의 경로 경로를 입력합니다.
    XML 파일 내의 모든 노드를 탐색 대상으로 지정하려면 /를 입력합니다.
    컬럼 설정----------------------------------------------------------------------------------------------.검색하고자 하는 노드의 경로를 Xpath 형식으로 입력합니다.
    XPath의 표기법은 XPath Syntax를 참고하세요.
    컬럼 타입은 아래에서 선택할 수 있습니다.
  • string
  • long
  • 타임스탬프
  • double
  • boolean
  • json
  • timestamp를 선택한 경우, 형식과 시간대도 입력해야 합니다.
    XML 네임스페이스에 대해

    XML 네임스페이스에서 정의한 접두사와 결합된 경로를 지정할 수 없습니다.


    이 문서가 도움이 되었습니까?