出力ファイル形式の設定について
  • 07 Mar 2024
  • ダーク
    ライト
  • PDF

出力ファイル形式の設定について

  • ダーク
    ライト
  • PDF

Article Summary

概要

転送先ファイル・ストレージ系コネクタでは、転送設定のSTEP1にて出力ファイル形式を設定し、STEP2の出力オプションにて出力ファイルに対する詳細設定を行うことができます。
本ページでは、troccoが対応する出力ファイル形式とコネクタ、および出力オプションの各種設定項目について説明します。

出力ファイル形式

CSV/TSVに対応しています。
また、一部コネクタはJSON Linesにも対応しています。
コネクタと対応ファイル形式について、以下表を参照ください。

ファイル・ストレージ系コネクタCSV/TSVJSON Lines
転送先 - Amazon S3
転送先 - Azure Blob Storage
転送先 - Box-
転送先 - FTP・FTPS
転送先 - Google Cloud Storage
転送先 - Google Drive-
転送先 - SFTP

出力オプション設定項目

転送設定編集STEP2「出力オプション」の設定項目一覧です。
なお、出力ファイル形式によって、設定項目は異なります。

CSV/TSV

Embulkのcsv-formatter-pluginを使用しています。

項目名デフォルト値説明
区切り文字,CSVのデータの区切り文字を選択します。
改行文字CRLF改行に関するルールをCRCRLFLFの中から選択します。
フィールド内の改行文字LFフィールド内の改行に関するルールをCRCRLFLFの中から選択します。
文字エンコーディングUTF-8文字エンコーディングの方式を設定します。
クオート付与方法MINIMALクオートのルールを以下から選択できます。
  • ALL(すべてのフィールドをクオート)
  • MINIMAL(必要な場合のみクオート、フィールド内にデリミタ等がある場合のみ)
  • NONE(クオートをしない)
  • エスケープ文字\エスケープ文字を設定します。
    ヘッダー有効にする有効にするを選択すると、ヘッダー行も転送されます。
    ヘッダー行が不要な場合は、無効にするを選択してください。
    NULLを置換する文字列設定しないNULLを置換する文字列を設定できます。
    設定するを選択すると、置換後の文字列を入力できます。
    デフォルトのタイムゾーンUTC時刻出力時のタイムゾーンを設定します。
    この設定はカラム設定のタイムゾーンで上書きされます。
    カラム設定%Y-%m-%d %H:%M:%S.%6N %zタイムスタンプ型のカラム列に対して、カラム名を指定し、日付フォーマットとタイムゾーンを設定できます。
    左記のデフォルト値は、日付フォーマットのデフォルト値です。

    JSON Lines

    embulk-formatter-jsonlを使用しています。
    設定項目の詳細については、Confirmationを参照ください。

    項目名デフォルト値説明
    文字エンコーディングUTF-8文字エンコーディングの方式を以下から選択します。
  • UTF-8
  • UTF-16LE
  • UTF-32BE
  • UTF-32LE
  • 改行文字LF改行文字のルールを以下から選択します。
  • CRLF
  • LF
  • CR
  • NUL
  • NO
  • 日付のフォーマット-日付フォーマットを設定できます。
    タイムゾーン-タイムゾーンを設定できます。
    このオプションを使う場合、日付のフォーマットも設定してください。

    この記事は役に立ちましたか?