出力ファイル形式の設定について

Prev Next

概要

転送先ファイル・ストレージ系コネクタでは、転送設定のSTEP1にて出力ファイル形式を設定し、STEP2の出力オプションにて出力ファイルに対する詳細設定を行うことができます。
本ページでは、TROCCOが対応する出力ファイル形式とコネクタ、および出力オプションの各種設定項目について説明します。

出力ファイル形式

CSV/TSVに対応しています。
また、一部コネクタはJSON Linesにも対応しています。
コネクタと対応ファイル形式について、以下表を参照ください。

ファイル・ストレージ系コネクタ CSV/TSV JSON Lines
転送先 - Amazon S3
転送先 - Azure Blob Storage
転送先 - Box -
転送先 - FTP・FTPS
転送先 - Google Cloud Storage
転送先 - Google Drive -
転送先 - KARTE Datahub
転送先 - SFTP

出力オプション設定項目

転送設定編集STEP2「出力オプション」の設定項目一覧です。
なお、出力ファイル形式によって、設定項目は異なります。

CSV/TSV

Embulkのcsv-formatter-pluginを使用しています。

項目名 デフォルト値 説明
区切り文字 , CSVのデータの区切り文字を選択します。
改行文字 CRLF 改行に関するルールをCRCRLFLFの中から選択します。
フィールド内の改行文字 LF フィールド内の改行に関するルールをCRCRLFLFの中から選択します。
文字エンコーディング UTF-8 文字エンコーディングの方式を設定します。
クオート付与方法 MINIMAL クオートのルールを以下から選択できます。
  • ALL(すべてのフィールドをクオート)
  • MINIMAL(必要な場合のみクオート、フィールド内にデリミタ等がある場合のみ)
  • NONE(クオートをしない)
エスケープ文字 \ エスケープ文字を設定します。
ヘッダー 有効にする 有効にするを選択すると、ヘッダー行も転送されます。
ヘッダー行が不要な場合は、無効にするを選択してください。
NULLを置換する文字列 設定しない NULLを置換する文字列を設定できます。
設定するを選択すると、置換後の文字列を入力できます。
デフォルトのタイムゾーン UTC 時刻出力時のタイムゾーンを設定します。
この設定はカラム設定のタイムゾーンで上書きされます。
カラム設定 %Y-%m-%d %H:%M:%S.%6N %z タイムスタンプ型のカラム列に対して、カラム名を指定し、日付フォーマットとタイムゾーンを設定できます。
左記のデフォルト値は、日付フォーマットのデフォルト値です。

JSON Lines

embulk-formatter-jsonlを使用しています。
設定項目の詳細については、Confirmationを参照ください。

項目名 デフォルト値 説明
文字エンコーディング UTF-8 文字エンコーディングの方式を以下から選択します。
  • UTF-8
  • UTF-16LE
  • UTF-32BE
  • UTF-32LE
改行文字 LF 改行文字のルールを以下から選択します。
  • CRLF
  • LF
  • CR
  • NUL
  • NO
日付のフォーマット - 日付フォーマットを設定できます。
タイムゾーン - タイムゾーンを設定できます。
このオプションを使う場合、日付のフォーマットも設定してください。