転送先 - Azure Synapse Analytics
    • PDF

    転送先 - Azure Synapse Analytics

    • PDF

    記事の要約

    概要

    Azure Synapse Analyticsへデータを転送する設定のヘルプページです。

    制約

    • 特になし

    設定項目

    STEP1 基本設定

    項目名必須デフォルト値内容
    Azure Synapse Analytics接続情報Yes-あらかじめ登録してあるAzure Synapse Analyticsの接続情報から、今回の転送設定に必要な権限を持つものを選択します。
    データベースYes-転送先のデータベース名を選択します。
    スキーマYes-転送先のスキーマ名を選択します。
    テーブルYes-転送先のテーブル名を選択します。
    対象テーブルが転送先のデータベース・スキーマ内に存在しない場合は、自動的に作成されます。
    転送モードYes追記(INSERT)転送モードを選択します。
    詳しくは、後述の転送モードについてを参照ください。
    マージキーNo-転送モードUPSERT (MERGE)を選択したときに入力できます。
    プライマリーキーが転送先のテーブルに存在しない場合、マージキー(主キー)扱いとする、カラムの名前を入力してください。
    マージキーには、値の重複がなく、NULL値も持たないカラムを入力してください。
    テーブル構造Yesヒープ (HEAP)テーブル構造を選択します。
    詳しくは、後述のテーブル構造についてを参照ください。
    インデックス キー列Yes-テーブル構造クラスター化列ストア インデックス (CLUSTERED COLUMNSTORE INDEX)を選択したときに入力します。
    インデックスのキー列名の入力および順序を指定してください。
    テーブル分散Yesラウンド ロビン分散 (ROUND_ROBIN)テーブル分散を選択します。
    詳しくは、後述のテーブル分散についてを参照ください。
    ディストリビューション列Yes-テーブル分散ハッシュ分散 (HASH)を選択したときに入力します。
    ハッシュキーとなるディストリビューション列名を指定してください。

    転送モードについて

    転送モード内容
    追記(INSERT)まず一時テーブルを作成し、データを転送します。
    すべての一時テーブルの作成が完了したら、対象テーブルにデータを挿入します。
    追記(INSERT DIRECT)対象テーブルに直接行を挿入します。
    転送が途中で失敗した場合、対象テーブルにデータが一部挿入されている可能性があります。
    全件洗い替え (TRUNCATE INSERT)まず一時テーブルを作成し、一時テーブルにデータを転送します。
    すべての一時テーブルの作成が完了したら、対象テーブルの中身を削除し、そのあとに対象テーブルにデータを挿入します。
    全件洗い替え (REPLACE)まず一時テーブルを作成し、データを転送します。
    一時テーブルの作成が完了したら、対象テーブルを削除し、一時テーブルを対象名に変更します。
    転送が途中で失敗した場合、対象テーブルが削除される可能性があります
    UPSERT (MERGE)まず一時テーブルを作成し、データを転送します。
    すべての一時テーブルの作成が完了したら、以下の処理を行います。
    対象テーブルに対して、一時テーブルのマージキーと値が一致する行は更新され、一致しない行は挿入されます。

    テーブル構造について

    テーブル構造について、詳しくはAzure Synapse Analytics公式ドキュメント - テーブル構造オプションを参照ください。

    テーブル構造内容
    ヒープ (HEAP)テーブルをヒープとして格納します。
    クラスター化列ストア インデックス (CLUSTERED COLUMNSTORE INDEX)テーブルをクラスター化列ストア インデックスとして格納します。
    クラスター化インデックス (CLUSTERED INDEX)テーブルを1つまたは複数のキー列を含むクラスター化インデックスとして格納します。

    テーブル分散について

    テーブル分散について、詳しくはAzure Synapse Analytics公式ドキュメント - テーブル分散オプションを参照してください。

    テーブル分散内容
    ハッシュ分散 (HASH)最大8列のハッシュ値に基づいて行を分散させます。
    ラウンド ロビン分散 (ROUND_ROBIN)行をラウンドロビン方式ですべてのディストリビューションに均等に分散させます。
    レプリケート (REPLICATE)テーブルの1つのコピーを各コンピューティングノードに格納します。

    STEP1 詳細設定

    項目名デフォルト値内容
    最大リトライ回数12最大のリトライ回数を指定します。
    リトライ待ち時間 (ミリ秒)1000リトライ時の待ち時間を指定します。
    リトライ待ち時間の最大値 (ミリ秒)1800000リトライ時の待ち時間の最大値を指定します。
    バッチサイズ (MB)16バッチサイズを指定します。
    デフォルトのタイムゾーン-デフォルトのタイムゾーンを指定します。
    接続タイムアウト (秒)300ドライバが接続するまでのタイムアウトを秒単位で指定します。
    0を指定した場合、ドライバーのデフォルト値である30秒が採用されます。
    ソケットタイムアウト (秒)1800クエリを実行するまでのタイムアウトを秒単位で指定します。
    0を指定した場合、タイムアウトなしとなります。

    この記事は役に立ちましたか?