Amazon Redshiftに対してOracle、AS/400、SQL Server、MySQLなどからデータをリアルタイムにレプリケーション[DBMoto]


Amazon Web Service(AWS)の RedshiftはPostgreSQLベースのデータウェアハウスであり、最低料金は 2 TB データウェアハウスの XL ノード 1 つで 1 時間あたり US$0.85という低価格です。DBMotoでは、PostgreSQLをターゲット(レプリケーション先)としてサポートしており、このRedshiftに対してリアルタイムに各DBのデータをロード(レプリケーション)することができます。これにより既存環境を並列して使用した状態でRedshiftに移行することも可能です。
図 システムCのみ先行してRedshiftに移行し、他のデータはDBMotoを使用してロード

実際にDBMotoのターゲットDBとして指定する方法ですが、まずAWSのコンソールのRedshiftのConfigurationタブからエンドポイント等の情報を取得します。

また、このときにDBMotoサーバがRedshiftへアクセスできるようにするため、Security GroupのCIDR/IP等も設定しておきます。

取得した情報をDBMotoのターゲット接続に設定します。接続設定は基本的にPostgreSQLの場合と同様です。
DBMotoからPostgreSQLへ接続するには・・・Npgsqlと外部接続の設定

※2014/12/22追記
現在のNpgsql最新版2.3にはRedshiftに接続ができない不具合がございます。
バージョン2.0.14.3のNpgsqlをダウンロードし、そちらをご利用いただきますよう、お願いいたします。

https://github.com/npgsql/npgsql/releases/tag/v2.0.14.3

ターゲットの接続ウィザードでServerにエンドポイント名、User、Password、Databaseにデータベース名を入力します。このときPostgreのポート番号はデフォルトで5432ですが、Redshiftのデフォルトは5439であるため、Portの項目も変更する必要があります。

これで登録は完了です。ターゲットDBとして各種DBからデータをレプリケーションできます。

関連したトピックス

1 Response to Amazon Redshiftに対してOracle、AS/400、SQL Server、MySQLなどからデータをリアルタイムにレプリケーション[DBMoto]

  1. mktg@climb のコメント:

    Amazon Redshiftに接続しビッグデータを活用、そして自社Webへチャート/レポート/ダッシュボードで展開するEspressReport ES等のEspressシリーズ:
    http://www.climb.co.jp/blog_espress/archives/1169

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください