StarWindでのHA構成のベストプラクティス その3: ネットワークの構築


ネットワークはSANの最も重要な部品の一つです。あなたのSANの正しいネットワークの帯域幅を決定することは、あなたのストレージがそれが展開される環境の要件を満たすために生産する必要があるIOPの適切な量を調査するのと同様に第1位のタスクです。

■1/10/40ギガビットの考慮事項
下記の計算は4キロバイトブロックサイズに関したIOPSを使用します。クライアントサーバが別の値のブロックサイズを使用している場合は、以下の式を用いて最終的なIOPSを計算することができます。

IOPS = (MBps Throughput / KB per IO) x 1024
MBps = (IOPS x KB per IO) / 1024

あなたが将来のSANために計算したIOPまたはMB/sの量にしたがって、ネットワークレベルでのボトルネックが発生しないであろう機器を選択する必要があります。例えば、クラスタが64K IOPSを消費した場合(これは4Kブロックで約250 MB/s)、その後の1Gbイーサネットはもはやオプションではありません。ネットワーク需要はIOPSの需要と共に成長し、〜333,000 IOPS(4Kブロックで1300MB/s)の後は、単一の10GbEのカードがボトルネックになります。以下はクライアントアプリケーションのIOPS要件に応じて推奨されるネットワーク機器のスループットを示す表です。

IOPS(4K) Network
1~26,000 1ギガビット
26,000~52,000 2×1ギガビット(MPIO)
52,000~282,000 10ギガビット
282,000~564,000 2×10ギガビット(MPIO)
564,000以上 40ギガビット

 

■ネットワークレイアウトの推奨事項
高可用性ソリューションの一般的な目的は、メンテナンスやアップグレードのためのダウンタイムなしで24/7の稼働時間です。これにより、高可用性がただサーバをクラスタ化するだけでは達成されないことを理解することが非常に重要です。それは常に冗長ハードウェア、特別なソフトウェア、正確にHAソリューションを作る構成のセットの組み合わせです。以下に、HAのためのネットワークの冗長構成を示すリファレンスアーキテクチャ図を見つけることができます。これらのネットワークのレイアウト構成はHA SAN設計のベストプラクティスと見なされます。

図1:2ノードのハイパーバイザクラスタは2ノードのStarWind HAクラスタに接続されています。直接接続は同期チャネルのために使用されています。

図2:2ノードのハイパーバイザクラスタは2ノードのStarWind HAクラスタに接続されています。スイッチおよびリンクは、フォールトトレランスのために使用されます。

注:スイッチの冗長性の推奨事項も同期チャネルに適用されます。スイッチが同期チャネルに使用される場合、それは冗長でなければいけません。上の図で示した構成は多くの場合、第1SANノードとクラスタノードのペアは第2SANノードとクラスタノードのペアと地理的に離れている状況で使用されます。

図3:2ノードのハイパーバイザクラスタは3ノードのStarWind HAクラスタに接続されています。

注:上記の図のすべてがSAN接続を示します。LAN接続、内部クラスタ通信、および補助接続は別のネットワーク装置を用いて構成されなければなりません。クラスタ内部のネットワーク構成のベストプラクティスは、あなたのハイパーバイザガイドラインとベストプラクティスに基づいて設定する必要があります。

・ケーブル接続の考慮事項
シールドケーブル(例えば、カテゴリ6a以降)は、ストレージ•エリア•ネットワーク内のすべてのネットワークリンクに使用されなければいけません。カテゴリ5eケーブルは、ネットワークリンクを外部の電磁干渉へ公開することができます。そのためSANでの使用は推奨されません。

・チーミングとマルチパスのベストプラクティス
複数のオンラインリソースならびにベンダーのiSCSIネットワークでNICチーミングの使用は、自分自身を正当化しない状態です。さらに、NICチーミングは、リンク応答時間、制限スループットを増やし、いくつかのケースでは接続損失を引き起こすように見えました。それはあなたのSAN内の任意のリンク上でチーミング使用することは推奨されていない理由です。代わりに、マルチパスは、ストレージ•エリア•ネットワークにおいて良好な結果を示しています。上に示した図(図1~3)に描かれたすべての接続は、マルチパスIOで構成されています。優先MPIOモードはラウンドロビンです。
それはあなたが接続に参加しているすべてのリンク間で均等に負荷を分散することができます。マルチパスは、サーバ間のネットワークリンクの増加に伴い均一な性能の成長を保証するものではありません。

■同期チャネルの推奨
同期チャネルは、HA構成で非常に重要な部分です。StarWindは、HAデバイスを指定しているすべての書き込み操作をミラーリングするためにそれを使用しています。同期リンクのスループットはHA SANクラスタに接続されたすべてのクライアントサーバのスループットと等しいか、高くなければならないというのが一般的な要件です。

図4:2ノードと3ノードのHA SANクラスタ内の適切な同期チャネルの帯域幅の測定

HA装置については、最大書き込み速度は、3つの要因によって制限されます。
1. SANサーバにインストールされたストレージアレイの速度
2. クライアントサーバからのマルチパスされたiSCSIリンクのラウンドロビンの総スループット
3. 同期チャネルのスループット

それは、3≥2が要求されます。実世界のシナリオでは(1)は(2)又は(3)より遅くてもまたは高速あっても良いですが、この時点で、ユーザはHAデバイスの性能は、上述した3つの要因の最小値によって制限されることを理解しなければいけません。

HA装置のIO応答時間は同期リンクの遅延に直接依存します。特定のハイパーバイザベンダーは共有ストレージの応答時間に非常に厳格な要件を持っています。推奨される応答時間制限を超えると、さまざまなアプリケーションや仮想マシンの問題につながります。さらに、特定の機能(たとえば、マイクロソフトのHyper-VのライブマイグレーションまたはVMware vSphereのHA)はHAデバイスの応答時間が推奨ガイドライン内にない場合に、失敗したり誤った動作をする可能性があります。

最大同期チャネルレイテンシ値は、以下が提供されています。
HA SANは異なる建物/データセンターに配置されています。 – 5ms
HA SANは一つの建物/データセンターに配置されています。 – 3ms

■ハートビートチャネルの推奨
ハートビートを使用すると、HAクラスタノードが同期させずに書き込みコマンドを受け入れ続けるときに、いわゆる”スプリットブレイン”シナリオを回避することが可能な技術です。同期チャネルに障害が発生した場合、StarWindは指定されたハートビートリンクを介してパートナーノードにpingを実行しようとします。パートナーノードが応答しない場合、システムはオフラインであるとみなします。この場合、残りのノード上のすべてのHAデバイスはディスクへの書き込みキャッシュをフラッシュし、ライトスルーキャッシュモードで動作を継続します。

ハートビートpingが成功した場合、StarWindは同期チャネルが再確立されるまで一つのノードをブロックします。HA SANクラスタ内のネットワークリンクの数を最小限にするために、ハートビートがiSCSIトラフィックと同じネットワークカード上で実行するように構成されています。同期チャネルが失敗した場合、ハートビートのみが活性化します。したがってパフォーマンスに影響を与えることはできません。

ハートビートは、通常のSANトラフィックと同じネットワークリンク上に位置するので、ストレージエリアネットワーク内の通常のリンクと同じ帯域幅と遅延要件を有しています。

HAデバイスの同期に使用されるものを除き、HA SANの間のすべてのリンクのハートビート機能を有効にすることをお勧めします。

■ベンチマークツール
HA SAN展開後に検出されたネットワーク性能の問題は大きな問題です。それは多くの場合保留しているSANインフラストラクチャ全体を置き換えることなく、問題の原因を突き止めて修正することはほぼ不可能です。したがって、SAN内のすべてのネットワークリンクは、SANを本番環境に展開する前に、最高のパフォーマンスで動作することをチェックする必要があります。ネットワークのベンチマークについての詳細な情報は、SANベンチマークガイドで見つけることができます。

関連トピックス