Consistent hash

データのIDをハッシュ関数 h で変換 a1: h("a1") => 64 a2: h("a2") => 115 a3: h("a3") => 75 a4: h("a4") => 8 a5: h("a5") => 100 a6: h("a6") => 90 a7: h("a7") => 45 a8: h("a8") => 15

リング状に配置

データの割り当て先ノードは以下の順に決定データIDのハッシュ値と同じノードデータIDより大きいハッシュ値を持つノードのなかで、ハッシュ値が最小のノードハッシュ値が最小のノード

ノードの追加と削除

ノードの追加

n4のデータの一部がn5へ移動

ノードの削除

n1のデータがn3へ移動

移動するデータ数の平均値データ数/ノード数

仮想ノード

仮想ノードなしでは、負荷分散が不完全

偏ったリングデータが特定のノードに偏り負荷分散にならない

ノードがダウン落ちたノードの全データが一つ先のノードへ移動一つ先のノードの負荷が2倍特定のノードに負荷が集中

ノードを追加 1つ先のノードからデータが移動 1つ先のノードの負荷しか減らない負荷対策にならない

そこで仮想ノード

n1: h("n1"+0) => 25 n1: h("n1"+1) => 100 n1: h("n1"+2) => 90 n2: h("n2"+0) => 120 n2: h("n2"+1) => 45 n2: h("n2"+2) => 13 ... ハッシュ関数 h でノードID+αを変換

リング状に配置ノード数が増えれば均等に分散する確率が高くなる

ノード4が追加された場合複数のノードから均等にデータが移動してくる可能性が高い

ノード1がダウンした場合ノード1のデータが複数のノードへ均等に分散することが期待できる

メリット・デメリット

メリットデータの割り当て先を自動で決定可能データをクラスタに均等に分散できるノードが落ちた時、自動で再割り当て再割り当てのコストが小さい

デメリット全てのノードが現在のクラスタの状態を正確に知ってなければならない。クラスタ状態の共有コストがかかる

まとめ

コンシステントハッシュを用いるとプロセスが1つ2つ程度落ちても問題のないクラスタを構成できる負荷分散についてエンジニアが手を動かす必要がない大規模な分散環境でも運用が楽 (かもしれない)

Change Language

Consistent hash

More Related Content

What's hot

Similar to Consistent hash

Consistent hash