レプリカの管理
Zilliz Cloudはクラスターレベルのレプリケーションをサポートしています。各レプリカはクラスターのリソースとデータの正確なコピーです。レプリカを使用すると、クエリスループットと可用性を向上させることができます。
QPSのボトルネックに直面している小規模データセットのユーザーの場合、レプリカを追加することでクエリワークロードを分散し、全体的なクエリスループットを向上させることができます。ただし、レプリカを追加してもクラスター容量は増加しません。容量は各クラスターのCUサイズによってのみ決定されます。クラスター容量を増加させたい場合は、Scale Clusterを参照してください。
このガイドでは、Zilliz Cloudでクラスターのレプリカを設定する手順を概説します。
制限事項
以下の条件が満たされている限り、既存のDedicatedクラスターのレプリカを設定できます:
-
クラスターが8CU以上であること
-
互換性のあるMilvusバージョンが2.4.13より低いクラスターの場合、クラスター内のすべてのコレクションを解放する必要があります
クラスターCUサイズ×レプリカ数の積が256を超えないようにしてください。
レプリカ設定の更新により、わずかなサービスのジャッターが発生する可能性があります。注意してください。
レプリカを手動で設定
既存のDedicatedクラスターのレプリカ数を、コンソール上で手動で調整するか、プログラムで調整できます。
ウェブコンソール経由
以下のデモでは、Zilliz Cloudウェブコンソールでレプリカを設定する方法を示しています。
クラスターレプリカのスケールダイアログボックスで保存をクリックすると、プロジェクトのリソースクォータを確認するように求められます。リソースが十分であれば、チェックが完了した後にダイアログボックスは消えます。そうでない場合は、以下が可能です。
プロジェクトリソース設定に移動をクリックしてプロジェクトのリソース設定を編集するか、または
最後のステップに戻るをクリックしてクラスタ設定を変更します。
プロセス中、ローリングには追加リソースが必要になります。これらのリソースは使用後に解放されます。
RESTful API経由
RESTful APIを使用してクラスター内のレプリカ数を手動で調整できます。
以下の例では、クラスターレプリカ数を手動で2に設定します。replicaパラメータの値は1から8の範囲の整数である必要があります。詳細は、Modify Cluster Replicaを参照してください。
export BASE_URL="https://api.cloud.zilliz.com"
export CLUSTER_ID="YOUR_CLUSTER_ID"
export TOKEN="YOUR_API_KEY"
curl --request POST \
--url "${BASE_URL}/v2/clusters/${CLUSTER_ID}/modifyReplica" \
--header "Authorization: Bearer ${TOKEN}" \
--header "Accept: application/json" \
--header "Content-type: application/json" \
--data-raw '{
"replica": "2"
}'
レプリカの自動スケーリング
現在、Zilliz Cloudウェブコンソールで事前定義された時間スケジュールに基づいてレプリカを自動スケーリングできます。
以下のデモでは、レプリカの自動スケーリングを有効にする方法を示しています。