クエリ CU のスケーリング
ワークロードが増加し、より多くのデータが書き込まれるにつれて、クラスターが容量制限に達する可能性があります。そのような場合、読み取り操作は引き続き機能しますが、新しい書き込み操作は失敗する可能性があります。
これを事前に管理するために、メトリクス ページでクエリ CU 容量を監視し、クエリ CU のスケーリングが必要な時期を判断できます。ビジネスニーズとパターンに基づいて、クエリ CU 数を増やしてクラスター容量を拡張したり、需要が減少した際にコスト削減のために減らしたりできます。
なお、1〜8 CU のクラスターでは、クエリ CU を直接スケーリングできます。8 CU を超えるクラスターの場合は、レプリカ を増やす必要があります。
このガイドでは、変化するワークロードに合わせてクラスターのサイズを変更する方法について説明します。
考慮事項
-
リソースの制限:
-
スケールアップ
-
Dedicated (Standard) クラスター: 最大 32 CU
Dedicated (Enterprise) クラスター: 最大 1,024 CU
-
クエリ CU 数 × レプリカ数 の積は 1,024 を超えてはなりません
より大きなクエリ CU については、営業担当者にお問い合わせください。
-
-
スケールダウン
-
レプリカを持つクラスターは、8 CU 未満にスケールダウンできません
-
スケールダウンリクエストが成功するのは、以下の条件を満たす場合のみです:
-
現在のデータ量が、新しい CU サイズの CU 容量の 80% 未満であること。
-
現在のコレクションおよびパーティション数が、新しい CU サイズで許可される コレクションおよびパーティションの最大数 未満であること。
-
-
-
-
スケーリング中: クラスターのステータスが「変更中」に変化し、その間は操作を実行できません。複数のスケーリングタスクがトリガーされた場合、トリガースタンプに基づいて順次処理されます。完了時間はデータ量に依存します。
-
パフォーマンスへの影響: スケーリングにより、わずかなサービスのジッターが発生する可能性があります。
-
バックアップの制限: 動的およびスケジュールされたスケーリング設定は、バックアップ に含まれません。クラスターを復元した後、これらの設定を手動で再構成してください。
手動スケーリング
Zilliz Cloud コンソールまたは RESTful API を使用して、クラスターを手動でスケールアップまたはスケールダウンできます。
以下のデモでは、Zilliz Cloud Web コンソール上でクラスターを手動でスケールアップおよびスケールダウンする方法を示します。
クエリノード CU のスケーリング ダイアログボックスで保存をクリックすると、プロジェクトのリソースクォータを確認するよう促されます。リソースが十分であれば、確認完了後にダイアログボックスが消えます。そうでない場合は、
プロジェクトのリソース設定へ移動をクリックしてプロジェクトのリソース設定を編集するか、
前のステップに戻るをクリックしてクラスター設定を変更してください。
プロセス中に、ローリングのために追加のリソースが必要になります。これらのリソースは使用後に解放されます。
さらに、RESTful API を使用してクエリ CU を手動でスケーリングすることもできます。
以下の例では、既存のクラスターを 2 CU にスケーリングします。詳細については、クラスターの変更 を参照してください。
export TOKEN="YOUR_API_KEY"
export CLUSTER_ID="inxx-xxxxxxxxxxxxxxx"
curl --request POST \
--url "${BASE_URL}/v2/clusters/${CLUSTER_ID}/modify" \
--header "Authorization: Bearer ${TOKEN}" \
--header "Accept: application/json" \
--header "Content-Type: application/json" \
-d '{
"cuSize": 2
}'