メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

クエリ CU のスケーリング

ワークロードが増加し、より多くのデータが書き込まれるにつれて、クラスターが容量制限に達する可能性があります。そのような場合、読み取り操作は引き続き機能しますが、新しい書き込み操作は失敗する可能性があります。

これを事前に管理するために、メトリクス ページでクエリ CU 容量を監視し、クエリ CU のスケーリングが必要な時期を判断できます。ビジネスニーズとパターンに基づいて、クエリ CU 数を増やしてクラスター容量を拡張したり、需要が減少した際にコスト削減のために減らしたりできます。

なお、1〜8 CU のクラスターでは、クエリ CU を直接スケーリングできます。8 CU を超えるクラスターの場合は、レプリカ を増やす必要があります。

このガイドでは、変化するワークロードに合わせてクラスターのサイズを変更する方法について説明します。

考慮事項

  • リソースの制限:

    • スケールアップ

      • Dedicated (Standard) クラスター: 最大 32 CU

        Dedicated (Enterprise) クラスター: 最大 1,024 CU

      • クエリ CU 数 × レプリカ数 の積は 1,024 を超えてはなりません

      より大きなクエリ CU については、営業担当者にお問い合わせください

    • スケールダウン

      • レプリカを持つクラスターは、8 CU 未満にスケールダウンできません

      • スケールダウンリクエストが成功するのは、以下の条件を満たす場合のみです:

  • スケーリング中: クラスターのステータスが「変更中」に変化し、その間は操作を実行できません。複数のスケーリングタスクがトリガーされた場合、トリガースタンプに基づいて順次処理されます。完了時間はデータ量に依存します。

  • パフォーマンスへの影響: スケーリングにより、わずかなサービスのジッターが発生する可能性があります。

  • バックアップの制限: 動的およびスケジュールされたスケーリング設定は、バックアップ に含まれません。クラスターを復元した後、これらの設定を手動で再構成してください。

手動スケーリング

Zilliz Cloud コンソールまたは RESTful API を使用して、クラスターを手動でスケールアップまたはスケールダウンできます。

以下のデモでは、Zilliz Cloud Web コンソール上でクラスターを手動でスケールアップおよびスケールダウンする方法を示します。

📘Notes

クエリノード CU のスケーリング ダイアログボックスで保存をクリックすると、プロジェクトのリソースクォータを確認するよう促されます。リソースが十分であれば、確認完了後にダイアログボックスが消えます。そうでない場合は、

  • プロジェクトのリソース設定へ移動をクリックしてプロジェクトのリソース設定を編集するか、

  • 前のステップに戻るをクリックしてクラスター設定を変更してください。

プロセス中に、ローリングのために追加のリソースが必要になります。これらのリソースは使用後に解放されます。

さらに、RESTful API を使用してクエリ CU を手動でスケーリングすることもできます。

以下の例では、既存のクラスターを 2 CU にスケーリングします。詳細については、クラスターの変更 を参照してください。

export TOKEN="YOUR_API_KEY"
export CLUSTER_ID="inxx-xxxxxxxxxxxxxxx"

curl --request POST \
--url "${BASE_URL}/v2/clusters/${CLUSTER_ID}/modify" \
--header "Authorization: Bearer ${TOKEN}" \
--header "Accept: application/json" \
--header "Content-Type: application/json" \
-d '{
"cuSize": 2
}'