メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

メトリクスリファレンス

Zilliz Cloud は、メトリクスを以下のレベルに整理しています。

  • 組織レベルのメトリクス: 組織内のすべてのプロジェクトにわたるアカウント全体のステータス(例:ライセンスクレジット、使用量)を反映します。

  • Cluster-level metrics: 個々のクラスター内のリソース使用状況、パフォーマンス、データ を反映します。

  • Collection-level metrics: クラスターメトリクスのサブセットで、コレクションごとに内訳が表示され、個々のコレクションのパフォーマンス問題の特定や容量計画に役立ちます。

📘Notes

ほとんどのメトリクスはアラートをサポートしています。アラートは、時間ウィンドウ内で条件(演算子 + しきい値)に対してメトリクスを評価し、条件が満たされた場合に通知します。設定については、Manage 組織アラート および Manage プロジェクトアラート を参照してください。

組織レベルのメトリクス

組織レベルのメトリクス は、組織内のすべてのプロジェクトにわたるライセンス関連の問題を追跡するのに役立ちます。

Metric

Description

Recommended action

License Validity (day)

組織ライセンスの有効期限までの残り日数。

  • < 60 days: 更新プロセスを開始してください。

  • Expired: 完全な機能(例:クラスターの作成/スケールアップ)を復元するために、直ちに更新/アップグレードしてください。

License Core Usage (%)

使用されている CPU コア数の、ライセンスされた総コア数に対する割合。

  • > 70%: 将来のニーズを評価し、更新/アップグレードを計画してください。

  • 100%: 中断を避けるために、直ちに更新/アップグレードしてください。

Cluster and collection metrics

これらのメトリクスは、個々のクラスター内のリソース使用状況、パフォーマンス、データ を説明します。 が付いたメトリクスは、Dedicated および BYOC クラスターでコレクションレベルでも利用可能です。コレクションレベルのメトリクスには、コンソールのコレクション詳細ページから、Prometheus endpoint を経由して、または RESTful API を通じてアクセスできます。

📘Notes

このセクションでは、Availability はプロジェクトプランおよびデプロイメントオプションを指します。プランの詳細な比較については、Detailed Plan Comparison を参照してください。

Pod & container resources

Metric

Description

Availability

Recommended action

CPU Usage (core)

Pod によって使用される CPU コア数。

BYOC

傾向を追跡し、持続的な増加またはスパイクを調査してください。

CPU Usage Rate for 制限 (%)

制限 値に対する Pod の CPU 使用量の割合。

BYOC

上昇傾向がある場合は、ワークロードを最適化するか、制限 を増やしてください。

Memory Usage (MB)

Pod 内のコンテナのメモリ使用量(キャッシュを除く)。

BYOC

着実な増加またはリークの疑いを調査してください。

Memory Usage Rate for 制限 (%)

制限 値に対する Pod のメモリ使用量の割合。

BYOC

一貫して高い場合は、メモリを最適化するか、制限 を引き上げてください。

ネットワーク Inbound Flow (Mbps)

Pod のネットワークインバウンドフロー。

BYOC

輻輳に注意し、帯域幅のサイジングを検証してください。

ネットワーク Outbound Flow (Mbps)

Pod のネットワークアウトバウンドフロー。

BYOC

輻輳に注意し、帯域幅のサイジングを検証してください。

リソース

Metric

Description

Availability

Recommended action

Query CU計算 (%)

CU の総計算能力に対する、利用された計算能力の測定値。

Dedicated / BYOC

60%: scale out replica することを推奨します

Query CU容量 %

CU の総容量に対する、使用された容量の測定値。

Dedicated / BYOC

80%: scale up query CU することを推奨します

Total Query CU (count)

現在のクラスター内の総 Query CU 数。これは、クラスターの Query CU 数とレプリカ数の積として計算されます。(例:クラスターに 2 つの Query CU と 2 つのレプリカがある場合、ここに表示される Total Query CU は 4 です。)

Dedicated / BYOC

Query CU のスケーリングイベントを特定するために追跡してください。

Replica (count)

クラスターレプリカの数。

Dedicated / BYOC

レプリカのスケーリングイベントを特定するために追跡してください。

Storage (GB)

データ とインデックスによって消費される永続ストレージの総量。

All

ストレージ使用状況を監視するためにConfigure alerts してください。

パフォーマンス

Metric

Description

Availability

Recommended action

QPS (Read) ✦

1 秒あたりの読み取りリクエスト(検索およびクエリ)の数。

All

システムパフォーマンスの監視については、benchmark を参照してください。

QPS (Write) ✦

1 秒あたりの書き込みリクエスト(挿入、バルク挿入、アップサート、および削除)の数。

All

システムパフォーマンスの監視については、benchmark を参照してください。

Search NQ per Second

各検索リクエストが 1 秒間に運ぶクエリベクトルの数。

All

システムパフォーマンスの監視については、benchmark を参照してください。

Write Throughput (Entities/sec)

すべての書き込み操作(挿入、アップサート、バルク挿入、および削除)において、1 秒間に書き込まれるエンティティ数を測定します。

All

システムパフォーマンスの監視については、benchmark を参照してください。

Latency (Read) (ms) ✦

クライアントがサーバーに読み取りリクエスト(検索およびクエリリクエスト)を送信してから、クライアントが応答を受信するまでの経過時間。平均レイテンシと P99 レイテンシが含まれます。

All

-

Latency (Write) (ms) ✦

クライアントがサーバーに書き込みリクエスト(挿入およびアップサートリクエスト)を送信してから、クライアントが応答を受信するまでの経過時間。平均レイテンシと P99 レイテンシが含まれます。

All

-

Request Failure Rate (Read) (%)

1 秒あたりの全リクエストにおける、失敗した読み取りリクエストの割合。

All

読み取りリクエストの失敗率を監視するためにConfigure alerts してください。

Request Failure Rate (Write) (%)

1 秒あたりの全リクエストにおける、失敗した書き込みリクエストの割合。

All

書き込みリクエストの失敗率を監視するためにConfigure alerts してください。

Slow Query Count (counts/min)

実行に通常よりも長い時間がかかるクエリの数。

デフォルトでは、レイテンシが 5 秒を超えるクエリは低速クエリとみなされます。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

問題のあるクエリを特定し、必要に応じてクラスター構成を調整してパフォーマンスをチューニングしてください。

Cluster Write パフォーマンス Capacity (%)

クラスター書き込みパフォーマンス容量 = 現在の書き込み操作レート/書き込みレート制限。80% を超えた場合は、書き込み操作(挿入およびアップサート)のレートを減らすことを推奨します。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

現在のレートが高すぎる場合(80% を超えることが推奨されます)、書き込みレートを下げることを推奨します。

Number of Flush 運用 (counts/min)

クラスター上のフラッシュ操作の数。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

フラッシュ操作を頻繁に行うと、クラスター全体のパフォーマンスに悪影響を与える可能性があります。詳細については、Zilliz Cloud 制限s を参照してください。

Cache Hit Rate (%)

クラスター内のすべてのクエリの平均キャッシュヒット率。計算式:クエリごとのキャッシュヒット率 = (スキャンされた総データ − スキャンされたコールドデータ) / スキャンされた総データ。

Dedicated (Tiered-storage) / BYOC

*このメトリクスは、Milvus 2.6.x と互換性のあるティアードストレージクラスターでのみ利用可能です。このメトリクスにアクセスするには、クラスターの Milvus バージョンをアップグレードするためcontact us してください。

クラスターのクエリパフォーマンスを特定するために追跡してください。

データ

Metric

Description

Availability

Recommended action

Collection Count

クラスター内に作成されたコレクションの数。

All

成長を監視し、必要に応じてプロジェクトごとの制限を適用してください。

エンティティ数 ✦

単一挿入とバルク挿入の両方を含む、クラスターに挿入されたエンティティの総数。

All

予期せぬ成長を調査し、ストレージとインデックスを計画してください。

ロードされたエンティティ (Approx.) ✦

ロードされた(アクティブに提供されている)エンティティのおおよその数。

Dedicated / BYOC

より正確でリアルタイムな値については、コレクション概要ページの「ロードされたエンティティ」値を参照するか、count(*) を使用してください。

Number of Unloaded Collections

クラスター内のアンロードされたコレクションの数。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

重要なコレクションをロードし、メモリの余裕を確認してください。

その他

Metric

Description

Availability

Recommended action

Cluster is 異常

対象クラスターのステータスが異常な場合。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

クラスターのステータスを調査し、それに応じて対策を講じてください。

CMEK is Unavailable

Zilliz Cloud に追加された KMS キーのいずれかが利用できなくなった場合。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

KMS キーを確認し、報告されたキーがまだ利用可能かどうかを判断してください。

Writes to Cluster Are Disabled

エラーまたは保護メカニズムにより、対象クラスターへの書き込みが無効になっている場合。

Dedicated (Enterprise or ビジネスクリティカル) / BYOC

クラスターのステータス、最近の構成またはメンテナンス操作、および関連するアラートを確認し、根本原因を解決して書き込み機能を復元してください。