メトリクスリファレンス
Zilliz Cloud は、メトリクスを以下のレベルに整理しています。
-
組織レベルのメトリクス: 組織内のすべてのプロジェクトにわたるアカウント全体のステータス(例:ライセンスクレジット、使用量)を反映します。
-
Cluster-level metrics: 個々のクラスター内のリソース使用状況、パフォーマンス、データ を反映します。
-
Collection-level metrics: クラスターメトリクスのサブセットで、コレクションごとに内訳が表示され、個々のコレクションのパフォーマンス問題の特定や容量計画に役立ちます。
ほとんどのメトリクスはアラートをサポートしています。アラートは、時間ウィンドウ内で条件(演算子 + しきい値)に対してメトリクスを評価し、条件が満たされた場合に通知します。設定については、Manage 組織アラート および Manage プロジェクトアラート を参照してください。
組織レベルのメトリクス
組織レベルのメトリクス は、組織内のすべてのプロジェクトにわたるライセンス関連の問題を追跡するのに役立ちます。
Metric | Description | Recommended action |
|---|---|---|
License Validity (day) | 組織ライセンスの有効期限までの残り日数。 |
|
License Core Usage (%) | 使用されている CPU コア数の、ライセンスされた総コア数に対する割合。 |
|
Cluster and collection metrics
これらのメトリクスは、個々のクラスター内のリソース使用状況、パフォーマンス、データ を説明します。✦ が付いたメトリクスは、Dedicated および BYOC クラスターでコレクションレベルでも利用可能です。コレクションレベルのメトリクスには、コンソールのコレクション詳細ページから、Prometheus endpoint を経由して、または RESTful API を通じてアクセスできます。
このセクションでは、Availability はプロジェクトプランおよびデプロイメントオプションを指します。プランの詳細な比較については、Detailed Plan Comparison を参照してください。
Pod & container resources
Metric | Description | Availability | Recommended action |
|---|---|---|---|
CPU Usage (core) | Pod によって使用される CPU コア数。 | BYOC | 傾向を追跡し、持続的な増加またはスパイクを調査してください。 |
CPU Usage Rate for 制限 (%) | 制限 値に対する Pod の CPU 使用量の割合。 | BYOC | 上昇傾向がある場合は、ワークロードを最適化するか、制限 を増やしてください。 |
Memory Usage (MB) | Pod 内のコンテナのメモリ使用量(キャッシュを除く)。 | BYOC | 着実な増加またはリークの疑いを調査してください。 |
Memory Usage Rate for 制限 (%) | 制限 値に対する Pod のメモリ使用量の割合。 | BYOC | 一貫して高い場合は、メモリを最適化するか、制限 を引き上げてください。 |
ネットワーク Inbound Flow (Mbps) | Pod のネットワークインバウンドフロー。 | BYOC | 輻輳に注意し、帯域幅のサイジングを検証してください。 |
ネットワーク Outbound Flow (Mbps) | Pod のネットワークアウトバウンドフロー。 | BYOC | 輻輳に注意し、帯域幅のサイジングを検証してください。 |
リソース
Metric | Description | Availability | Recommended action |
|---|---|---|---|
Query CU計算 (%) | CU の総計算能力に対する、利用された計算能力の測定値。 | Dedicated / BYOC |
|
Query CU容量 % | CU の総容量に対する、使用された容量の測定値。 | Dedicated / BYOC |
|
Total Query CU (count) | 現在のクラスター内の総 Query CU 数。これは、クラスターの Query CU 数とレプリカ数の積として計算されます。(例:クラスターに 2 つの Query CU と 2 つのレプリカがある場合、ここに表示される Total Query CU は 4 です。) | Dedicated / BYOC | Query CU のスケーリングイベントを特定するために追跡してください。 |
Replica (count) | クラスターレプリカの数。 | Dedicated / BYOC | レプリカのスケーリングイベントを特定するために追跡してください。 |
Storage (GB) | データ とインデックスによって消費される永続ストレージの総量。 | All | ストレージ使用状況を監視するためにConfigure alerts してください。 |
パフォーマンス
Metric | Description | Availability | Recommended action |
|---|---|---|---|
QPS (Read) ✦ | 1 秒あたりの読み取りリクエスト(検索およびクエリ)の数。 | All | システムパフォーマンスの監視については、benchmark を参照してください。 |
QPS (Write) ✦ | 1 秒あたりの書き込みリクエスト(挿入、バルク挿入、アップサート、および削除)の数。 | All | システムパフォーマンスの監視については、benchmark を参照してください。 |
Search NQ per Second | 各検索リクエストが 1 秒間に運ぶクエリベクトルの数。 | All | システムパフォーマンスの監視については、benchmark を参照してください。 |
Write Throughput (Entities/sec) | すべての書き込み操作(挿入、アップサート、バルク挿入、および削除)において、1 秒間に書き込まれるエンティティ数を測定します。 | All | システムパフォーマンスの監視については、benchmark を参照してください。 |
Latency (Read) (ms) ✦ | クライアントがサーバーに読み取りリクエスト(検索およびクエリリクエスト)を送信してから、クライアントが応答を受信するまでの経過時間。平均レイテンシと P99 レイテンシが含まれます。 | All | - |
Latency (Write) (ms) ✦ | クライアントがサーバーに書き込みリクエスト(挿入およびアップサートリクエスト)を送信してから、クライアントが応答を受信するまでの経過時間。平均レイテンシと P99 レイテンシが含まれます。 | All | - |
Request Failure Rate (Read) (%) | 1 秒あたりの全リクエストにおける、失敗した読み取りリクエストの割合。 | All | 読み取りリクエストの失敗率を監視するためにConfigure alerts してください。 |
Request Failure Rate (Write) (%) | 1 秒あたりの全リクエストにおける、失敗した書き込みリクエストの割合。 | All | 書き込みリクエストの失敗率を監視するためにConfigure alerts してください。 |
Slow Query Count (counts/min) | 実行に通常よりも長い時間がかかるクエリの数。 デフォルトでは、レイテンシが 5 秒を超えるクエリは低速クエリとみなされます。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | 問題のあるクエリを特定し、必要に応じてクラスター構成を調整してパフォーマンスをチューニングしてください。 |
Cluster Write パフォーマンス Capacity (%) | クラスター書き込みパフォーマンス容量 = 現在の書き込み操作レート/書き込みレート制限。80% を超えた場合は、書き込み操作(挿入およびアップサート)のレートを減らすことを推奨します。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | 現在のレートが高すぎる場合(80% を超えることが推奨されます)、書き込みレートを下げることを推奨します。 |
Number of Flush 運用 (counts/min) | クラスター上のフラッシュ操作の数。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | フラッシュ操作を頻繁に行うと、クラスター全体のパフォーマンスに悪影響を与える可能性があります。詳細については、Zilliz Cloud 制限s を参照してください。 |
Cache Hit Rate (%) | クラスター内のすべてのクエリの平均キャッシュヒット率。計算式:クエリごとのキャッシュヒット率 = (スキャンされた総データ − スキャンされたコールドデータ) / スキャンされた総データ。 | Dedicated (Tiered-storage) / BYOC *このメトリクスは、Milvus 2.6.x と互換性のあるティアードストレージクラスターでのみ利用可能です。このメトリクスにアクセスするには、クラスターの Milvus バージョンをアップグレードするためcontact us してください。 | クラスターのクエリパフォーマンスを特定するために追跡してください。 |
データ
Metric | Description | Availability | Recommended action |
|---|---|---|---|
Collection Count | クラスター内に作成されたコレクションの数。 | All | 成長を監視し、必要に応じてプロジェクトごとの制限を適用してください。 |
エンティティ数 ✦ | 単一挿入とバルク挿入の両方を含む、クラスターに挿入されたエンティティの総数。 | All | 予期せぬ成長を調査し、ストレージとインデックスを計画してください。 |
ロードされたエンティティ (Approx.) ✦ | ロードされた(アクティブに提供されている)エンティティのおおよその数。 | Dedicated / BYOC | より正確でリアルタイムな値については、コレクション概要ページの「ロードされたエンティティ」値を参照するか、count(*) を使用してください。 |
Number of Unloaded Collections | クラスター内のアンロードされたコレクションの数。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | 重要なコレクションをロードし、メモリの余裕を確認してください。 |
その他
Metric | Description | Availability | Recommended action |
|---|---|---|---|
Cluster is 異常 | 対象クラスターのステータスが異常な場合。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | クラスターのステータスを調査し、それに応じて対策を講じてください。 |
CMEK is Unavailable | Zilliz Cloud に追加された KMS キーのいずれかが利用できなくなった場合。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | KMS キーを確認し、報告されたキーがまだ利用可能かどうかを判断してください。 |
Writes to Cluster Are Disabled | エラーまたは保護メカニズムにより、対象クラスターへの書き込みが無効になっている場合。 | Dedicated (Enterprise or ビジネスクリティカル) / BYOC | クラスターのステータス、最近の構成またはメンテナンス操作、および関連するアラートを確認し、根本原因を解決して書き込み機能を復元してください。 |