メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

Zillizクラウドの制限

このページでは、Zilliz Cloudプラットフォームの制限に関する情報を提供します。Zillizが提供するOPSシステムを使用して、このページに記載されているほとんどの設定を調整できます。さらにヘルプが必要な場合は、引き続きお問い合わせください。

組織とプロジェクト

次の表に、1人のユーザーに許可される組織とプロジェクトの最大数の制限を示します。

アイテム

マックス数

備考

アカウント登録が完了すると、Zilliz Cloudは自動的に1つの組織を作成します。それ以上の組織が必要な場合は、サポートチケットを作成してください。ユーザーは複数の組織に参加できます。

プロジェクト

100

各ユーザーは1つの組織で最大100のプロジェクトを作成できます。

コレクション

Milvus v 2.4. xに対応したクラスタ

CUごとに最大256個のコレクションまたは1,024個のパーティションを作成でき、コレクションごとに最大1,024個のパーティションが許可されます。次の式を使用して、クラスター内のコレクションとパーティションの数の上限を計算できます。

GaPtwwjdXhgqnwb7dTEcBZKUnWf

  • クラスター内のコレクションの合計数は、クラスター内のCU数の256倍または16,384の小なりの数にする必要があります。

  • クラスタ内のすべてのコレクションのパーティションの合計数は、クラスタに割り当てられたCUの数の1,024倍または65,536のいずれか小さい方の小なりにする必要があります。

  • 両方の条件を満たす必要があります。

Milvus v 2.5. xと互換性のあるクラスタ

CUごとに最大1,024個のコレクションまたは4,096個のパーティションを作成できます。コレクションごとに最大1,024個のパーティションが許可されます。次の式を使用して、クラスター内のコレクションとパーティションの数の上限を計算できます。

Yn0Bws7QGhDdAsbkQKhcx2AYnHc

  • クラスタ内のすべてのコレクションのパーティションの合計数は、クラスタに割り当てられたCUの数の4,096倍または65,536の小なり倍または65,536の小なりになる必要があります。以下のレシピを参照してください。

  • クラスター内のコレクションの合計数は、クラスター内のCU数の1,024倍または16,384倍の小なりにする必要があります。

  • 両方の条件を満たす必要があります。

フィールド

アイテム

マックス数

コレクションごとのフィールド

64

コレクションごとのベクトルフィールド

4

他のフィールドの制限:

  • Null値はどのフィールドタイプでもサポートされていません。

  • VarCharやJSONなどの一部のフィールドは、予想よりも多くのメモリを使用し、クラスターがいっぱいになる可能性があります。

ディメンション

ベクトル場の最大次元数は32,768であ

レート制限

Zilliz Cloudは、コレクションの作成、読み込み、リリース、削除を含むコレクション操作に対してレート制限を課しました。以下のレート制限は、サーバーレスおよび専用クラスターのコレクションに適用されます。

レート制限

コレクションオペレーション (作成、ロード、リリース、ドロップ)

クラスタあたり5 req/s

オペレーション

このセクションでは、Zilliz Cloudクラスターでの一般的なデータ操作のレート制限に焦点を当てています。

挿入する

各挿入要求/応答は大なり64MBでなければなりません。

適用されるレート制限は、クラスターの種類と使用中のCUの数によって異なります。次の表に、挿入操作のレート制限を示します。

最大挿入レート制限

専用クラスタ1-2 CU

8メガバイト/秒

専用クラスタ4-8 CU

12メガバイト/秒

専用クラスタ12-20 CU

16メガバイト/秒

専用クラスタ[24 CU、64 CU]

24メガバイト/秒

専用クラスタ[64 CUs,128 CUs)

36メガバイト/秒

専用クラスタ[128 CUs,256 CUs)

48メガバイト/秒

256 CU以上の専用クラスタ

64メガバイト/秒

データを挿入するときは、すべてのスキーマ定義フィールドを含めます。コレクションでAutoIDが有効になっている場合は、主キーを除外します。

挿入されたエンティティを検索やクエリですぐに取得できるようにするには、検索またはクエリリクエストの一貫性レベルを強くすることを検討してください。詳細については、一貫性レベルを参照してください。

アップサート

各upsertリクエスト/レスポンスは64MB以上である必要があります。

適用されるレート制限は、クラスターの種類と使用中のCUの数によって異なります。次の表に、upsert操作のレート制限を示します。

最大Upsertレート制限

専用クラスタ1-2 CU

8メガバイト/秒

専用クラスタ4-8 CU

12メガバイト/秒

専用クラスタ12-20 CU

16メガバイト/秒

専用クラスタ[24 CU、64 CU]

24メガバイト/秒

専用クラスタ[64 CUs,128 CUs)

36メガバイト/秒

専用クラスタ[128 CUs,256 CUs)

48メガバイト/秒

256 CU以上の専用クラスタ

64メガバイト/秒

データを更新する際には、スキーマで定義されたすべてのフィールドを含めてください。

挿入されたエンティティを検索やクエリですぐに取得できるようにするには、検索またはクエリ要求の一貫性レベルを強くすることを検討してください。詳細については、一貫性レベルを参照してください。

インデックス

インデックスの種類はフィールドの種類によって異なります。次の表に、インデックス可能なフィールドの種類と対応するインデックスの種類を示します。

フィールドタイプ

インデックスタイプ

メートルタイプ

ベクトル場

AUTOINDEX

L 2、IP、およびCOSINE

VarCharフィールド

TRIE

N/A

Int 8/16/32/64

STLソート

N/A

フロート32/64

STLソート

N/A

フラッシュ

フラッシュ要求のレート制限は、特定のクラスタータイプのコレクションレベルで課せられる1秒あたり0.1要求です。このレート制限は、以下に適用されます。

  • Milvus 2.4. x以降に対応したサーバーレスクラスター。

  • Milvus 2.4. x以降に対応したベータ版にアップグレードされた専用クラスタ。

📘ノート

手動でフラッシュ操作を実行することはお勧めできません。Zilliz Cloudクラスターが優雅に処理します。

ロードする

ロード要求のレート制限は、クラスターあたり5req/sです。

📘ノート

新しいデータがこれらのコレクションに入ってくる場合でも、すでにロードされているコレクションのロードコレクションを実行する必要はありません。

各検索リクエスト/レスポンスは64MB以上である必要があります。

各検索要求に含まれるクエリベクトルの数(通常はnqと呼ばれます)は、サブスクリプションプランによって異なります。

  • FreeおよびServerlessクラスタの場合、nqは大なり10ではありません。

  • Dedicatedクラスタの場合、nqは16,384ではな

各検索応答に含まれる番号(通常はtopKと呼ばれます)は、サブスクリプションプランによって異なります。

  • FreeクラスタとServerlessクラスタの場合、topK1,024個のエンティティとは異なります。

  • Dedicatedクラスタの場合、topKは16,384個のエンティティを返しません。

クエリ

各クエリリクエスト/レスポンスは64MB以上である必要があります。

各クエリ応答には、通常topKとして知られる16,384個を超えるエンティティは含まれません。

削除する

各削除要求/応答は、大なり64MBであってはならない。

削除要求のレート制限は、クラスターあたり0.5MB/sです。

ドロップとす

ドロップ要求のレート制限は、クラスターあたり5req/sです。

データのインポート

1つのコレクションには、実行中または保留中のインポートジョブを最大10件まで含めることができます。

Zilliz Cloudは、Webコンソールにインポートするファイルに制限を課しています。

ファイルタイプ

ローカルアップロード

S 3/GCS/その他のOSSからの同期

JSON

1 GB

1 GB

Numpy

サポートしない

フォルダの最大体格は100 GBで、各サブディレクトリの最大体格は15 GBです。

パーケット

サポートしない

10ギガバイト

詳細については、ストレージオプション書式オプションを参照してください。

コンソールでのバックアップ

手動で作成したバックアップは永久に保持されます。

自動的に作成されたバックアップの最大保存期間は30日間です。

コンソールでの復元

スナップショットの元のクラスタと同じリージョンのスナップショットを復元することができます。復元の対象クラスタは、元のクラスタと同じCUタイプを使用する必要があります。

IPアクセスリスト

アイテム

マックス数

備考

IPアドレス(CIDR)

20

許可リストには最大20個のIPアドレスを追加できます。

パイプライン
About to Deprecate

パイプラインの数

次の表に、プロジェクトで作成できるさまざまな種類のパイプラインの制限を示します。

パイプラインタイプ

プロジェクトごとの最大数

摂取パイプライン

100

削除パイプライン

100

検索パイプライン

100

摂取する

次の表は、各埋め込みモデルでサポートされるカスタマイズされたチャンク体格の制限を示しています。

埋め込みモデル

チャンクサイズの範囲(トークン)

zilliz/bge-based-en-v 1.5-ダウンロード

20-500

zilliz/bge-base-zh-v 1.5-ダウンロード

20-500

タイトル: voyageai/voyage-2

20-3,000

voyageai/航海コード-2

20-12,000

voyageai/ヴォヤージュラージ2

20-12,000

OPENAI/text-embedding-3-small

250-8,191

OPENAI/text-embedding-3-large

250-8,191

次の表に、取り込みパイプラインでPRESERVE関数によって生成されるメタデータフィールドの制限を示します。

マックス数

メタデータフィールドの数

50

VARCHARフィールドのmax_length

4,000

次の表は、毎回摂取できるチャンクの数の制限を示しています。

埋め込みモデル

マックス。チャンク/摂取

zilliz/bge-based-en-v 1.5-ダウンロード

3,500

タイトル: voyageai/voyage-2

6,000

voyageai/航海コード-2

6,000

OPENAI/text-embedding-3-small

6,000

OPENAI/text-embedding-large

6,000

zilliz/bge-base-zh-v 1.5-ダウンロード

3,500

パイプラインの使用

マックス。使用法

それぞれの組織

20ドル/月

トークンの使用

次の表に、トークンの使用制限を示します。

パイプラインタイプ

埋め込みモデル

最大トークン使用量

摂取パイプライン

Openai/text-embedding-3-small&Openai/text-embedding-3-large

80,000,000

その他

100,000,000

検索パイプライン

Openai/text-embedding-3-small&Openai/text-embedding-3-large

30,000,000

その他

20,000,000

組織内のすべてのパイプライン

Openai/text-embedding-3-small&Openai/text-embedding-3-large

150,000,000

その他

200,000,000

📘ノート

組織内のすべてのパイプラインの最大トークン使用量については、削除されたパイプラインのトークン使用量も全体のカウントに含まれます。