Zillizクラウドの制限
このページでは、Zilliz Cloudプラットフォームの制限に関する情報を提供します。Zillizが提供するOPSシステムを使用して、このページに記載されているほとんどの設定を調整できます。さらにヘルプが必要な場合は、引き続きお問い合わせください。
組織とプロジェクト
次の表に、1人のユーザーに許可される組織とプロジェクトの最大数の制限を示します。
アイテム | マックス数 | 備考 |
---|---|---|
アカウント登録が完了すると、Zilliz Cloudは自動的に1つの組織を作成します。それ以上の組織が必要な場合は、サポートチケットを作成してください。ユーザーは複数の組織に参加できます。 | ||
プロジェクト | 100 | 各ユーザーは1つの組織で最大100のプロジェクトを作成できます。 |
コレクション
クラスタ計画 | マックス数 | 備考 |
---|---|---|
最大5つのコレクションを作成できます。 | ||
最大100個のコレクションを作成できます。 | ||
専用クラスタ | CUあたり256、および<=16384 | 専用クラスターで使用されるCUごとに最大256個のコレクションを作成でき、クラスター内には16,384個を超えるコレクションは作成できません。 |
Zilliz Cloudは、コレクションの作成、読み込み、リリース、削除を含むコレクション操作に対してレート制限を課しました。以下のレート制限は、サーバーレスおよび専用クラスターのコレクションに適用されます。
レート制限 | |
---|---|
コレクションオペレーション(作成、ロード、リリース、ドロップ) | クラスタあたり5 req/s |
パーティション
クラスタタイプ | 一つのコレクションあたりの最大数 | 備考 |
---|---|---|
サーバーレスクラスターでは、コレクションごとに最大1,024個のパーティションを作成できます。 | ||
専用クラスタ | 1,024 | 専用クラスターでは、コレクションごとに最大1,024のパーティションを作成できます。 |
作成されたパーティション数と使用可能なパーティション数を計算する場合は、「コレクション」のノートを参照してください。また、パーティション作成のレート制限は、クラスタあたり1パーティション/秒です。
フィールド
アイテム | マックス数 |
---|---|
コレクションごとのフィールド | 64 |
コレクションごとのベクトルフィールド | 4 |
他のフィールドの制限:
-
Null値はどのフィールドタイプでもサポートされていません。
-
VarCharやJSONなどの一部のフィールドは、予想よりも多くのメモリを使用し、クラスターがいっぱいになる可能性があります。
ディメンション
ベクトル場の最大次元数は32,768である。
オペレーション
このセクションでは、Zilliz Cloudクラスターでの一般的なデータ操作のレート制限に焦点を当てています。
挿入する
各挿入要求/応答は大なり64MBでなければなりません。
適用されるレート制限は、クラスターの種類と使用中のCUの数によって異なります。次の表に、挿入操作のレート制限を示します。
最大挿入レート制限 | |
---|---|
専用クラスタ1-2 CU | 8メガバイト/秒 |
専用クラスタ4-8 CU | 12メガバイト/秒 |
専用クラスタ12-20 CU | 16メガバイト/秒 |
専用クラスタ[24 CU、64 CU] | 24メガバイト/秒 |
専用クラスタ[64 CUs,128 CUs) | 36メガバイト/秒 |
専用クラスタ[128 CUs,256 CUs) | 48メガバイト/秒 |
256 CU以上の専用クラスタ | 64メガバイト/秒 |
データを挿入するときは、すべてのスキーマ定義フィールドを含めます。コレクションでAutoIDが有効になっている場合は、主キーを除外します。
挿入されたエンティティを検索やクエリですぐに取得できるようにするには、検索またはクエリリクエストの一貫性レベルを強くすることを検討してください。詳細については、一貫性レベルを参照してください。
アップサート
各upsertリクエスト/レスポンスは64MB以上である必要があります。
適用されるレート制限は、クラスターの種類と使用中のCUの数によって異なります。次の表に、upsert操作のレート制限を示します。
最大Upsertレート制限 | |
---|---|
専用クラスタ1-2 CU | 8メガバイト/秒 |
専用クラスタ4-8 CU | 12メガバイト/秒 |
専用クラスタ12-20 CU | 16メガバイト/秒 |
専用クラスタ[24 CU、64 CU] | 24メガバイト/秒 |
専用クラスタ[64 CUs,128 CUs) | 36メガバイト/秒 |
専用クラスタ[128 CUs,256 CUs) | 48メガバイト/秒 |
256 CU以上の専用クラスタ | 64メガバイト/秒 |
データを更新する際には、スキーマで定義されたすべてのフィールドを含めてください。
挿入されたエンティティを検索やクエリですぐに取得できるようにするには、検索またはクエリ要求の一貫性レベルを強くすることを検討してください。詳細については、一貫性レベルを参照してください。
インデックス
インデックスの種類はフィールドの種類によって異なります。次の表に、インデックス可能なフィールドの種類と対応するインデックスの種類を示します。
フィールドタイプ | インデックスタイプ | メートルタイプ |
---|---|---|
ベクトル場 | AUTOINDEX | L 2、IP、およびCOSINE |
VarCharフィールド | TRIE | N/A |
Int 8/16/32/64 | STLソート | N/A |
フロート32/64 | STLソート | N/A |
フラッシュ
フラッシュ要求のレート制限は、特定のクラスタータイプのコレクションレベルで課せられる1秒あたり0.1要求です。このレート制限は、以下に適用されます。
-
Milvus 2.4. x以降に対応したサーバーレスクラスター。
-
Milvus 2.4. x以降に対応したベータ版にアップグレードされた専用クラスタ。
手動でフラッシュ操作を実行することはお勧めできません。Zilliz Cloudクラスターが優雅に処理します。
ロードする
ロード要求のレート制限は、クラスターあたり5req/sです。
新しいデータがこれらのコレクションに入ってくる場合でも、すでにロードされているコレクションのロードコレクションを実行する必要はありません。
検索する
各検索リクエスト/レスポンスは64MB以上である必要があります。
各検索要求に含まれるクエリベクトルの数(通常はnqと呼ばれます)は、サブスクリプションプランによって異なります。
-
FreeおよびServerlessクラスタの場合、nqは大なり10ではありません。
-
Dedicatedクラスタの場合、nqは16,384ではない。
各検索応答に含まれる番号(通常はtopKと呼ばれます)は、サブスクリプションプランによって異なります。
-
FreeクラスタとServerlessクラスタの場合、topKは1,024個のエンティティとは異なります。
-
Dedicatedクラスタの場合、topKは16,384個のエンティティを返しません。
クエリ
各クエリリクエスト/レスポンスは64MB以上である必要があります。
各クエリ応答には、通常topKとして知られる16,384個を超えるエンティティは含まれません。
削除する
各削除要求/応答は、大なり64MBであってはならない。
削除要求のレート制限は、クラスターあたり0.5MB/sです。
ドロップとす
ドロップ要求のレート制限は、クラスターあたり5req/sです。
データのインポート
1つのコレクションには、実行中または保留中のインポートジョブを最大10件まで含めることができます。
Zilliz Cloudは、Webコンソールにインポートするファイルに制限を課しています。
ファイルタイプ | ローカルアップロード | S 3/GCS/その他のOSSからの同期 |
---|---|---|
JSON | 1 GB | 1 GB |
Numpy | サポートしない | フォルダの最大体格は100 GBで、各サブディレクトリの最大体格は15 GBです。 |
パーケット | サポートしない | 10ギガバイト |
詳細については、ストレージオプションと書式オプションを参照してください。
コンソールでのバックアップ
手動で作成したバックアップは永久に保持されます。
自動的に作成されたバックアップの最大保存期間は30日間です。
コンソールでの復元
スナップショットの元のクラスタと同じリージョンのスナップショットを復元することができます。復元の対象クラスタは、元のクラスタと同じCUタイプを使用する必要があります。
IPアクセスリスト
アイテム | マックス数 | 備考 |
---|---|---|
IPアドレス(CIDR) | 20 | 許可リストには最大20個のIPアドレスを追加できます。 |
パイプラインAbout to Deprecate
パイプラインの数
次の表に、プロジェクトで作成できるさまざまな種類のパイプラインの制限を示します。
パイプラインタイプ | プロジェクトごとの最大数 |
---|---|
摂取パイプライン | 100 |
削除パイプライン | 100 |
検索パイプライン | 100 |
摂取する
次の表は、各埋め込みモデルでサポートされるカスタマイズされたチャンク体格の制限を示しています。
埋め込みモデル | チャンクサイズの範囲(トークン) |
---|---|
zilliz/bge-based-en-v 1.5-ダウンロード | 20-500 |
zilliz/bge-base-zh-v 1.5-ダウンロード | 20-500 |
タイトル: voyageai/voyage-2 | 20-3,000 |
voyageai/航海コード-2 | 20-12,000 |
voyageai/ヴォヤージュラージ2 | 20-12,000 |
OPENAI/text-embedding-3-small | 250-8,191 |
OPENAI/text-embedding-3-large | 250-8,191 |
次の表に、取り込みパイプラインでPRESERVE関数によって生成されるメタデータフィールドの制限を示します。
マックス数 | |
---|---|
メタデータフィールドの数 | 50 |
VARCHARフィールドのmax_length | 4,000 |
次の表は、毎回摂取できるチャンクの数の制限を示しています。
埋め込みモデル | マックス。チャンク/摂取 |
---|---|
zilliz/bge-based-en-v 1.5-ダウンロード | 3,500 |
タイトル: voyageai/voyage-2 | 6,000 |
voyageai/航海コード-2 | 6,000 |
OPENAI/text-embedding-3-small | 6,000 |
OPENAI/text-embedding-large | 6,000 |
zilliz/bge-base-zh-v 1.5-ダウンロード | 3,500 |
パイプラインの使用
マックス。使用法 | |
---|---|
それぞれの組織 | 20ドル/月 |
トークンの使用
次の表に、トークンの使用制限を示します。
パイプラインタイプ | 埋め込みモデル | 最大トークン使用量 |
---|---|---|
摂取パイプライン | Openai/text-embedding-3-small&Openai/text-embedding-3-large | 80,000,000 |
その他 | 100,000,000 | |
検索パイプライン | Openai/text-embedding-3-small&Openai/text-embedding-3-large | 30,000,000 |
その他 | 20,000,000 | |
組織内のすべてのパイプライン | Openai/text-embedding-3-small&Openai/text-embedding-3-large | 150,000,000 |
その他 | 200,000,000 |
組織内のすべてのパイプラインの最大トークン使用量については、削除されたパイプラインのトークン使用量も全体のカウントに含まれます。