クラスタPublic Preview
クラスタは、ベクトルデータベースのワークロードを実行するコンピューティングリソースのセットです。Zilliz Cloud では2つのタイプを提供しています。serving cluster は、常時稼働かつ低レイテンシーアクセスが必要な本番ワークロード向けに継続的に実行され、on-demand cluster はリクエストが到着したときにのみ起動し、アイドル時にはゼロにスケールします。
このトピックでは、on-demand クラスタの作成方法について説明します。
この機能は Enterprise プロジェクトでのみ利用可能です。
現在、on-demand クラスタは AWS us-west-2 でのみ作成できます。その他のリージョンについては、お問い合わせください。
制限
-
on-demand クラスタを管理するには、プロジェクト管理者である必要があります。
-
各プロジェクトで作成できる on-demand クラスタは最大20個までです。
-
on-demand クラスタは、8 CU あたり最大3 TB の生データをクエリできます。この制限を超えるクエリはエラーを返します。
on-demand クラスタの作成
-
RESTful API経由
export BASE_URL="https://api.cloud.zilliz.com"export TOKEN="YOUR_API_KEY"curl --request POST \--url "${BASE_URL}/v2/clusters/createOnDemandCluster" \--header "Authorization: Bearer ${TOKEN}" \--header "Accept: application/json" \--header "Content-Type: application/json" \--data-raw '{"projectId": "proj-09ee1f4b1151d5dd1edbc5","regionId": "aws-us-west-2","clusterName": "my-on-demand","cuSize": 8,"autoSuspend": 120}'# {# "code": 0,# "data": {# "clusterId": "in07-7d6ac8697204a6a",# "regionId": "aws-us-west-2",# "projectId": "proj-09ee1f4b1151d5dd1edbc5"# }# }The following table describes the parameters.
パラメーター
説明
projectIdオンデマンドクラスターが作成されるプロジェクトのID。
regionIdクラスターがデプロイされるリージョン。プロジェクトのリージョンと一致する必要があります。
cuSize割り当てるクエリーCUの数。クラスターはワークロードに基づいてゼロからこの値の間で自動的にスケールします — リクエストが到着すると指定されたCUサイズまでスピンアップし、アイドル時にはゼロまでスケールダウンします。
最小は8 CU、最大は256 CUで、サイズは8ずつ増加します(例:8、16、24)。8 CUを超えるクラスターには支払い方法が必要です。
これを8に設定すると、最大3 TBのデータを検索できます。データボリュームを増やすには、CUサイズを増やしてください。
この値は作成後に固定され、変更できません。
clusterName作成するクラスターの名前。
auto一時停止クラスターが自動的に一時停止するまでのアイドルタイムアウト。この期間内にリクエストを受信しない場合、クラスターはコンピュートコストの発生を停止するために一時停止します。
値の型: 整数
単位: 秒
最小値: 60
デフォルト: 60
-
ウェブコンソール経由
次のデモでは、ウェブコンソールでオンデマンドクラスターを作成する方法を示しています。
1On-Demand Compute > Clusters をクリックします。
2+ Cluster をクリックします。
3クラスター設定を構成します。
次の表でパラメーターを説明します。
パラメーター
説明
クラスター名
作成するクラスターの名前。
Query CU
割り当てるクエリーCUの数。クラスターはワークロードに基づいてゼロからこの値の間で自動的にスケールします — リクエストが到着すると指定されたCUサイズまでスピンアップし、アイドル時にはゼロまでスケールダウンします。
最小は8 CU、最大は256 CUで、サイズは8ずつ増加します(例:8、16、24)。8 CUを超えるクラスターには支払い方法が必要です。
この値は作成後に固定され、変更できません。
Auto suspend
クラスターが自動的に一時停止するまでのアイドル時間(秒単位)。デフォルトは1分です。この期間内にリクエストを受信しない場合、クラスターはコンピュートコストの発生を停止するために一時停止します。
4Create をクリックします。
View all on-demand clusters
-
RESTful API経由
次のように、すべてのオンデマンドクラスターを一覧表示できます:
export BASE_URL="https://api.cloud.zilliz.com"export TOKEN="YOUR_API_KEY"curl --request GET \--url "{BASE_URL}/v2/clusters/onDemandClusters?projectId={PROJECT_ID}®ionId=aws-us-west-2" \--header "Authorization: Bearer ${TOKEN}" \--header "Accept: application/json"以下は出力例です。
{"code": 0,"data": {"count": 2,"onDemandClusters": [{"clusterId": "in07-7d6ac8697204a6a","clusterName": "xxx","regionId": "aws-us-west-2","cuSize": 8,"status": "SUSPENDED","endpoint": "https://proj-09ee1f4b1151d5dd1edbc5.aws-us-west-2.vectordb-uat3.zillizcloud.com","privateLink": "","createdBy": "jack.tsai@zilliz.com","createTime": 1745396115000}]}} -
ウェブコンソール経由

Check the details of an on-demand cluster
-
RESTful API経由
オンデマンドクラスターは以下のように記述できます:
export BASE_URL="https://api.cloud.zilliz.com"export TOKEN="YOUR_API_KEY"curl --request GET \--url "${BASE_URL}/v2/clusters/onDemandClusters/in07-7d6ac8697204a6a" \--header "Authorization: Bearer ${TOKEN}" \--header "Accept: application/json"以下は出力例です。
{"code": 0,"data": {"clusterId": "in07-7d6ac8697204a6a","clusterName": "xxx","regionId": "aws-us-west-2","cuSize": 8,"status": "RUNNING","endpoint": "https://proj-09ee1f4b1151d5dd1edbc5.aws-us-west-2.vectordb-uat3.zillizcloud.com","privateLink": "","createdBy": "jack.tsai@zilliz.com","createTime": 1745396115000}} -
ウェブコンソール経由

オンデマンドクラスタの削除
クラスタを削除すると、即座に削除され、復元することはできません。この操作は元に戻せません。
-
RESTful API経由
オンデマンドクラスタは以下のように削除できます。
export BASE_URL="https://api.cloud.zilliz.com"export TOKEN="YOUR_API_KEY"curl --request DELETE \--url "${BASE_URL}/v2/clusters/onDemandClusters/in07-7d6ac8697204a6a" \--header "Authorization: Bearer ${TOKEN}" \--header "Accept: application/json"以下は出力例です。
{"code": 0,"data": {"clusterId": "in07-7d6ac8697204a6a","status": "DELETING"}} -
ウェブコンソール経由
