メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

クラスタ
Public Preview

クラスタは、ベクトルデータベースのワークロードを実行するコンピューティングリソースのセットです。Zilliz Cloud では2つのタイプを提供しています。serving cluster は、常時稼働かつ低レイテンシーアクセスが必要な本番ワークロード向けに継続的に実行され、on-demand cluster はリクエストが到着したときにのみ起動し、アイドル時にはゼロにスケールします。

このトピックでは、on-demand クラスタの作成方法について説明します。

📘Note

この機能は Enterprise プロジェクトでのみ利用可能です。

現在、on-demand クラスタは AWS us-west-2 でのみ作成できます。その他のリージョンについては、お問い合わせください。

制限

  • on-demand クラスタを管理するには、プロジェクト管理者である必要があります。

  • 各プロジェクトで作成できる on-demand クラスタは最大20個までです。

  • on-demand クラスタは、8 CU あたり最大3 TB の生データをクエリできます。この制限を超えるクエリはエラーを返します。

on-demand クラスタの作成

  • RESTful API経由

    export BASE_URL="https://api.cloud.zilliz.com"
    export TOKEN="YOUR_API_KEY"

    curl --request POST \
    --url "${BASE_URL}/v2/clusters/createOnDemandCluster" \
    --header "Authorization: Bearer ${TOKEN}" \
    --header "Accept: application/json" \
    --header "Content-Type: application/json" \
    --data-raw '{
    "projectId": "proj-09ee1f4b1151d5dd1edbc5",
    "regionId": "aws-us-west-2",
    "clusterName": "my-on-demand",
    "cuSize": 8,
    "autoSuspend": 120
    }'

    # {
    # "code": 0,
    # "data": {
    # "clusterId": "in07-7d6ac8697204a6a",
    # "regionId": "aws-us-west-2",
    # "projectId": "proj-09ee1f4b1151d5dd1edbc5"
    # }
    # }

    The following table describes the parameters.

    パラメーター

    説明

    projectId

    オンデマンドクラスターが作成されるプロジェクトのID。

    regionId

    クラスターがデプロイされるリージョン。プロジェクトのリージョンと一致する必要があります。

    cuSize

    割り当てるクエリーCUの数。クラスターはワークロードに基づいてゼロからこの値の間で自動的にスケールします — リクエストが到着すると指定されたCUサイズまでスピンアップし、アイドル時にはゼロまでスケールダウンします。

    最小は8 CU、最大は256 CUで、サイズは8ずつ増加します(例:8、16、24)。8 CUを超えるクラスターには支払い方法が必要です。

    これを8に設定すると、最大3 TBのデータを検索できます。データボリュームを増やすには、CUサイズを増やしてください。

    この値は作成後に固定され、変更できません。

    clusterName

    作成するクラスターの名前。

    auto一時停止

    クラスターが自動的に一時停止するまでのアイドルタイムアウト。この期間内にリクエストを受信しない場合、クラスターはコンピュートコストの発生を停止するために一時停止します。

    • 値の型: 整数

    • 単位: 秒

    • 最小値: 60

    • デフォルト: 60

  • ウェブコンソール経由

    次のデモでは、ウェブコンソールでオンデマンドクラスターを作成する方法を示しています。

    1

    On-Demand Compute > Clusters をクリックします。

    2

    + Cluster をクリックします。

    3

    クラスター設定を構成します。

    次の表でパラメーターを説明します。

    パラメーター

    説明

    クラスター名

    作成するクラスターの名前。

    Query CU

    割り当てるクエリーCUの数。クラスターはワークロードに基づいてゼロからこの値の間で自動的にスケールします — リクエストが到着すると指定されたCUサイズまでスピンアップし、アイドル時にはゼロまでスケールダウンします。

    最小は8 CU、最大は256 CUで、サイズは8ずつ増加します(例:8、16、24)。8 CUを超えるクラスターには支払い方法が必要です。

    この値は作成後に固定され、変更できません。

    Auto suspend

    クラスターが自動的に一時停止するまでのアイドル時間(秒単位)。デフォルトは1分です。この期間内にリクエストを受信しない場合、クラスターはコンピュートコストの発生を停止するために一時停止します。

    4

    Create をクリックします。

View all on-demand clusters

  • RESTful API経由

    次のように、すべてのオンデマンドクラスターを一覧表示できます:

    export BASE_URL="https://api.cloud.zilliz.com"
    export TOKEN="YOUR_API_KEY"

    curl --request GET \
    --url "{BASE_URL}/v2/clusters/onDemandClusters?projectId={PROJECT_ID}&regionId=aws-us-west-2" \
    --header "Authorization: Bearer ${TOKEN}" \
    --header "Accept: application/json"

    以下は出力例です。

    {
    "code": 0,
    "data": {
    "count": 2,
    "onDemandClusters": [
    {
    "clusterId": "in07-7d6ac8697204a6a",
    "clusterName": "xxx",
    "regionId": "aws-us-west-2",
    "cuSize": 8,
    "status": "SUSPENDED",
    "endpoint": "https://proj-09ee1f4b1151d5dd1edbc5.aws-us-west-2.vectordb-uat3.zillizcloud.com",
    "privateLink": "",
    "createdBy": "jack.tsai@zilliz.com",
    "createTime": 1745396115000
    }
    ]
    }
    }
  • ウェブコンソール経由

    WPOBwHulYhQPRIbgpjJcrAfXnVc

Check the details of an on-demand cluster

  • RESTful API経由

    オンデマンドクラスターは以下のように記述できます:

    export BASE_URL="https://api.cloud.zilliz.com"
    export TOKEN="YOUR_API_KEY"

    curl --request GET \
    --url "${BASE_URL}/v2/clusters/onDemandClusters/in07-7d6ac8697204a6a" \
    --header "Authorization: Bearer ${TOKEN}" \
    --header "Accept: application/json"

    以下は出力例です。

    {
    "code": 0,
    "data": {
    "clusterId": "in07-7d6ac8697204a6a",
    "clusterName": "xxx",
    "regionId": "aws-us-west-2",
    "cuSize": 8,
    "status": "RUNNING",
    "endpoint": "https://proj-09ee1f4b1151d5dd1edbc5.aws-us-west-2.vectordb-uat3.zillizcloud.com",
    "privateLink": "",
    "createdBy": "jack.tsai@zilliz.com",
    "createTime": 1745396115000
    }
    }
  • ウェブコンソール経由

    NDpWwXSknh7FMibTGjNcwg8Vnjf

オンデマンドクラスタの削除

🚧Warning

クラスタを削除すると、即座に削除され、復元することはできません。この操作は元に戻せません。

  • RESTful API経由

    オンデマンドクラスタは以下のように削除できます。

    export BASE_URL="https://api.cloud.zilliz.com"
    export TOKEN="YOUR_API_KEY"

    curl --request DELETE \
    --url "${BASE_URL}/v2/clusters/onDemandClusters/in07-7d6ac8697204a6a" \
    --header "Authorization: Bearer ${TOKEN}" \
    --header "Accept: application/json"

    以下は出力例です。

    {
    "code": 0,
    "data": {
    "clusterId": "in07-7d6ac8697204a6a",
    "status": "DELETING"
    }
    }
  • ウェブコンソール経由

    Vu38wTpLDhmRqYbmYFVcbjK5nVx