メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

コレクションを即座に作成

名前とベクトルフィールドの次元を設定することで、コレクションを即座に作成できます。Zilliz Cloudはベクトルフィールドを自動的にインデックス化し、作成時にコレクションを読み込みます。このページでは、デフォルト設定でコレクションを即座に作成する方法を説明します。

概要について

コレクションは、固定列とバリアント行を持つ2次元テーブルです。各列はフィールドを表し、各行はエンティティを表します。このような構造データ管理を実装するにはスキーマが必要です。挿入するすべてのエンティティは、スキーマで定義された制約を満たす必要があります。

AIGCアプリケーションは通常、ユーザーと大規模言語モデル(LLM)の相互作用中に生成されたデータを管理するための知識ベースとしてベクトルデータベースを使用します。このような知識ベースはほぼ同様です。このようなシナリオでZilliz Cloudクラスターの使用を加速するために、コレクション名とベクトルフィールド次元の2つのパラメータだけでコレクションを作成するためのインスタントメソッドが利用可能です。

デフォルト設定でコレクションを即座に作成する場合、次の設定が適用されます。

  • プライマリフィールドとベクターフィールドがスキーマ(idvector)に追加されます。

  • プライマリフィールドは整数を受け入れ、AutoIdを無効にします。

  • ベクトル場は浮動ベクトルの埋め込みを受け入れます。

  • AUTOINDEXはベクトル場のインデックスを作成するために使用されます。

  • COSINEはベクトル埋め込みの類似性を測定するために使用されます。

  • スキーマ定義されていない項目とその値をキーと値のペアで保存するには、$metaという名前の予約動的項目が有効になります。

  • コレクションは作成時に自動的に読み込まれます。

上記の用語の詳細については、コレクションの説明を参照してください。

デフォルト設定で即座にコレクションを作成することは、すべてのシナリオに適合するわけではないことに注意する価値があります。一般的なコレクション作成手順に慣れておくことをお勧めします。これにより、Zilliz Cloudの機能をより良く理解することができます。

クイックセットアップ

このようにして、コレクション名とベクトル場の次元だけでコレクションを即座に作成できます。

from pymilvus import MilvusClient, DataType

CLUSTER_ENDPOINT = "YOUR_CLUSTER_ENDPOINT"
TOKEN = "YOUR_CLUSTER_TOKEN"

# 1. Set up a Milvus client
client = MilvusClient(
uri=CLUSTER_ENDPOINT,
token=TOKEN
)

# 2. Create a collection in quick setup mode
client.create_collection(
collection_name="quick_setup",
dimension=5
)

res = client.get_load_state(
collection_name="quick_setup"
)

print(res)

# Output
#
# {
# "state": "<LoadState: Loaded>"
# }

カスタムフィールドを使用したクイックセットアップ

デフォルトのメトリックタイプ、フィールド名、およびデータ型が必要に応じていない場合は、次のようにこれらの設定を調整できます。

from pymilvus import MilvusClient, DataType

CLUSTER_ENDPOINT = "YOUR_CLUSTER_ENDPOINT"
TOKEN = "YOUR_CLUSTER_TOKEN"

# 1. Set up a Milvus client
client = MilvusClient(
uri=CLUSTER_ENDPOINT,
token=TOKEN
)

# 2. Create a collection in quick setup mode
client.create_collection(
collection_name="custom_quick_setup",
dimension=5,
primary_field_name="my_id",
id_type="string",
vector_field_name="my_vector",
metric_type="L2",
auto_id=True,
max_length=512
)

res = client.get_load_state(
collection_name="custom_quick_setup"
)

print(res)

# Output
#
# {
# "state": "<LoadState: Loaded>"
# }

上記の2つの方法で作成したコレクションでもニーズを満たせない場合は、Create Collectionの手順に従ってください。