Pinecone から Zilliz Cloud への移行
このトピックでは、Pinecone から移行する際に、Zilliz Cloud がデータ型のマッピング、フィールドの変換、ネームスペースの処理、およびコレクションの命名規則をどのように扱うかについて説明します。
前提条件
Pinecone から Zilliz Cloud への移行を開始する前に、以下の要件を満たしていることを確認してください。
Pinecone の要件
要件 | 詳細 |
|---|---|
インデックスタイプ | Pinecone Serverless インデックスからのみ移行をサポート |
API アクセス | アクセス権限を持つ Pinecone API キー |
データの可用性 | Pinecone のソースインデックスにはデータが含まれている必要があります。空のインデックスは移行できません。 |
ベクトル次元 | 次元は > 1 である必要があります。単一次元のベクトルは移行失敗の原因となります |
Zilliz Cloud の要件
要件 | 詳細 |
|---|---|
ユーザーロール | 組織オーナー または プロジェクト管理者 |
クラスター容量 | 十分なストレージおよび計算リソース(CU サイズの見積もりには CU 計算機 を使用してください) |
ネットワーク アクセス | ネットワーク制限を使用している場合は、Zilliz Cloud IPs を許可リストに追加してください |
データ型のマッピング
Pinecone のデータ型が Zilliz Cloud にどのようにマッピングされるかを理解することは、移行計画において重要です。
Pinecone フィールド型 | Zilliz Cloud フィールド型 | 注記 |
|---|---|---|
主キー | VARCHAR (主キー) | 自動的にマッピングされます。自動ID を有効にすると新しい ID が生成されます(元の値は破棄されます)。 |
密ベクトル | FLOAT_VECTOR | 次元はそのまま保持され、変更は不要です |
疎ベクトル | SPARSE_FLOAT_VECTOR | サンプルデータで空でない場合にのみマッピングされます。 |
メタデータ | 動的フィールド | デフォルトでは動的スキーマとしてマッピングされます。固定フィールドに変換することも可能です。 詳細については、動的フィールド を参照してください。 |
ネームスペース | パーティションキー / パーティション | パフォーマンス最適化のために推奨されます。 詳細については、ネームスペースの処理 を参照してください。 |
メタデータフィールドの変換
Zilliz Cloud はメタデータスキーマを検出するために 100 行をサンプリングします。必要に応じて手動で追加のフィールドを追加できます。
Pinecone のメタデータは、最大限の柔軟性のために当初 Zilliz Cloud の動的スキーマにマッピングされます。以下の利点を得るために、オプションでメタデータフィールドを固定フィールドに変換できます。
- より強力な検証のためのデータ型の強制
- より良いクエリパフォーマンスのためのインデックス最適化
- 一貫したデータ管理のための構造化されたスキーマ
メタデータを固定フィールドに変換する場合:
Pinecone メタデータ型 | Zilliz 固定フィールド型 | 注記 |
|---|---|---|
文字列 | VARCHAR | 最大 65,535 バイトまでサポート |
数値 (int/float) | DOUBLE | すべての数値型は DOUBLE になります |
ブール値 | BOOL | 直接マッピング |
文字列のリスト | ARRAY<VARCHAR> | ネストされた配列をサポート |
固定フィールドに変換されたメタデータフィールドに対しては、追加の属性を設定できます。
-
NULL 許容: フィールドが null 値を受け入れられるかどうかを決定します。この機能はデフォルトで有効です。詳細については、NULL 許容属性 を参照してください。
-
デフォルト値: データが欠落している場合のフォールバック値を設定します。詳細については、デフォルト値 を参照してください。
Pinecone 固有の処理規則
ネームスペースの処理
Pinecone のネームスペースは、以下の 2 つの戦略を使用して移行できます。
戦略 | 実装 | パフォーマンスへの影響 | ユースケース |
|---|---|---|---|
ネームスペースをパーティションキーとして使用 (推奨) | ネームスペースはパーティションキーフィールドの値になります | 検索パフォーマンスの自動最適化 | 複数のネームスペースを持つほとんどのシナリオ |
ネームスペースをパーティションとして使用 | 各ネームスペースが個別のパーティションになります | 手動でのパーティション管理が必要 | 少数で安定したネームスペースを持つ単純なシナリオ |
Pinecone の default ネームスペースの処理:
パーティションとして: Zilliz Cloud 内の
_defaultパーティションになりますパーティションキーとして: 空文字列
""の値になります
パーティションおよびパーティションキーの概念の詳細については、パーティションの管理 および パーティションキーの使用 を参照してください。
コレクションの命名規則
Pinecone のインデックス名は、Zilliz Cloud との互換性のために自動的に処理されます。
Pinecone インデックス名 | Zilliz Cloud コレクション名 | 適用された規則 |
|---|---|---|
|
| ハイフン ( |
|
| 変更不要 |
名前の競合: ターゲットデータベースに同じ名前のコレクションが既に存在する場合は、以下のいずれかを行う必要があります。
- 既存のコレクションを削除する
- 別のターゲットデータベースを選択する
- 移行設定中にターゲットコレクションの名前を変更する